推荐语:可以称得上划时代的几何学教学技术,通过网页实现交互式高亮,随着阅读流程一同标记文本和对于绘图的内容,把几何原本做成了一本网页上可以动态看的教科书。另外提醒一下,网页配色有黑白两种模式,切换在右上角。

推荐人:孔令仁

链接:https://elements.canberead.com/


推荐语:Bin Yu 老师在ICM 2022上的最新报告 Interpreting Deep Neural Networks towards Trustworthiness,从可信赖的角度解释深度神经网络。

推荐人:梁杰昊

链接:https://www.youtube.com/watch?v=hyanrQZfuxM


推荐语:基于 magick 包和脸部识别算法批量制作个人头像。

推荐人:黄湘云

链接:https://www.garrickadenbuie.com/blog/process-profile-picture-magick/


推荐语:这篇论文将迁移学习(机器学习的一个分支)应用于高维线性回归模型。除了目标模型的样本之外,它还使用了来自其他相关的回归模型的辅助样本,以提高估计和预测的最优收敛率。 显然,如何寻找合适的、能给目标模型提供有用信息的辅助样本是一个需要考虑的问题。如果已知哪些辅助样本是有用的,就相应的提出一个estimator和一个predictor,并建立它们的最优性。如果不知道哪些辅助样本是有用的,可以应用作者提出的一个数据驱动的迁移学习过程(名为Trans-Lasso)来找到它们。作者还将Trans-Lasso方法应用于有关基因表达之间关联的数据集。结果表明,Trans-Lasso通过合并来自多个不同组织的数据作为辅助样本,提高了目标组织中基因表达预测的性能。

推荐人:朱书慧

链接/论文信息:Li, S., Cai, T. T., & Li, H. (2022). Transfer learning for high-dimensional linear regression: Prediction, estimation and minimax optimality. Journal of the Royal Statistical Society Series B, Statistical Methodology, 84(1), 149–173. https://doi.org/10.1111/rssb.12479


推荐语:介绍了如何利用 R Markdown 写学术论文、利用 Zotero 进行文献管理以及利用 Notion 做笔记。其中 Zotero 可以与 R Studio 直接集成,Notion 也可以和 Zotero 集成,从而更加便捷地进行论文写作。

推荐人:王祎帆

链接:https://www.ds-econ.com/write-your-whole-paper-in-r-it-is-better/


推荐语:面对晦涩难懂的学术著作,如何较快地确定这个文章的主题是不是符合自己所需求,通过文本分析关键词和主题挖掘可以较快地粗略地了解其内容。这个案例中对希罗多德的希波战争的著作《Histories》做了一些分析。

推荐人:赵昊蛟

链接:https://boiled-data.github.io/Histories.html


推荐语:在大学中建立一个R社区,特别是在covid-19的影响下,这件事会显得更有意义。文章通过采访的形式介绍了这个R社区,还提供了相关R项目的github链接。

推荐人:操懿

链接:https://www.r-consortium.org/blog/2022/07/19/growing-an-r-community-at-a-state-university


推荐语:R 可以把地形图画得如此精细,甚至还可以绘制出阴影效应。

推荐人:任焱

链接:https://dominicroye.github.io/en/2022/hillshade-effects/


推荐语:这篇文章比较详细的讨论了 R 中的编码问题(即使用了 R 很久也未必清楚),正确使用正则表达式可以提高运行效率,而 useBytes=TRUE 是一个危险的参数设定。

推荐人:任焱

链接:https://blog.r-project.org/2022/07/12/speedups-in-operations-with-regular-expressions/index.html


推荐语:一个小巧的文本分析软件 AntConc ,用于文本聚类、关键词提取、词云绘制等。之前用过一款叫 KH Coder 的软件,与 AntConc 功能相似,同样小巧实用。

推荐人:宋文轩

链接:


推荐语:一步一步、一行一行地介绍 ggplot2 绘图的过程,对新手应该十分友好,是快速入门 ggplot2 绘图的好文章。

推荐人:黄湘云

链接:https://www.miriamheiss.com/posts/graphing-with-ggplot/


推荐语:一个生成模型的 tutorial,主要围绕Bayesian inference和Langevin dynamics等非参方法进行讨论,同时从optimal transport (Wasserstein) 角度出发讨论了这些生成模型的一阶优化方法。

推荐人:聂宇舟

链接:https://akorba.github.io/resources/Baltimore_July2022_ICMLtutorial.pdf


推荐语:近年来机器学习的各大顶会上,图神经网络(GNN)的相关文章数量暴涨;在工业界的搜索、推荐、反欺诈等场景,GNN也取得了不错的效果。相较于学术界所关注的模型结构,工业界更看重模型的可扩展性等,本文对GNN在工业界的具体应用做了系统总结。

推荐人:向悦

链接:https://zhuanlan.zhihu.com/p/423342532

发表/查看评论