统计月读（2022 年 6 月）

推荐语：一个比较好的可视化案例，作图的简洁和配色都挺美观（个人看法），动态效果也不错，最后给出的代码可以做参考。

推荐人：赵昊蛟

链接：http://lenkiefer.com/2022/05/30/2022-05-30-real-hpi-plots/

推荐语：数字地球、数字孪生离不开真实世界遥感影像，网页端的一种方案是高德地形图层+ThreeJS 三维图层，但三维图层是 threejs 的针对地理视图移动方向缩小的这种 lazy_loading 只能自行管理，并且 ThreeJS 官方也说不支持自动化的内存管理，要想实现谷歌地球的效果，对于三维模型的自动化加载丢弃是不可避开的话题，当你也碰到这个问题时，Cesium 或许是一个好的选择，网页端 JS 和游戏端 Unreal 均支持，数字孪生项目进阶推荐。

推荐人：苏锦华

链接：https://cesium.com/

推荐语：这是一个神奇的 Python 库，对于代码编写或许可以作为某种警示的例子来看待。这个库的效果是提供 fontawesome 的 svg 素材 Python 端调用，作者熟练运用了模板工具，暴力枚举代码，把所有图片素材的路径，都写到了 Python 代码中。

推荐人：孔令仁

链接：https://github.com/naveen521kk/manim-fontawesome

推荐语：这是一种全新的Python使用方式，pyscript把执行Python的任务扔给了浏览器，彻底无需环境配置（甚至不需要服务器），目前看来运行效率和包的调用方面还不够好，但也是一个惊人的创新。

推荐人：孔令仁

链接：

官网 https://github.com/pyscript/pyscript
例子 https://pyscript.net/examples/repl.html

推荐语：半参数模型求解包 SemiEstimate，包含两步牛顿迭代法和 implicit profiling 方法，不提供 hessian matrix 支持数值梯度求解，链接为 quick start 例子。

推荐人：苏锦华

链接：https://rpubs.com/JinhuaSu/SemiEstimateQuickStart

推荐语：用 10 个简单的步骤创建一个基于 Quarto 的博客网站，作者非常详细地介绍了整个步骤，Quarto 吸收了很多 R Markdown 生态的优势和经验，值得一试。

推荐语：基于过去 31 年在可重复性生物医学研究工作和 R/S 语言的基础上，Frank E Harrell Jr 在极短的时间内将一篇博客扩充为一本书R Workflow for Reproducible Biomedical Research Using Quarto，既佩服 Frank E Harrell Jr 不断尝试新工具的热情，又佩服 Quarto 这种通用性能力极强的工具。

推荐人：黄湘云

链接： https://hbiostat.org/rflow/

推荐语：该如何去了解一个 R 包有多火呢？实际上 CRAN 会公开每日的下载量，而且也可以通过 cranlogs 包来获取每日的下载量数据。

推荐人：孔令仁

链接：https://r-hub.github.io/cranlogs/

推荐语：160 页幻灯片《A Gentle Guide to the Grammar of Graphics with ggplot2》优雅全面地详细介绍 ggplot2 和 gganimate，值得一看。

推荐人：黄湘云

链接：https://pkg.garrickadenbuie.com/gentle-ggplot2/#1

推荐语：【创(he)造(cheng)世界上的另一个你】本期出道的练习生是SCM，下面有请他和他的孪生(x)兄弟PSM来给大家做个自我介绍【词汇表】 SCM：Synthetic Control Method 合成控制方法 PSM：Propensity Score Matching 倾向评分匹配法【背景】在评估某事件或政策对某地区的效应时，我们常假想如果该地区未受政策干预会怎样？通过将其与事实上受到干预后的实际数据进行对比，二者之差即为该政策实施的效应【自我介绍】 PSM：我尝试找到和该地区在各方面都较为相似但未受政策干预的其他地区，来跟该地区进行对比 CSM: 我对若干地区进行适当的线性组合，以构造一个更为优秀的“合成控制地区”来跟该地区进行对比

推荐人：朱书慧

链接：

Comparative Politics and the Synthetic Control Method Authors: Alberto Abadie,Alexis Diamond,Jens Hainmueller DOI:10.2139/ssrn.1950298
合成控制法 (Synthetic Control Method) 及 Stata实现：https://blog.csdn.net/arlionn/article/details/96473220
一个简短有趣的介绍视频：https://m.youtube.com/watch?v=1PQfeDT8zXM

推荐语：Concentration Inequalities: A Nonasymptotic Theory of Independence——关于集中不等式的经典著作，可以作为工具书查询，也推荐通读一遍

推荐人：梁杰昊

链接：https://www.hse.ru/data/2016/11/24/1113029206/Concentration%20inequalities.pdf

推荐语：Sutton 和 Barto 强化学习的第二版，推荐在学习强化学习的时候读一遍，另外再推荐一门关于强化学习的 coursera 课，是强化学习重镇、以及 Sutton 曾经所在的阿尔伯塔大学（University of Alberta）开设的。

推荐人：王祎帆

链接：

书：链接（可能需要访问权限）
课程：https://www.coursera.org/specializations/reinforcement-learning?

推荐语：Kaggle 作为一个数据科学的平台，最近用户数突破了一千万，作者为了庆祝这一增长，用 R 进行可视化，来展现出了 Kaggle 用户的增长过程，挺有意思的。

推荐人：操懿

链接：https://heads0rtai1s.github.io/2022/06/23/kaggle-10-million/

推荐语：使用 R markdown 做好的 slides 如何在放映时计时？这个作者设计了一种展示在 slides 页面上的倒计时时钟，不仅可以自己调节喜欢的样式，还可以通过点击操作进行复位、增加时间等。

推荐人：任怡萌

链接：https://pkg.garrickadenbuie.com/countdown/#1

推荐语：R-exams (R 考试)，未曾设想的道路，通过 exams 包和 R 构建考试文档，无论是动态练习、线下考试、在线学习/测试都能通过这个包得到成熟的解决方案，就像作者所说的 “A One-for-All Exams Generator”

推荐人：宋文轩

链接：http://www.r-exams.org/（演示文档：http://www.r-exams.org/assets/posts/2020-04-04-whyr2020/slides.pdf）

推荐语：有时候机器学习的目标函数嵌套了多个结构类似的优化问题，若对每个优化问题一一求解，则待优化的参数过多，复杂度过高。如果通过 learn to learn 的思想进行参数化，对有相同结构的所有优化问题求得共同的最优解，则参数量大大减少，效率大大提高。这个 tutorial 是学习摊销优化的极好材料。

推荐人：向悦

链接：https://arxiv.org/abs/2202.00665

推荐语：泊松分布是很重要的离散分布，常用来描述事件发生次数。如果想探究服从泊松分布的因变量和自变量之间的相关关系，可选用泊松回归。而泊松回归在一般的回归教材中介绍不太多。

推荐人：向悦

链接：https://www.r-bloggers.com/2022/06/the-poisson-distribution-from-basic-probability-theory-to-regression-models/

推荐语：学习 ggplot2 容易，不容易的是处理好 bad case，比如出现比较长的标签，链接文章给出了几种解决方案。

推荐人：任焱

链接：https://www.andrewheiss.com/blog/2022/06/23/long-labels-ggplot/

推荐语：arrow 是 Apache Arrow 的 R 语言接口，支持在超出内存的大型数据集上操作。

推荐人：黄湘云

链接：https://arrow-user2022.netlify.app/