推荐语:一本开源的使用R的计量经济学书籍《Introduction to Econometrics with R》。涵盖了基础的计量经济学知识(无偏估计、假设检验、因果推断、时间序列等)。书中还给出了详细R代码与例子。适合经济、金融、社会学等专业的同学使用。作者们还友好地提供了可下载的PDF版本。

推荐人:宋骁

链接:https://www.econometrics-with-r.org


推荐语:数学等价是一种触类旁通的思考方法,基于 Ising 模型的网络分析与潜在变量分析(例如主成分分析、因子分析)看上去是不同的两种统计模型,但这篇文章证明其数学本质上等价,也就是说网络分析中的社群分析其实可以作为因子分析的可视化手段。

推荐人:于淼

链接:https://www.nature.com/articles/srep34175


推荐语:“网络皇帝”巴拉巴西自己写的免费网络科学教材,可以拿来入门网络科学这门二十多年前才出现的综合性学科,而网络性质的统计特性是这门学科可以出现的基础。第一章基本是巴拉巴西的半自传了,列举了其研究网络特性的五次失败案例(看得出来跟CalTech算是老冤家了),其中一篇文章到在 Arxiv 上躺尸了二十多年到现在都没发出去。

推荐人:于淼

链接:https://networksciencebook.com/


推荐语:tabr: 一个用 R 记录乐谱的 R package。

推荐人: 张晔

链接: https://leonawicz.github.io/tabr/index.html


推荐语:谢大在大数做的 RMarkdown 技巧报告,一共15项,每个技巧一个段子。

推荐人:于淼

链接:https://slides.yihui.org/2019-dahshu-rmarkdown


推荐语:R 将在明年20周年之前进入 4.0.0 时代,这篇文章介绍了主要变化,包括更高效的内存管理、统一矩阵与数列类型以及解决亮度问题(特别那个黄色)的新调色板。

推荐人:于淼

链接:https://blog.revolutionanalytics.com/2019/12/preview-of-r-400.html


推荐语:美国科学哲学家汉森提出过观察渗透理论来描述所谓客观现象描述背后的主观性,在数据可视化领域,同样的数据展示会因为不同人的知识背景或引导语而产生不同的关注点,这篇文章讨论了这个知识诅咒现象。

推荐人:于淼

链接:https://medium.com/multiple-views-visualization-research-explained/same-data-multiple-perspectives-curse-of-knowledge-in-visual-data-communication-d827c381f936


推荐语:对于观测数据通过变量调整是很常见的,但同时调整300多个变量就是另一个概念了。如果一个输出需要300多个变量调整,那单一变量随机性的累积对模型影响就太大了,真正的信号很可能被调整过程掩盖了。Gelman 大人点评认为因果分析或正则化过程可能是解决思路,简单调整的结论并不可靠。

推荐人:于淼

链接:https://statmodeling.stat.columbia.edu/2019/12/19/causal-inference-adjusting-for-300-pre-treatment-predictors/


推荐语:很早前统计之都推荐过这个网站关于 Markov Chain 的可视化,其实这个网站也做了其他概念的可视化,例如将特征值与特征向量与斐波那契数列及复数概念的联系等等。

推荐人:于淼

链接:http://setosa.io/ev/


推荐语:今年 FLOWINGDATA 的年度可视化推荐。

推荐人:于淼

链接:https://flowingdata.com/2019/12/19/best-data-visualization-projects-of-2019/


推荐语:数据科学近些年发展迅猛,对应的教学也日新月异,在这篇博文中,Thomas Lumley 教授分享了自己设计数据科学本科高年级课程的教学大纲与心得。

推荐人:于淼

链接:https://notstatschat.rbind.io/2019/12/25/what-is-data-science-practice/


注:统计月报每月月初发表,月底前三天截稿转入编辑阶段,当月投稿不满十篇则合并入下月(或下下月直到够数)发表。

发表/查看评论