首页
关于
论坛
投稿
搜索
统计之都
2022-05-20
7 / 50
统计模型
倒数的诚信与消失的变量
邱怡轩
/
2019-06-25
今天朋友之间分享了一篇发表在《科学》杂志上的论文,《Civic honesty around the globe》,意即全球各地的公民诚信度。这篇论文的作者在全世界的40个国家做了一个大型的社会实验,即在不同的场所放置事先准备好的钱包,钱包中留有“主人”的联系方式,然后通过观察是否有人联系失主来推断公民的诚信程度。 这篇论文之所以受到关注,是因为大家发现文章里中国的公民诚信值位列倒数第一,于是大家……
统计软件
基于 R Markdown 的演示文稿和报告模板使用经验
李家郡
/
2019-06-19
英语演讲课曾说,幻灯片只是辅助工具,而内容才是演讲的核心和本质。报告和幻灯片,其本质都是服务于“展示知识”这个过程,两者有着相通之处。利用 R Markdown 可以特别方便地将一份课程报告转化为课程答辩幻灯片,也可以将幻灯片填充些内容后形成总结报告。这四年来,利用两者的转换关系,我节约了不少时间。 作为排版困难者,我尝试着探索了一些只关注内容的幻灯片和报告的写法。随着四年统计学习,R 虽然已经快……
推荐文章
女士品茶的实验、假设和检验
丁鹏
/
2019-05-30
R. A. Fisher 的名著《实验设计;第八版,1971年》第二部分有十六页,仅仅讲了一个最简单的实验:女士品茶。这个故事非常有名,以至于 Salsburg 的统计学通俗读物就以它命名:《女士品茶:20世纪统计怎样变革了科学》。 […] 先回顾一下这个故事。在英国的 Rothamsted 实验站,Fisher 给一位名叫 Muriel Bristol 的女士倒了一杯茶,……
统计应用
中国传统中的统计思维
李舰
/
2019-05-08
这是拙作《统计之美:人工智能时代的科学思维》的序言,虽然这本书是在讲一些统计相关的小故事,也试图用轻松的语言介绍数据科学领域的一些理论和应用基础,但关于统计学中的科学思维、尤其是中国传统文化中的统计精神,是我动笔前的主要动因。我对各种攻击中国文化没有科学精神的观点一直不满,所以写了这篇序,希望能和更多人探讨。 […] 英国学者李约瑟研究中国科技史时提出了一个问题:“尽管中国古代对人类……
推荐文章
统计月读(2019 年 5 月)
2019-05-01
推荐语:2019年,第十二届中国R会议(北京)将于5月24-26日在中国人民大学举办。2019年,是中国R会议值得纪念的第12个年头,12年象征一个轮回,这一个轮回中,变化的是不断壮大的统计与数据科学领域奋斗者队伍,是日渐凝聚的统计力量,而不变的是中国R会议的初心——服务广大统计与数据科学爱好者,推动中国R会议的不断发展。在这样一个值得纪念的时刻,让我们相约中国人民大学,共赴这场数据科学盛会!本届……
新闻动态
统计月读(2019 年 4 月)
2019-04-01
推荐语:PAC学习理论是统计机器学习中最最重要的基础理论之一,它解答了机器学习机制、可学习性等一系列问题,衍生出了计算学习理论这一机器学习的子领域。这篇文章对PAC理论中的概念进行了较为详细的梳理,并加入了作者自己的理解,挺适合统计机器学习初学者一窥门径。 推荐人:林枫 链……
R会议
第12届中国R会议(北京)通知
统计之都
/
2019-03-25
[…] 2019年,第12届中国R会议(北京)将于5月24-26日在中国人民大学举办。2019年,是中国R会议值得纪念的第12个年头,12年象征一个轮回,这一个轮回中,变化的是不断壮大的统计与数据科学领域奋斗者队伍,是日渐凝聚的统计力量,而不变的是中国R会议的初心——服务广大统计与数据科学爱好者,推动中国R会议的不断发展。在这样一个值得纪念的时刻,让我们相约中国人民大学,共赴这场数据……
新闻动态
统计月读(2019 年 3 月)
2019-03-01
推荐语:传感技术是数据收集的底层支撑,当开放数据不能满足需求时,使用开源硬件搭建传感平台收集展示数据就成了天然需求。开源硬件平台目前比较流行的是全功能的树莓派/Rock64系列与单一功能但开发便利的单片机 arduino,当然还有个介于之间的 intel Galileo 平台(善用搜索建议功能)。那么如何实现开源硬件与数据分析平台的交互呢?这篇文章提供了 arduino 与 R 的交互函数,使得实……
新闻动态
统计月读(2019 年 2 月)
2019-02-01
推荐语: FlowingData 是一个关注数据可视化的博客,这是其2018年的总结及文章推荐,这个博客很多可视化直接用的开放数据,同一数据通过不同可视化方式就会表现出不同主题,形式或技术与内容或数据从来都没有完全分开过,运用之妙,存乎一心,窃以为这是只修炼抽象理论所不易到达的。 推荐人:于淼 链接:https://flowingdata.com/2018/12/31/2018/……
R语言
大规模地理数据可视化入门:Deck.gl 和 H3
朱俊辉
/
2019-01-05
[…] 如何大规模可视化地理数据一直都是一个业界的难点,随着2015年起 Uber 在这一领域的发力,构建了基于 Deck.gl + H3 (deckgl,h3r) 的大规模数据可视化方案。一方面,极大地满足了日常前端开发者的需求。另一方面,也极大地方便了数据科学家的可视化工作。在大规模空间轨迹分析、交通流量与供需预测等领域这一方案正得到广泛应用,突破了传统方法中数据量(通常不会超……
新闻动态
统计月读(2019 年 1 月)
2019-01-01
推荐语:用 markdown 同时进行统计分析、画图、制表、写作学术论文并输出符合期刊格式的手稿已经不新鲜了,但更大胆的想法则是跳过期刊编辑直接生成带有交互的网页版学术论文,审稿也可以公开化用 Github 的代码评审来进行,Radix 包满足了上述要求,有希望成为下一代在线开放式同行评议期刊的前身,其实 Radix 包的先驱 distill 已经上线一年多了,另一个基于 python 绘图的学术……
R语言
R语言实战之模型部署
周震宇
/
2018-12-20
如果此时你对何谓模型部署仍然一无所知的话,不必有任何焦虑的心情,带你入门正是本文的目标所在。请相信我,这篇介绍将会是十分新手友好的,怀着好奇心和耐心读下去,你也会对模型部署建立起清晰的认识。 模型部署是商业统计建模中极其重要的一部分,然而却往往被人忽视。读完本文,你将了解模型部署的基本概念与用途,学会如何在R语言环境中使用网络服务来部署上线一个模型,更多地,你的方法武器库中将会增添几柄利器:……
««
«
5
6
7
8
9
»
»»