首页
关于
论坛
投稿
搜索
统计之都
2022-05-20
4 / 50
R语言
data.table 与 pandas
谢士晨
/
2021-01-19
数据分析项目通常可以分解为以下过程,数据加载-数据清洗-(特征处理、可视化、模型训练)-成果汇报1。其中,数据清洗与特征处理或者称为数据预处理过程,一般会占据整个项目的大部分时间。熟练掌握相关工具,提高数据处理的效率,是开展数据分析工作的基础。 在开展数据科学相关工作时,最常用的开源工具包括 R 与 python。对于可在内存级处理的数据,在 R 中通常使用 data.table 包进行数据处理,……
R语言
用Rmarkdown写毕业论文
张桐川
/
2021-01-16
博士生涯终于走到了最后一步了。这次全程用 R 和 Rmarkdown 相关的包完整写完了论文,现在总结一下个人经验和踩过的坑,希望给后来人提供参考经验,同时安利一下 Rmarkdown 这个提高生产力的工具。 […] 大部分大学的毕业论文对排版都着严格的排版要求,具体需要注意的细节可能有 […] 个人感受而言,传统 Word 虽然易用,但所见即所得式的编辑模式会将作者很……
推荐文章
统计月读(2020 年 9-12 月)
2021-01-01
推荐语:关于 R 语言教学,作者针对学生是编程初学者的情况提出了 Tidy 存在的多种问题。 推荐人:Song Li 链接:https://github.com/matloff/TidyverseSkeptic 在原作授权的情况下,此文由 Song Li 翻译并发布在统计之都主站从另一个视角看 R 语言的方言 Tidyverse […] 推荐语:上次推荐的 stackgbm 包是用来……
R会议
第13届中国R会(杭州)暨移动营销分析与应用论坛会议纪要
2020-12-25
中国R会(The China-R Conference)始于2008 年,由统计之都(Capital of Statistics, COS)发起,并在中国人民大学举办了第一届中国R会。 11月28日至29日,第13届中国R会(杭州)暨移动营销分析与应用论坛在浙江杭州梅苑宾馆成功举办。 […] 本次会议由统计之都、浙江省自然科学基金委员会和浙江工商大学联合主办,浙江工商大学工商管理学院……
R会议
第十三届中国R会议(北京)纪要
2020-12-25
中国 R 会(The China-R Conference)始于2008 年,由统计之都(Capital of Statistics, COS)发起,并在中国人民大学举办了第一届中国 R 会。R 会起始于 R 语言的讨论,后来兼容并包,积极走向更广义的数据科学领域。本次会议内容不仅包括了数据科学、统计理论等专业领域,还覆盖了统计学在各行各业的应用,如医疗、金融等,聚集各领域的学术专家、业界精英、技……
R语言
从另一个视角看R语言的方言Tidyverse
Norm Matloff
/
2020-10-13
从另一个视角看R语言的“方言”Tidyverse,以及 RStudio 对 Tidyverse 的提倡。 […] 作者 Norm Matloff 为 UC Davis 计算机科学教授(曾任 UCD 统计学教授)。中文翻译及投稿至 COS 经过作者同意。文中的“我”为作者视角,但译文中存在的任何不妥之处当然很可能是由译者引入的,还望读者不吝赐教。 […] 在我看……
R语言
一个访问量高达1300万的shiny应用的诞生故事
苏玮
/
2020-09-14
本文主要简要分享一下我从1月底开始的一个用shiny制作的关注日本疫情动态的仪表盘应用项目。 可能有的读者对这篇文章有既视感,是因为在5月份的时候,我将当时访问量仅有 600 万的文章第一个版本投稿到了Y叔叔(生信专业R包开发大牛)的公众账号上(原创:用shiny和echarts4r制作一个COVID-19的dashboard)。而随着日本第二波疫情的扩大,4个月也已经转眼即逝,网站访问量再次翻倍……
推荐文章
统计月读(2020 年 5-8 月)
2020-09-01
推荐语:同行评议是学术论文发表过程中很重要的一环,当前科研用软件的发表通常依附于学术论文但却缺少对软件本身的同行评议过程,rOpenSci 目前公开了他们关于统计软件进行同行评议过程的白皮书,详细讨论了这个过程的细节与评判标准且欢迎大家提意见改进。 推荐人:于淼 链接:https://ropenscilabs.github.io/statistical-software-peer-review/……
统计图形
R语言中的网络可视化
于淼
/
2020-07-15
网络分析适合用来研究多样本或特性间的关系,这类关系通常用互相连接的节点来表示,在可视化中节点一般指代一个样本或特性,连线则代表了样本间或特性间的关系。也就是说,网络的最小单元就是一个两点连线,虽然描述一个网络很直观,但具体到数据结构上就存在一些问题。常规样本数据一般是每一行代表一个样本,每一列代表一个描述样本的维度或特性,样本或特性间的关系并不能展示在原始数据结构里而需要额外计算,所以我们需要将样……
R语言
发邮件这事你可以认真一点优雅一点
楚新元
/
2020-07-06
之前在我的博客里介绍了一个利用R发邮件的方法 (https://cxy.rbind.io/post/mailr/),这次我要推荐一个发邮件的包:blastula,首先,这个包不依赖Java,带来的好处是省去了在你电脑上安装Java这一步,以及避免了后续Java版本更新可能会带来的兼容性问题;其次,推荐这个包最主要的原因是:这个包可以很容易地在邮件正文部分嵌入R Markdown渲染的内容,方便成果……
R 语言
从 R 连接 MySQL
黄湘云
/
2020-06-22
Code should be written to minimize the time it would take for someone else to understand it. — The Art of Readable Code, Boswell, D. / Foucher, T. […] 本文首先介绍如何在 Fedora 29 系统上安装配置 MySQL 数据……
COS访谈
COS 访谈第 38 期:黄建华老师
2020-06-02
简介 黄建华教授现任美国德州A&M大学统计系教授及数据科学研究所副主任,并为Arseven/Mitchell Astronomical Statistics讲席教授。黄教授于1985-1992年在北京大学概率统计系学习并获得概率统计学士及硕士学位,于1997年获加州大学伯克利分校统计学博士学位。他是美国统计协会资深会员(Fellow), 国际数理统计学会资深会员(Fellow), 国际统计……
««
«
2
3
4
5
6
»
»»