首页
关于
论坛
投稿
搜索
R语言
2021-01-20
1 / 4
R语言
data.table 与 pandas
谢士晨
/
2021-01-19
数据分析项目通常可以分解为以下过程,数据加载-数据清洗-(特征处理、可视化、模型训练)-成果汇报1。其中,数据清洗与特征处理或者称为数据预处理过程,一般会占据整个项目的大部分时间。熟练掌握相关工具,提高数据处理的效率,是开展数据分析工作的基础。 在开展数据科学相关工作时,最常用的开源工具包括 R 与 python。对于可在内存级处理的数据,在 R 中通常使用 data.table 包进行数据处理,……
R语言
从另一个视角看R语言的方言Tidyverse
Norm Matloff
/
2020-10-13
从另一个视角看R语言的“方言”Tidyverse,以及 RStudio 对 Tidyverse 的提倡。 […] 作者 Norm Matloff 为 UC Davis 计算机科学教授(曾任 UCD 统计学教授)。中文翻译及投稿至 COS 经过作者同意。文中的“我”为作者视角,但译文中存在的任何不妥之处当然很可能是由译者引入的,还望读者不吝赐教。 […] 在我看……
R语言
一个访问量高达1300万的shiny应用的诞生故事
苏玮
/
2020-09-14
本文主要简要分享一下我从1月底开始的一个用shiny制作的关注日本疫情动态的仪表盘应用项目。 可能有的读者对这篇文章有既视感,是因为在5月份的时候,我将当时访问量仅有 600 万的文章第一个版本投稿到了Y叔叔(生信专业R包开发大牛)的公众账号上(原创:用shiny和echarts4r制作一个COVID-19的dashboard)。而随着日本第二波疫情的扩大,4个月也已经转眼即逝,网站访问量再次翻倍……
统计图形
R语言中的网络可视化
于淼
/
2020-07-15
网络分析适合用来研究多样本或特性间的关系,这类关系通常用互相连接的节点来表示,在可视化中节点一般指代一个样本或特性,连线则代表了样本间或特性间的关系。也就是说,网络的最小单元就是一个两点连线,虽然描述一个网络很直观,但具体到数据结构上就存在一些问题。常规样本数据一般是每一行代表一个样本,每一列代表一个描述样本的维度或特性,样本或特性间的关系并不能展示在原始数据结构里而需要额外计算,所以我们需要将样……
R语言
发邮件这事你可以认真一点优雅一点
楚新元
/
2020-07-06
之前在我的博客里介绍了一个利用R发邮件的方法 (https://cxy.rbind.io/post/mailr/),这次我要推荐一个发邮件的包:blastula,首先,这个包不依赖Java,带来的好处是省去了在你电脑上安装Java这一步,以及避免了后续Java版本更新可能会带来的兼容性问题;其次,推荐这个包最主要的原因是:这个包可以很容易地在邮件正文部分嵌入R Markdown渲染的内容,方便成果……
R语言
大规模地理数据可视化入门:Deck.gl 和 H3
朱俊辉
/
2019-01-05
[…] 如何大规模可视化地理数据一直都是一个业界的难点,随着2015年起 Uber 在这一领域的发力,构建了基于 Deck.gl + H3 (deckgl,h3r) 的大规模数据可视化方案。一方面,极大地满足了日常前端开发者的需求。另一方面,也极大地方便了数据科学家的可视化工作。在大规模空间轨迹分析、交通流量与供需预测等领域这一方案正得到广泛应用,突破了传统方法中数据量(通常不会超……
R语言
R语言实战之模型部署
周震宇
/
2018-12-20
如果此时你对何谓模型部署仍然一无所知的话,不必有任何焦虑的心情,带你入门正是本文的目标所在。请相信我,这篇介绍将会是十分新手友好的,怀着好奇心和耐心读下去,你也会对模型部署建立起清晰的认识。 模型部署是商业统计建模中极其重要的一部分,然而却往往被人忽视。读完本文,你将了解模型部署的基本概念与用途,学会如何在R语言环境中使用网络服务来部署上线一个模型,更多地,你的方法武器库中将会增添几柄利器:……
R语言
用R分析光荣《三国志》系列人物数据
潘新晨
/
2018-11-30
写这篇文章有两个原因,第一个是最近在看吴秀波演的《军师联盟》,这部剧剧情紧凑,演员演技精湛,有很多令人惊艳的细节, 再一次勾起了我对三国的兴趣。从小到大玩过不少三国游戏,看过很多三国的书,电视剧如央视版三国,高希希版新三国也都不在话下,而这些年除了偶尔玩玩《三国志10》并没有再对三国有什么研究, 想通过这个分析再重温下三国里的那些人物和故事。第二个原因是自己有比较长一段时间没怎么写R, 工作上用……
R语言
R代码模拟世界杯1000次,足球小白速成世界杯预言姐
夏丰盛
/
2018-06-24
本文翻译自Mango Solution的博客,作者杨环,就职于Mango Solutions,担任数据科学咨询顾问。本文已获得原作者授权。 […] 几周前的皇家马德里VS利物浦的欧冠总决赛是我差不多十年来唯一严肃认真看完的一场比赛,但我居然会挺胸抬头地预测捧起2018年大力神杯的会是巴西队?如果(真假伪)各界球迷朋友发现本文口感略柴,可能是因为我的足球类自然语言处理能力欠佳。不要紧,……
推荐文章
用R语言的blogdown+hugo+netlify+github建博客
钟浩光
/
2018-01-17
用R语言的blogdown + hugo + netlify + github搭建静态博客系统,用rstudio专注于写作。 […] 系统:本文以Windows操作系统为例来介绍安装和配置方法。其他操作系统是类似的。 […] windows下安装很简单,就不描述了。 对于git,作为非程序猿的我,一直想学但是一直没学,直到打算用blogdown建个blog玩之后,就注册……
统计图形
ggimage:ggplot2中愉快地使用图片
余光创
/
2017-03-29
作者简介:余光创,香港大学公共卫生学院,生物信息学博士生。 博客:https://guangchuangyu.github.io, 公众号:biobabble […] 本文介绍了ggimage包,允许在ggplot2作图时嵌入图片,并支持aes映射,可以把离散型变量映射到不同图片。目前有几个包可以使用图片嵌入做图,但都是针对特定的场景,这里使用ggimage来展示在这些特定领域里的应……
统计图形
十行代码看到空气质量指数
郎大为
/
2017-03-15
我错了, 我承认我是标题党, 怎么可能用十行代码完成全国三百个多个城市AQI的抓取, 清洗与可视化呢 我仔细数了数, 去掉注释, 一共是9行, 凑个整才是10行 耶~ 空气质量指数(Air Quality Index,简称AQI)是定量描述空气质量状况的无量纲指数. 关于空气质量的段子已经层出不穷, 连呆在上海的我都已经开始关注北京的天气了: […] 受朋友委托,大家帮个忙:北京人,……
««
«
1
2
3
4
»
»»