COS访谈第30期:宗福季老师

宗福季,现任香港科技大学工业工程与物流管理系教授,前系主任,及质量实验室主任,国际质量科学院(IAQ)院士,美国统计学会(ASA)会士, 美国工业工程师学会(IIE)会士,美国质量学会(ASQ)会士,国际统计协会(ISI)当选会员,香港工程学会(HKIE)会士。 任职科大后,宗福季教授积极参与有关质量改善和管理的教育及研究工作,也为不同行业提供咨询及培训服务,包括制造、银行、电讯及医疗等行业。宗教授目前是美国质量学会旗舰期刊Journal of Quality Technology (JQT)的主编,工业工程学会期刊IISE Transactions及Technometrics的副编辑。宗教授于国立台湾大学取得机械工程学士学位,其后于美国密歇根大学获工业工程硕士及博士学位。

阅读全文

十行代码预测插旗西雅图

背景故事

我错了,我承认我是标题党,怎么可能用十行代码完成 Dota2 信仰2 比赛数据的抓取, 清洗与预测建模呢。 不过为了发扬继承郎大为“十行代码”系列的优良传统,我决定沿用这个名字,希望能把品牌做大做强,走出亚洲,面向世界。。。

事情的起因是这样的:上周与同为信仰粉的大为接上头之后,被安利了一个叫 RDota2 的 R pacakge。 这个工具包使用 Steam API,可以让 R 直接提取有关 Dota2 的各种数据:除了每一场游戏的具体信息,还可以提取英雄,物品,战队,和联赛的资料。 所以我就萌生了用 RDota2 抓一批比赛数据,然后建模预测比赛胜负的想法。结果还是相当有趣的,且听我慢慢道来。 不过在此之前,我想先为对建模感兴趣但不知道什么是 Dota2 的同学,简单介绍一下这款游戏。


Dota2众型男

阅读全文

COS访谈第28期:陈松蹊老师

陈松蹊,国家特聘专家, 北京大学讲席教授,商务统计与经济计量系联合系主任、北京大学统计科学中心联席主任 国家首批“千人计划”入选者,加盟北大后主要致力于商务统计与经济计量学学科建设及北大统计学研究队伍的建设工作。 他是数理统计学会(Institute of Mathematical Statistics) 资深会员(fellow),美国统计学会会士(fellow),国际统计学会 (International Statistics Institute) 当选会员 (elected member),国际数理统计学会 (IMS) 理事会常务理事( Council member)。他现在是The Annals of Statistics(统计年鉴) 副主编 (自2010年);Journal of Business and Economic Statistics 副主编 (自2013年);曾任Statistics and Its Interface 的联席主编 (2010-2013)

阅读全文

Bandit算法与推荐系统

注:本文首发于《程序员》杂志 0.导语 推荐系统里面有两个经典问题:EE问题和冷启动问题。前者涉及到平衡准确和多样,后者涉及到产品算法运营等一系

阅读全文

谷歌为什么创造了幽灵广告?

说起广告大家肯定都知道,可是什么是幽灵广告?其实幽灵广告的英文是ghost ads,源自Google的一篇论文,Johnson, Garrett A., Randall A. Lewis, and Elmar I. Nubbemeyer. “Ghost Ads: Improving the Economics of Measuring Online Ad Effectiveness.” (2016)。幽灵广告是他们创造出来用来提高衡量在线广告效果的一套系统。由于实施过程中某些广告会化作用户看不到的幽灵,所以称之为“幽灵广告”系统,专门用于线上广告的随机对照实验。

阅读全文

第十届中国R会议(北京)会议通知

2017年,是中国R会议值得纪念的第10个年头,本届R会议将于5月19-21日在美丽的清华大学举办。在这样一个值得纪念的时刻,让我们相聚清华

阅读全文

ggimage:ggplot2中愉快地使用图片

本文介绍了ggimage包,允许在ggplot2作图时嵌入图片,并支持aes映射,可以把离散型变量映射到不同图片。目前有几个包可以使用图片嵌入做图,但都是针对特定的场景,这里使用ggimage来展示在这些特定领域里的应用,ggimage的设计是通用的,并不被特定场景所限定,文末又介绍了用R图标来画出R、用饼图来画气泡图等实例。 作者简介:余光创,香港大学公共卫生学院,生物信息学博士生。

阅读全文

聊聊美国保险业

作者简介:侯澄钧,俄亥俄州立大学运筹学博士, 目前在美国从事财产事故险(Property & Casualty)领域的保险产品开发,涉及数据分析、统计建模和产品算法优化等方面的工作。

只有想不到,没有保不了。这就是我对美国保险行业最深刻的认识。 大到地震,小到球票,加上平时开车,租房,看病,旅游,保险无时不刻的出现在了美国人生活工作的方方面面。 除了没有住所,没有工作,没有任何财产的流浪人员,每个美国人都不可避免得需要与保险打交道。 如果银行是厚重的少林,证券是玄妙的武当,那保险作为弟子遍布江湖的丐帮确实当之无愧。 下面我想从房屋火灾险,医疗责任险,自然灾害险,聊聊美国人是怎么开始玩保险,然后玩出各种花样,甚至玩坏的。 之后我会写写数据科学是如何应用于保险行业的,同时介绍一些常用的预测模型,只对这方面内容感兴趣的朋友可以直接跳过之前的内容。

阅读全文

十行代码看到空气质量指数

故事部分

我错了, 我承认我是标题党, 怎么可能用十行代码完成全国三百个多个城市AQI的抓取, 清洗与可视化呢

我仔细数了数, 去掉注释, 一共是9行, 凑个整才是10行 耶~

空气质量指数(Air Quality Index,简称AQI)是定量描述空气质量状况的无量纲指数.

关于空气质量的段子已经层出不穷, 连呆在上海的我都已经开始关注北京的天气了:

阅读全文

一款新的 R Markdown 幻灯片制作工具:xaringan

今天小编给大家介绍一款新的幻灯片神器:xaringan(中文名:幻灯忍者)。它基于大家都熟悉的 R Markdown 语法,幻灯片中能嵌入 R 代码动态生成输出结果,最后生成的是 HTML5 幻灯片,可以在网页浏览器里打开阅览,我们一起来探个究竟吧。

阅读全文