中国R语言(广州)会议暨华南地区数据科学会议于2015年5月23-24日在中山大学梁銶琚成功召开,由华南统计科学研究中心、中山大学数学与计算科学学院、统计之都共同筹办。
参会者齐聚一堂,23日上午就R语言在器学习在面向消费者的个人基因组检测中的应用、从机器学习到推荐系统、气象大数据等方面中的应用进行了深入的探讨,下午对htmlwidgets 让 recharts 再起航、Adaptive Annealed Importance Sampling for Bayesian Multimodal Posterior Exploration 、Alpha 量化对冲的实战策略、游戏行业大数据等行业的一体化应用等内容进行了深刻的交流。
24日上午讨论了数据科学在业界的应用、Building better credit models through deployable analytics in R 、用户画像‐大数据时代下的用户洞察、量化投资之个人工作坊、电信行业用户稳定性与用户特征的双向分析,并结束了R 会议部分。下午介绍了大数据风控的“冰与火之歌”、融360比赛的优秀队伍展示以及点评讨论。
会议概况
本次会议报名人数超过1400人,约有 500多名参会者前来参会(期间两天广州均为大暴雨天气)。报名者来自近两百家单位,包括七十多家高校与研究机构和一百二十多家企事业单位。
会议内容
本次会议交流的主题涵盖了R语言在互联网、统计、气象、地理、金融和生物技术等方面应用的最新进展,共包含23场特邀报告。会场现场反响热烈,众多背景各异、行业不同的人以R软件为纽带,共享了一场关于R语言和统计分析的盛会。
会议的流程和主要内容摘录如下
林祯舜博士会议致辞
林祯舜先生是中国人民大学统计学博士,先锋信息科技有限公司CEO。
林博士在欢迎致辞中,提到了孔子的名言“学而不思则罔,思而不学则殆”。“而”与R谐音。从而孔子在两千多年前都告诉了我们“学R不思则罔,思R不学则殆”。在我们一起在思考中学习R吧。
陈钢:机器学习在面向消费者的个人基因组检测中的应用
陈钢先生是WeGene创始人,他这次的演讲主要是分享DTC个人基因组服务的概况,以组源分析、复杂疾病风险和研究等应用为例,跟大家分享以机器学习为代表的数据分析技术在DTC个人基因组领域的应用和所面临的挑战。技术方面设计SVVM、HMM、分布式计算、数据可视化等内容。
黄鑫:从机器学习到推荐系统
黄鑫先生是极光推送的首席科学家,他在这次的演讲中,他列举了一些曾经遇到的实际推荐系统走过的路,分别从学术角度和工程角度分析业务问题,最后会从构架角度来解析从推荐算法到推荐系统的演化。
罗应琏:气象大数据
罗应琏先生是北京维艾思气象信息科技公司的市场部总监,他这次会议主要介绍了中国与全球气象数据构成与实际行业应用案例:1.快速有效的庞大气象数据质检工具-统计与数学的应用;2.天气在全世界80%的经济活动中扮演者决定性的角色-介绍天气数据与淘宝/天猫实际电商案例;3.天气,是消费行为最有效的驱动之一-介绍指数型天气保险的跨界应用-美的空调高温补贴等实际透过气象与行业数据的应用。
陆彤:Data Science powered by deployable R infrastructure
陆彤是Avant公司的主要数据科学家。在他的演讲中提到,长期以来,数据科学家的角色被限制在了静态数据分析、建模和可视化上。这是因为工具的限制,比如R的局限性,这些数据产品很难被用户使用。因此一个数据的核心产品需要通过工程师翻译成其它的语言,比如C++等。
游皓麟:R 语言并行计算实战
游皓麟先生是深圳市数聚能源科技有限公司的数据分析师,他本次演讲从R语言的处理大数据的必要性出发,通过原理的讲解,实例的实战,解释R语言的另外一面。
周扬:htmlwidgets让recharts再起航
周扬先生是JDPOWER的数据分析师,他本次演讲主要围绕R中recharts包的安装、使用以及代码架构,呈现一个全新的recharts。其中展现了各种精彩的数据可视化案例,带来耳目一新的感觉。
刘斌:Adaptive Annealed Importance Sampling for Bayesian Multimodal Posterior Exploration
刘斌先生是南京邮电大学计算机学院副教授。在本次演讲中,他从“我们从哪里来”开始讨论,引人入胜。演讲主要描述了一种在贝叶斯推断的背景下,实现多通道后验分布(multimodal posterior distributions)的适应性识别的算法。
王元奎:Alpha 量化对冲的实战策略
王元奎先生是阿巴马资产管理公司的量化研究员。会议中,他们主讲了Alpha策略、套利策略和期权策略的一些实战经验。
谢佳标:游戏行业大数据的处理与建模技术—基于 R 实现
谢佳标先生是深圳市创梦天地科技有限公司的高级数据分析师,他此次的演讲结合现成源码的解读与演示,令参会者们迅速理解R语言在大数据方面的数据读入、数据处理和建模预测,使得参会者能够更深刻地体会R在数据挖掘流程中的实际应用。
胡湘红:基于极值理论的时间序列异常值检测的改进与实证分析
胡湘红女士是南方科技大学的研究助理,她本次的报告基于极值理论的极大似然比异常值检测算法,研究了平稳时间序列中IO,AO,LS型异常点的检测问题。
何宇兵:GIS+R 加速地理信息的商业应用
何宇兵先生是辰智咨询的GIS商业应用研究中心技术总监,他在此次会议中介绍了GIS+R的结合在地理信息方面的商业应用的前景。GIS+R的结合必将商业企业大数据分析平台的构建带来重要的影响。
齐欣然 刘淑娜 伍丽历:利用 LDA 模型预测电视观众的浏览兴趣
齐欣然女士、刘淑娜女士以及伍丽历女士是中山大学在读本科生,她们在本次会议中基于电视观众观看订阅节目的记录,介绍了利用LDA模型预测电视观众的具体节目爱好的办法。
李舰:数据科学在业界的应用
李舰先生本科毕业于中国人民大学统计学院,研究生就读于北京大学软件与微电子学院,现任堡力山集团副总。他在本次报告中以一个统计学出身的数据科学家的视角阐述了自己对业界数据应用的理解,并结合了一些行业里的项目经验,通过几个具体的案例进行说明。同时也对R语言等开源工具在行业中的应用情况和前景进行了讨论。
Robert Krzyzanowski:Building better credit models through deployable analytics in R
Robert Krzyzanowski 是Avant公司数据工程的领导人。在这次的演讲中,他介绍了如何通过R的来建立更好的信贷模式。其中Robert提到如何使用R进行批量数据清理,非常具有启发性。
刘黎春:用户画像‐大数据时代下的用户洞察
刘黎春先生是腾讯科技有限公司的社交网络运营部数据挖掘组长,他在本次会议中介绍了QQ用户画像的底层数据构成,画像标签体系,数据挖掘解决方案,超大规模计算系统,画像应用场景等内容,从数据建设、算法研究、业务驱动等多个角度描述QQ用户画像是如何一步步建设起来并给业务提供数据服务的。
梁淇俊:量化投资之个人工作坊
梁淇俊先生是暨南大学的在读研究生,他在本次会议中展示了自己这一年半研究工作中形成的个人系统,从数据分析,到策略回测,到策略分析,甚至程序化下单。
林倩莹:电信行业用户稳定性与用户特征的双向分析
林倩莹女士是北京数博思达信息科技有限公司的数据科学家,她在本次报告中分析了电信行业用户稳定性与用户特征的双向分析。也使用一个800万样本的例子,提到如何使用R进行高效编程。
资料下载
第一批已经通过嘉宾授权,允许公开幻灯片的列表。幻灯片见附件。
- 李舰: 数据科学在业界的应用
- 刘斌: Adaptive Annealed Importance Sampling for Bayesian Multimodal Posterior Exploration
- 罗应琏: 气象大数据
- 谢佳标: R 语言并行计算实战
- 游皓麟: R 语言并行计算实战
- 刘黎春: 用户画像‐大数据时代下的用户洞察
第二批已经通过嘉宾授权,允许公开幻灯片的列表。幻灯片还需等待嘉宾回复。
- 陈钢: 机器学习在面向消费者的个人基因组检测中的应用
- 梁淇俊: 量化投资之个人工作坊
- Robert Krzyzanowski: Building better credit models through deployable analytics in R
- 周扬: htmlwidgets让recharts 再起航
- 伍丽历等: 利用 LDA 模型预测电视观众的浏览兴趣
会议组织
本次中国R语言(广州)会议暨华南地区数据科学会议能成功召开,这中间有着很多人的付出和心血。在此,由衷感谢华南统计科学研究中心及来自业界众多朋友的大力支持,同时感谢来自中山大学和统计之都的年轻志愿者们。没有你们的兢兢业业,任劳任怨,会议是难以成功组织起来的。
组织委员会:
王学钦 中山大学数学与计算科学学院教授、华南统计科学研究中心执行主任
林祯舜 江苏先锋信息科技公司 CEO
李 舰 堡力山集团副总
邓一硕 统计之都、COS 沙龙联合发起人
魏太云 统计之都理事会主席
寇 强 中山大学华南统计科学研究中心
组织委员会主席:
王学钦 中山大学数学与计算科学学院教授、华南统计科学研究中心执行主任
地方组织委员会:
蔡敬衡 中山大学数学与计算科学学院统计系副主任
尤 娜 中山大学数学与计算科学学院副教授
地方组织委员会秘书:
敖慧洁/李姣/李泳慧/刘成烽/齐欣然/吴炳培/周翔/朱珊 中山大学华南统计科学研究中心
可爱可敬的会议志愿者:
李烨薇/马兴华/刘淑娜/廖晗/谭海珠/朱俊贤/朱进/张波漾/张海慈/张强 中山大学华南统计科学研究中心
主办单位
- 中山大学 华南统计科学研究中心 http://scrcss.sysu.edu.cn/
- 华南统计科学研究中心QQ群:
- 华南统计科学研究中心微信公众号:
- 中山大学数学与计算科学学院 http://math.sysu.edu.cn/
- 统计之都 https://cos.name/
赞助单位
参会人员与单位
本次会议实际到场人数为557人。由参会人员报名时填写信息所画的文字云显示,数据挖掘、数据分析、机器学习、数据可视化、量化投资等主题是参会人员最感兴趣的内容,与当天的演讲主题前后呼应。
性别
其中男性有348人,女性有209人。
年龄
感兴趣的主题
参会单位
高校和研究所
澳门大学/北京师范大学-香港浸会大学联合国际学院/北京理工大学珠海学院/北卡州立大学/广东财经大学/广东工业大学/广东金融学院/广东省标准化研究院/广东外语外贸大学/广东药学院/广东珠江水产研究所/广州大学/广州航海学院/广州市交通规划研究院/广州市香港科技大学霍英东研究院/广州医科大学/广州中医药大学/桂林理工大学/湖北经济学院/华南理工大学/华南农业大学/华南师范大学/华中师范大学/暨南大学/江西师范大学/南方医科大学/乔治华盛顿大学/清华大学/厦门大学/汕头大学/韶关学院/深圳大学/四川大学/香港城市大学/香港大学/香港科技大学/香港理工大学/香港中文大学/犹他大学/中国海洋大学/中南财经政法大学/中南大学/中山大学/中山大学附属第一医院/中山大学南方学院/中山大学肿瘤防治中心/中山眼科中心
企业及事业单位
21cn/cyberway/ibm/MedSys/MIGO/nielsen/P&G/qpidnetwork/Teradata/Tesco/URBAN REVIVO/爱立信/奥咨达/佰仟金融/宝洁/保利/北京特恩斯市场研究咨询有限公司/贝奥生物公司/诚毅软件/创世跬科/创业者/从兴技术有限公司/电子七所/东莞博奥木华基因科技有限公司/佛山妇幼保健院/佛山市三水区农村信用合作联社/佛山信盈达印刷厂/佛山星期六鞋业股份有限公司/福建省农科院/富德生命人寿保险股份有限公司/高高信息科技有限公司/工商银行深圳分行/功典資訊/光大银行/广东帝弘数据技术有限公司/广东电信/广东农信/广东省疾病预防控制中心/广东省健教中心/广东省农业科学院农业资源与环境研究所/广东省社会科学院/广东省通信服务有限公司/广东省现代社会调查与评价研究院/广东省邮政速递物流有限公司/广东省职业病防治院/广东银监局/广东振业科技股份有限公司/广发基金/广发银行/广发银行信用卡中心/广发证券股份有限公司/广州佰聆信息科技有限公司/广州棒谷网络科技有限公司/广州城信所/广州瓷肌化妆品有限公司/广州短讯神州网络技术有限公司/广州凤鸣信息科技有限公司/广州共禾医药科技有限公司/广州农村商业银行/广州市墨灵格信息科技有限公司/广州市南沙中心医院/广州市因迪广告有限公司/广州市志贺贸易有限公司/广州数钻科技有限公司/广州帷策智能科技有限公司/广州讯汇科技有限公司/广州亚美信息科技有限公司/广州医药有限公司/广州移讯/广州亿程交通信息有限公司/广州银汉游戏/广州银行/广州优岸美致时装有限公司/广州优控信息科技有限公司/国双科技/浩瀚深度/湖北数据与分析中心/湖南快乐阳光/虎鱼网络科技有限公司/华大基因/华南植物园/华泰证券/华为技术有限公司/汇丰/金山软件/久邦数码/蓝厂搜索/朗新科技/芒果TV/美的电商集团有限公司/美商天睿信息科技公司/南风都市报/鹏华基金管理有限公司/平安/荣邦科技/三七游戏/上海伯豪生物技术有限公司/深创投/深圳彩讯科技有限公司/深圳市东方博雅科技有限公司/深圳市恒通支付有限公司/深圳市农运通网络科技有限公司/深圳市深度基因生物科技有限公司/深圳市速云互动游戏有限公司/深圳市腾泰翼运营有限公司/深圳市易基因科技有限公司/深圳天源迪科信息技术股份有限公司/深圳问世科技有限公司/实盈投资/数钻科技/顺丰恒通支付有限公司/顺丰速运集团/泰海网络科技有限公司/腾讯科技有限公司/团贷网/万联证券/网易/网易游戏/网舟联合科技(北京)有限公司/唯品会/维沃移动通信有限公司/无限极(中国)有限公司/武汉百捷在线科技有限公司/西山居/新华信国际信息咨询(北京)有限公司/亚信(广州)软件服务有限公司/衣百服饰有限公司/医院质量监测系统研究中心/易安信电脑系统/中国电信/中国建设银行/中国联通/中国南方航空/中国农业银行/中国移动
发表/查看评论