主题:数据分析的道与术
嘉宾:毕然
主办:统计之都
场地:中国人民大学
组织:蔡占锐、钟琰、丁维悦、闫晗
纪要:钟琰
2015年5月10日,第28期沙龙(北京站)在中国人民大学顺利举行。嘉宾毕然先生热情亲切的与大家交流分享了关于数据分析的术与道的心得。本次沙龙由人大研究生丁维悦主持,嘉宾毕然先生专注于理论与实践的相互促进,涉猎于大数据分析与建模、经济与商业机制、营销与心理学、互联网产品战略等几个方面的研究。
以下为本期沙龙主要内容的回顾:
数据分析之道
进行数据分析需要掌握数据分析的关键,毕然先生自己总结了在数据分析过程中的四个重要部分。
第一个部分是业务调研,这是数据分析的起点。在社会工作当中,理解业务是一切数据分析的出发点,只有搞清业务的人才能够做出好的数据分析结果。因此数据分析过程中重业务调研,而轻方法。
第二部分为推理分析,数据分析过程中需要一定的思考推理能力。人们在面对数据表现出来的结果时常常会犯以下六类错误:(1)相关性的误解。(2)缺失或不匹配的比较。(3)相关或先验信息的忽略。(4)先入为主的偏见。(5)过多脑补的推理。(6)基于个案的认知。数据分析新手尤其需要注意这六类错误。
第三部分是创新思考。毕然先生说道,任何一个数据分析员从业两年以后都能够达到上两个部分的基本要求,但是要想从众多工作者中脱颖而出,就需要能够创新思考。创新思考需要一个人的知识面十分的广博,一个人的视野非常的开阔。心理学、经济学、数据挖掘等学科的内容都需要涉猎。
第四部分是可行建议,它强调了数据分析的终点。在企业当中,数据分析最终的目的在于分析结果能够提供切实可行的方案,一个只能够陈述事实的报告并不是一份好的报告,分析报告的作用大小在于它能够转化为多少的收益。
数据分析之术
在数据分析之道之后,毕然先生与大家分享了自己在学习、使用数据分析的方法的时候做出的种种思考。
他认为在学习各种数据分析方法、指标时,应该做到懂得为什么,懂得指标建立的原因,而不是单纯知道指标是什么。中国的教育相比起为什么更加重视是什么,这种学习并不利于学生理解方法。
他向大家提出“是否可以信任统计”这样一个问题,并指出现实世界的观测是有限的,永远没有办法通过样本得到事实的全貌。但是在世界上却存在着大数定理这样的世界的基本规则,样本可以告诉我们在一定的概率下,统计是可以信任的。
虽然在概率的角度上去考虑,统计是可以信任的,那么我们又需要如何通过统计去正确的认识世界?对于一个分析结果,我们如何去分析它的出现是不是因为抽取到了一个极端特例的样本,或者是否还存在着其他我们没有控制的因素的存在?这里,人们往往采用同质对照的方法进行试验来消减其他因素的影响,并通过在一定程度上增加样本数量来更好的认识世界。同时面对统计结果,比起单一的数值,我们往往需要更加关注置信区间这类关注正确概率大小的指标。
最后毕然先生慷慨的分享了在实际应用中解读数据的六个“拆”法。它们分别是:拆指标的三种方法:看指标的分布、看指标的趋势、把一个大指标拆成多个因素;拆数据的三种方法:个案分析、异常分析、分组分析。通过这六种方法,我们能够更好的认识数据。
发表/查看评论