COS数据分析沙龙第一期（北京）

2012年6月16日，第一期COS沙龙以“数据挖掘，商业软件还是开源软件”为话题，在人民大学泊星地咖啡厅举行。

沙龙邀请了翟祥和刘思喆两位嘉宾围绕沙龙主题做了精彩发言。

翟祥是中国人民大学博士，现任北京林业大学经济管理学院副教授,从事统计学研究应用10年有余,担任SAS公司特聘讲师和工程师,与SAS和IBM进行长期技术合作。主要从事数据挖掘、市场研究咨询和风险管理等领域的理论和应用。翟祥从统计问题的思维方式入手，提出了“理性需求”和“非理性需求”的概念和需求调整与演化的模型，商业软件可以很好的满足显性需求和现实期望，但是对于模糊需求和隐性需求，则需要使用软件的人来识别并转化为现实期望和显性需求，这就需要用开源软件的解决方案。

翟祥讲述需求调整与演化的模型

（翟祥讲述需求调整与演化的模型）

刘思喆作为中国最早的一批R使用者，于2003年正式接触R语言，从此同开源软件结下了不解之缘。先后在彩票行业、电信行业以及互联网行业从事Data Analyst、Data Modeler、Data Mining Consultant等职位的工作，专注于数据分析、数据挖掘、数据可视化、最优化等领域。个人主要以R语言为手段，提供企业级解决方案。刘思喆通过Google搜索数据和KDnuggets调查，展现了以R语言为代表的开源数据分析软件的强劲发展势头。随后，思喆结合实践经验，与大家探讨了开源软件在商业使用中的利弊。

刘思喆分享R数据分析经验

（刘思喆分享R数据分析经验）

来自新华社、国家信息中心、工行数据中心、民生银行数据中心、阳光保险、国金证券、小米科技、淘宝网、追梦创游科技、人大经济论坛、埃森哲等各公司的数据分析爱好者积极与嘉宾互动，围绕主题展开了深入讨论。

经过讨论，大家认为：开源软件和商业软件没有严格的竞争关系，并且商业软件也有开源的一面，开源软件也有商业化的可能。在统计分析领域，商业软件如SPSS、SAS等提供的功能具有普遍性，用户界面友好，但是灵活度不足。开源软件，如R，灵活度高，但是用户界面不那么友好，学习曲线陡峭。使用商业软件有公司的保证，出了问题可以转嫁责任，但是使用开源软件的话，责任就在于使用软件的人身上了。

COS数据分析沙龙第一期（北京）

统计之都