2012 年 6 月 16 日,第一期 COS 沙龙以 “数据挖掘,商业软件还是开源软件” 为话题,在人民大学泊星地咖啡厅举行。

沙龙邀请了翟祥刘思喆两位嘉宾围绕沙龙主题做了精彩发言。

翟祥是中国人民大学博士,现任北京林业大学经济管理学院副教授, 从事统计学研究应用 10 年有余, 担任 SAS 公司特聘讲师和工程师, 与 SAS 和 IBM 进行长期技术合作。主要从事数据挖掘、市场研究咨询和风险管理等领域的理论和应用。翟祥从统计问题的思维方式入手,提出了 “理性需求” 和“非理性需求”的概念和需求调整与演化的模型,商业软件可以很好的满足显性需求和现实期望,但是对于模糊需求和隐性需求,则需要使用软件的人来识别并转化为现实期望和显性需求,这就需要用开源软件的解决方案。

翟祥讲述需求调整与演化的模型

(翟祥讲述需求调整与演化的模型)

刘思喆作为中国最早的一批 R 使用者,于 2003 年正式接触 R 语言,从此同开源软件结下了不解之缘。先后在彩票行业、电信行业以及互联网行业从事 Data Analyst、Data Modeler、Data Mining Consultant 等职位的工作,专注于数据分析、数据挖掘、数据可视化、最优化等领域。个人主要以 R 语言为手段,提供企业级解决方案。刘思喆通过 Google 搜索数据和 KDnuggets 调查,展现了以 R 语言为代表的开源数据分析软件的强劲发展势头。随后,思喆结合实践经验,与大家探讨了开源软件在商业使用中的利弊。

刘思喆分享R数据分析经验

(刘思喆分享 R 数据分析经验)

来自新华社、国家信息中心、工行数据中心、民生银行数据中心、阳光保险、国金证券、小米科技、淘宝网、追梦创游科技、人大经济论坛、埃森哲等各公司的数据分析爱好者积极与嘉宾互动,围绕主题展开了深入讨论。

讨论

经过讨论,大家认为:开源软件和商业软件没有严格的竞争关系,并且商业软件也有开源的一面,开源软件也有商业化的可能。在统计分析领域,商业软件如 SPSS、SAS 等提供的功能具有普遍性,用户界面友好,但是灵活度不足。开源软件,如 R,灵活度高,但是用户界面不那么友好,学习曲线陡峭。使用商业软件有公司的保证,出了问题可以转嫁责任,但是使用开源软件的话,责任就在于使用软件的人身上了。

发表 / 查看评论