2012年6月16日,第一期COS沙龙以“数据挖掘,商业软件还是开源软件”为话题,在人民大学泊星地咖啡厅举行。

沙龙邀请了翟祥刘思喆两位嘉宾围绕沙龙主题做了精彩发言。

翟祥是中国人民大学博士,现任北京林业大学经济管理学院副教授,从事统计学研究应用10年有余,担任SAS公司特聘讲师和工程师,与SAS和IBM进行长期技术合作。主要从事数据挖掘、市场研究咨询和风险管理等领域的理论和应用。翟祥从统计问题的思维方式入手,提出了“理性需求”和“非理性需求”的概念和需求调整与演化的模型,商业软件可以很好的满足显性需求和现实期望,但是对于模糊需求和隐性需求,则需要使用软件的人来识别并转化为现实期望和显性需求,这就需要用开源软件的解决方案。

翟祥讲述需求调整与演化的模型

(翟祥讲述需求调整与演化的模型)

刘思喆作为中国最早的一批R使用者,于2003年正式接触R语言,从此同开源软件结下了不解之缘。先后在彩票行业、电信行业以及互联网行业从事Data Analyst、Data Modeler、Data Mining Consultant等职位的工作,专注于数据分析、数据挖掘、数据可视化、最优化等领域。个人主要以R语言为手段,提供企业级解决方案。刘思喆通过Google搜索数据和KDnuggets调查,展现了以R语言为代表的开源数据分析软件的强劲发展势头。随后,思喆结合实践经验,与大家探讨了开源软件在商业使用中的利弊。

刘思喆分享R数据分析经验

(刘思喆分享R数据分析经验)

来自新华社、国家信息中心、工行数据中心、民生银行数据中心、阳光保险、国金证券、小米科技、淘宝网、追梦创游科技、人大经济论坛、埃森哲等各公司的数据分析爱好者积极与嘉宾互动,围绕主题展开了深入讨论。

讨论

经过讨论,大家认为:开源软件和商业软件没有严格的竞争关系,并且商业软件也有开源的一面,开源软件也有商业化的可能。在统计分析领域,商业软件如SPSS、SAS等提供的功能具有普遍性,用户界面友好,但是灵活度不足。开源软件,如R,灵活度高,但是用户界面不那么友好,学习曲线陡峭。使用商业软件有公司的保证,出了问题可以转嫁责任,但是使用开源软件的话,责任就在于使用软件的人身上了。

发表/查看评论