主题:大数据时代的“简读”之道–个性化阅读
嘉宾:陈光
主办:统计之都
场地:北京大学光华管理学院
纪要:吕翔
2015年4月12日,第27期沙龙(北京站)在北京大学顺利举行。嘉宾陈光先生以其幽默风趣的语言向大家介绍了如何在信息爆炸的今天打造自己的个性化阅读空间。本次沙龙由人大本科生吴佳萍主持,嘉宾陈光先生专注于机器学习,文本挖掘相关领域的研究,对社交网络领域的信息传播有独到见解。
以下为本期沙龙主要内容的回顾:
嘉宾从主观和系统开发两个角度,介绍了如何有效的消费,获取信息:
1.“成长”的烦恼
嘉宾以自己成长过程中与音乐的互动的经历作为开场,表现了信息发展过程中的变化。
首先是小学阶段,没有渠道听音乐,有音乐磁带就会听。此阶段信息资源匮乏,没有选择的困惑,只有来源的匮乏,接触到信息就会吸收。然后是初中阶段,磁带开始普及,可以自行选择。此阶段是最舒适的阶段,有充分的渠道接触到信息。能拿到想要的,而且不会被“噎着”。接下来是高中时代,随着接触音乐多了,有多元化的选择,兴趣逐渐稳定下来。这个阶段是信息的“小康”时代,想要追求更高,但是缺乏指引。最后的阶段是信息爆炸时代,人们可以在大量信息中扩展。此阶段的扩展全凭个人兴趣和自己的理解。结果是原来有的读就好,现在选的多了,反而不知道如何选择。
综合来看,人们对信息的获取的变化体现在想要吸收和能够获得之间的平衡变化。所以在大数据时代,需要学会做减法,去除噪声,做到精读。
2.大道至简
“博大精深”这个词语在汉语中看似矛盾。人的精力有限,“博大”则必不“精深”。现在信息爆炸,通读的人太多,反而需要在某些点上有不同观点的人,即“精深”,有选择有看法才是有智慧。但是精深需要广博。我们常看到大牛能把事情讲的非常明白,但他们不是一开始就这样,而是自己平时不断加深理解,不断深入。正所谓“为学日增,为道日减”,读书时浅尝全貌,了解全局,构造自己的知识体系,将吸收的养分转换为自己的果实。实践和总结经验时再不断的深入,即“先繁后简”,先博览后聚焦再领悟。将前期的勤奋积累转换为智慧。
3.小众再小众
关注圈的用户有两种:负责生产的话题领袖和负责传播的普通用户。但是信息最本质的还是在于影响,转发除了对是信息的认可还有对信息源的认可。信息的传播是长尾分布, 大量的节点是在小概率的尾部,凸显小众价值。所以更应该关注有效的传播用户,而不是生产用户。传播节点的选择是具有基于兴趣的选择,越是专业方向,转发会越有选择。这些节点中总有一款适合你,找到和自己相似的兴趣的传播节点再关注,往往性价比最高,即“大牛诚可贵,草根价更高”
在大数据时代,要确保自己的group是高质量的价值转播员(活跃 + 价值),不能盲目崇拜生产节点,根据自己的兴趣和需要,不从大众。
4.有舍,有得
为了做到自己的group里是对自己有价值的传播节点,得到“我”的小众视野,需要取舍。取舍的前提是对自己的理解,就像曲线拟合一样,舍不得样本中的每个数据,则会过拟合,但是缺乏见解,只往简单了想,则会欠拟合。在选择前形成个人的评价体系,确定价值取向,有标准才能做取舍,人们常说follow your heart, 但要先have a heart。
5.阅后即焚
有些时候,一些信息我们觉得有价值,就会先放入收藏夹中,等到以后有空时再看,结果就是“向来缘浅,奈何情深”。下次见到类似消息时就会觉得似曾相识但是忘了在收藏夹里。对于这种情况,陈博士给了几点建议:1. 头脑清醒,客观有效判断,2. 及时消化,3. 阅读后即焚,不留活口。遇到这类消息时先判断是否有价值,然后马上阅读,如果来不及,尽量当天看,看完就删除,尽量不留到收藏夹,每隔一段时间再定期清理一次,确保不留活口、
来自北京大学、中国人民大学、中国科学技术大学、中国矿业大学等高校学生、以及业界人士和创业者共四十余人参加了本次活动。嘉宾分享结束后,又有多人踊跃提问,对文本处理方面的具体问题进行了热烈的讨论。本次沙龙取得圆满成功。
发表/查看评论