简介:逄伟,Director of Engineering, behavioral insights and science, eBay Inc.采访人:陈丽云(Liyun), Marketing Analyst, eBay Inc.

写在前面的话:前阵子统计之都发布了一系列数据分析领域专家的采访,从学界到业界,从新人到鼻祖。而后统计之都的主编向我约稿,我第一个想起来采访的人就是Wilson。虽然在eBay不同的部门工作,但同属数据科学的大圈子有交集也有不同的见解。我一直很好奇CS或者EE出身、从事系统开发背景的人会在工作中感受到什么样的数据分析,而Wilson正是回答这个问题最好的人选。

wilson

Wilson是eBay美国Engineering, behavioral insights and science总监。他于2006年加入eBay,先后参与过eBay支付系统、搜索产品、行为数据产品的开发。在加入eBay之前他在IBM从事了5年多的架构师和资深顾问工作。从浙大读书时期的创业经历,到咨询公司、再到电子商务公司,我们希望他对于学术知识、职业发展、数据科学的理解和心路历程可以启发后来者,以期在这个领域做出更大的成就。

Liyun: 我注意到你大学期间的专业是EE,那当时你应该主要专注在工程方面吧?除此之外,那时候你们学很多统计吗?

Wilson: 当时和大多数本科生差不多吧,接触过一两门课吧。

Liyun: 当时有这种数据科学(Data science)的概念吗?

Wilson: 那时候是94年,我们刚进大学的时候做的还是DOS下的编程,拿三四张那种很大的磁盘装个windows 3.x都是很兴奋的一件事情。那时候哪里有数据科学,大家都没有多少数据。那时候我们做一个股票分析软件,就是在小小的内存上一个点一个点画的。我的第一台电脑硬盘的大小也就是640M左右,内存也就是16M还是32M的样子。几十兆或者几兆就是“大数据”了——一张磁盘装不下的就是很大的数据。

Liyun: 那现在回想一下,当时学的什么东西最好玩?假设你现在回到学校,会再学点什么东西呢?

Wilson: 我的专业是EE嘛。从那时到现在,我们接触了无数的编程语言无数的编程工具,有些你可能现在都没听说过(Liyun:你刚刚说的那些我好像就听说过VB),这是基本的编程的方面。此外还有网络相关和Unix下的编程、多线程的编程等等。从开发的角度,接触了很多很多,从没有可视化到有可视化,从DOS(字符界面)到单片机编程、再到C++等可以一个个画表,再到VB、FoxPro,把一个数据库可以很快的展现出去。我们自己做一些可视化的工具,用那么一点小小的内存和硬盘处理图形是比较困难的,有很多好玩的技术挑战;另一方面从数据库到企业信息管理系统,我们做过好多,比如杭州环保局的系统软件。(Liyun: 这是你上学的时候还是后面到了IBM之后?)这都是在读书的时候。那时候你可以很快的把别人文章里面的东西搬到电脑上去,可以赚很多钱(当时一个月三四千!)。这个过程其实也很好玩,虽然技术挑战不多,但是很快你能看到技术带来的生产力。而且你能看到,很多人从很原始工作方式(比如打电话、写一些表格然后相互传来传去),到后面有个系统可以电子办公了,这也会让你觉得比较好玩。

此外,如果说哪些是比较有用的,那从当时的利用有限的内存画图、到现在的大数据Hadoop之类,很多算法和数据结构的原理是没有区别的。比如我们现在在分布式系统下,做很多数据的join,这些Hadoop系统现在做的还不是很好的地方。说到底,它用到了很多hash join, merge sort这些算法,当年我们做那些小程序和现在做这些很新潮很复杂的系统,本质上是没有区别的。我觉得现在很多Hadoop开发者都有点走偏了,其实他们可以写很多应用程序,但是他们不懂这些。还有一点真正有用的是,在做这些的过程中遇到的困难会给你带来解决问题、分析问题、设计系统、调程序的经验,这些经验现在还是一直沿用的。当年我去从客户的需求角度开发画图系统、和现在把eBay无数用户行为数据用可视化展现出来找到insights,过程和思考的逻辑是没有区别的。

其实这些年有很多像你们这些统计、数据科学背景进入这个行业,我自己也在看一些相关的书籍。如果说我有一个师弟学计算机,不需要很多,他有四五门课(算法、统计、线性代数、概率论、数学分析)掌握的非常深的话,那我认为他就是前途无量。只是当时我在大学的时候没有这个行业、很多事情也看不清。

我碰到过很多人,一些是eBay的研究员(research fellow),一些是国内的做机器学习做的不错的人、知道很多模型、也知道怎么去编程实现。相比而言,前者会用很基础的思维在做,比如看一下分布、画直方图、做一些基本的数学变换什么的,看起来没那么神奇却很有效;而后者可能会用一堆复杂的模型、把数据都扔进去、生成很多的特征,比较各种出来的结果,虽然也能解决很多问题,但面对真正复杂的问题他们可能只能解决一半、深下去就无能为力了。

Liyun: 就是说他们不是“由底到上”这样一种方式对吧,只是在上面飘着。

Wilson: 对的,这时候就在考验你基本的数学的知识。回到前面的话题,如果你有很好的统计、线性代数、概率论等这些基础,也学过一些进阶的机器学习模型,那作为数据科学家来说你大概完成了3/5;还有少数的一些人除此之外在工程上也很强,比如分布式系统,就可以尝试结合理论和实践的力量,开发引起行业革命性变化的产品。到这一步就是比如Google的Jeffrey Dean这样大神级的人物,引领行业潮流。

Liyun: 还有1/5?

Wilson: 完美的话,除了上述个人能力之外,还需要一个真正的行业应用环境,来解决一些非常困难的问题并且得到酬劳,拿到各种资源的支持来解决事情。对于学生来说,最后一步在学校是不可能的,你只能准备好前面的基础之后在一个行业中真正施展。我没办法回到过去,但是现在的学生却是可以的。

Liyun: 那你觉得学校出来之后到IBM的五年,除了前面的知识积累和资源,其他还有什么比较珍贵的经验?

Wilson:这就涉及到第一份工作怎么选了。当时我们在学校兼职的做股票软件的公司已经拿到风投了,做的还是很大的,在陆家嘴期货大厦都有办公楼。所以我当时有了一些start-up的经历,虽然我不是创始人。其实后来刚工作的时候工资还没有我以前做start-up高。

那个时候在年轻人的心里IBM三个字母都是烫金的,在浙江省也就招了两个人,能过去自然感觉也不错。今天回头看,除了这个光环之外,我当时的选择还是很正确的。IBM有一套很好的体系、无论是技术还是做事情、思维方式、待人接物、对复杂问题的处理,都有一套方法论。现在乍一听可能有点死板,什么东西都套用现成的方法论可能有点过了,但其实对于职场新人来说,经过这样的训练,哪怕到了新的环境新的公司,这些都已经是深入骨髓的做事方式了。这些我是受益非常大的。

Liyun: 那你当时学这些的时候痛苦吗?有没有什么血泪教训?

Wilson:当时我在IBM给上交所做券商的网上交易相关的系统,我们几个IBM的人带着一帮下包(全用IBM的人太贵了)。下包的质量难以保证,所以我们要做很多基础工作、架构这些,然后下包的人去填代码。那三个月我工作基本是从早晨九十点到凌晨两三点,项目上线之后我就直接去医院了。那时留下了慢性肠炎这种病,跟了我四五年,虽然后面养好了。有时候太投入了是件好事,很有激情去做一件事情,会学到很多得到很多;但如果让我回头看看这段经历,我是绝对不推荐的。人生是一场长跑嘛,给你带来的损伤可能是永远无法恢复的,身体的健康绝对不能作为职业发展的代价。

痛苦的话,像IBM这样乙方的公司,会有很多很多的客户让你觉得狗血。你要陪着笑脸跟他去讲,而他们可以随便发火、随便否定你。但他们是你的客户,做咨询的原则就是你要陪着笑脸、用非常专业的姿态去处理,要把事情做成。

我在IBM的五年每年都有跳槽的机会,每年都有一些让你心动的想法,收入可能比IBM高很多、也不会那么辛苦、不会那么痛苦。我坚持下来的原因,第一点是在一个公司一两年,你是学不到那个公司的精髓的。在一个公司,别人要信任你要认可你需要花一些时间、熟悉情况要花一些时间,把想法做出来又要花一些时间、做出来之后收益最大化又要花一些时间。没几年的时间你是做不出来的。你放弃了,很多事就只能做一半。第二点是任何公司都会有些不如人意的地方,有些政治味道。经历过前面的痛苦之后,你就会觉得这些没什么、你的心态会锻炼的非常非常好。如果这些都经历过了,你能非常系统、条理化的解决一些问题,那么你在大部分的情况下都可以这样系统的来解决问题。最后还有一点受益匪浅的,就是你在做咨询的时候会遇到各种各样的利益冲突。客户之间也有派系、不同业务部门,我们IBM公司内部也有不同部门,各种利益交织。在这个情况下,把一个事情做成,很多时候不仅仅是技术而更多是人的方面。IBM教你把这些东西都放到台面上来,分析客户之间的利益、和你一起合作的人的利益在哪里,这样的训练会对你整个职业发展都有帮助。

Liyun: 那当时是什么原因eBay让你终究心动了一下?

Wilson: eBay当时也挺有意思的。当时我们跟另外一个咨询公司给电信做项目,当时一个人的朋友是美国eBay的。eBay要在中国建一个中心,问有没有推荐的人。当时我就在想,eBay是个什么公司啊,我们这是IBM这是多牛的公司对吧?我们出去都是天天穿西装戴领带的。但做咨询就要天天出差,而我当时刚结婚,对于家庭来说,每两周回来一两天会是一个很大的问题。另外一点是IBM也是个蛮官僚的体系。我当时的表现很卓越,也有很多人认可,但IBM说到底还是一个销售型公司。很多人走fast track,给公司带来很多订单,而搞技术的人永远都没有这样的机会。同时eBay的情况是主管的职位而且不用怎么出差,我在IBM还不是主管。我当时就想着试试看吧,聊了一下觉得eBay做的事情和以前完全不一样。以前我们做的计费(billing)系统比eBay复杂多了,但eBay的用户量大很多、实时要求很高。聊下来觉得eBay的文化和环境都很不错,也是一个很全球化的公司。IBM已经非常中国化了。就决定试一试。后来发现真的是一个非常正确的决定。

Liyun: 那你什么时候开始觉得数据分析带来超乎预料的效果?

Wilson: 大概是三四年前从计费开始做搜索。不仅仅是我从计费到做搜索,这也是eBay在经历一个很大的转型。eBay以前是非常商务驱动的一个公司,我们招了很多MBA来做产品经理,写很多功能性建议(feature proposal)。我们作为工程团队,就是把这些功能一点不差的实现。然后eBay开始技术转型,我换到一个查询语义理解团队。我们开始做两个产品,第一个是收集用户的反馈、然后建立索引,也没有什么文本挖掘,就是可以打打标签,结果上线之后我们CTO每天早晨就是用这个产品。基本上我们一个功能上线后,一两天之内我们就能发现三四个漏洞,或者是增强某些功能的需求。当然后期我们也做了很多文本挖掘之类,这些都是后话。另外一个是众包,即利用互联网上的人改变搜索的结果,把他们的观点拿过来,改变eBay的站内搜索。这样eBay的搜索开始有了评价机制,每个新功能上线之前开始有反馈、知道怎么做改进。有很多这样数据驱动。这些都不是很复杂的系统,但非常有用。这些数据开始驱动用户体验。

接下来我们做了很多挖掘用户的行为数据、改进搜索算法。说到底,eBay的搜索就是三个方面:买家、卖家、商品。对于买家来说,就是挖掘他们的需求,然后匹配卖家和商品的信息。我们知道的买家的信息就是搜索关键词和点击,而对于同一个关键字来说每个人的想法可能都是不一样的,我们需要用数据挖掘出不同人要的是什么。对于卖家来说,eBay上有各种各样神奇的卖家,需要用他们的数据来改进算法。商品方面就更神奇了,什么东西在eBay上都找得到,有各种商品的信息和用户反馈。这些信息加入到搜索算法之后,带来的哪怕是1%的收入增加,绝对数字上就已经很夸张了。

学术上很多人谈大数据,大数据多重要、我在处理多大的数据量。很多人都是谈大小,而这些数据真正用起来哪怕一点点改进带来的都是钱,实实在在的钱。

第三个层面,我们做很多深入的分析。现在大数据领域,大家做的比较成熟的,第一块儿是产生很多报表、KPI什么的。大部分公司都在做、都在用。第二块儿是一些复杂的数据和算法,数学科学这些年这么红火。还有一块儿大家刚开始做、整个行业做的都还不够。这就是介于中间的,我利用这些数据、怎么提高用户体验——比如UI怎么设计、按钮怎么摆放、该用什么样的颜色。我觉得这个是大数据在这里发挥余地很大。eBay做了很多实验,比如增大图片的尺寸会带来收入上升,这些虽然不复杂但是对人机交互的贡献很大。举个例子,我跑到搜索的页面上,拉到页面底部都是下一页,交易转化率就会变得很差、基本就是一直在按下一页了。我们回过头来看页面,到了底部之后其实用户没的选择,搜索框看不到、只能在不同页面直接切换。做一个简单的变动、比如搜索框固定在顶部、用户可以直接去搜索另外的关键字,这样带来的交易转化就会多很多。类似于这样的分析,虽然不是复杂的算法,但是体现了大数据的强大。我们在做一些类似的行为分析,希望给大家带来一些耳目一新的产品。

现在其实已经不是谈大数据的影响的时候。如果你处在一个比较好的商业环境之中,你不做任何事情商业环境都会在增长,在浪潮之巅猪都能飞嘛。但如果在激烈的竞争中你希望更上一步,那大数据就是不可避免的、你必须做,只有做的好还是不好、不存在做不做的问题。

Liyun: 那你比较喜欢和什么样的人一起工作?

Wilson: 对我来说,我有几个条件。

第一个,就是你要有激情,我在中国工作这么多年,在美国也看到了很多人。一个感觉就是,一个人能不能做成一件事情,取决有有没有一团火在他心中燃烧着,他想做成事情。有些人不管处于职业发展的什么阶段、不管初入职场还是浸淫多年,但他非常想做成事情;还有一些人非常专业,会及时交付不会拖后腿,但我也要有我的生活、工作不是全部。对我来说,我倾向于前者,有成功渴求的人,我也很愿意帮助这些人成功。

第二点就是聪明。(打断:你指的是IQ还是EQ?)我是喜欢找到聪明的人。你有激情,也非常聪明,那么第一是你想做事情、第二是你能做成。我受不了鸡同鸭讲那样。而有几个聪明人在一起,你说一半他就知道了,他说一半你也知道了,你说了一个主意马上激发了他另外的一个主意,这样的效率肯定不是乘以2的问题,而是指数增长。

第三点就是能符合文化,能一起把事情做成。当然怎么能通过面试发现这些特质就是另一个问题了。

Liyun: 那你现在的团队是很多元化的吗?

Wilson: 我喜欢多元化。可能大家来自不同的文化背景,有不同的脾气,但是跟以上三点不冲突。

Liyun: 你曾经和学术界很紧密的合作吗?过程中最大的收获是?

Wilson: 其实我本人并没有很深的参与进来,但是我的团队和学者们有很多紧密的合作。比如和郁彬、 David Goldberg。他是协同理论的奠基人之一,像palm的手写识别也是他做出来的。像郁彬的话你应该比我更熟悉(Liyun: 其实没有啦,我只是听了很多八卦…)。我能感觉到我从他们身上学到很多东西。任何复杂的问题,归根到底都是很基本的。他们和career中期做机器学习的人思路有很多不一样,他们可以把很多复杂问题简单化、回归基础理论并解决。比如统计学的学生看文章,他们是在学习一些基本的原理和思想呢,还是学习各种复杂的模型?当然第二点也是重要的,但是第一点是基础。这个和武侠小说很像。梁羽生就是一个典型的代表,每本武侠小说都有两类人:正派和邪派。所谓的正派武功呢,就是一开始你打基础的时间要长一点、见效慢一点,到了后期可以不断精进;邪派的武功呢,会有各种神奇的方法速成,很快我就可以跟人谈SVM等厉害的算法,解决一些问题,但后期就无法深入了。我觉得这些杰出的学者都归到正派,他们有各种对数学的理解,至于各种算法那只是实现工具、各种招式套路还是需要有内力做基础。

第二点就是说,他们都是对原则不妥协。很多时候做管理,大部分事情都要妥协来实现。美国的历史中有很多妥协,比如最近的美国政府关门开门、美国内战解放黑奴后成立联邦等。在公司里做项目,我这边的想法是一二三、另一方是四五,但不可能实现一二三四五,可能实现的是一二五,这一定是大家有所妥协。现实中我们都需要靠妥协来做事情。但这些人很奇怪,他们是不妥协的。

Liyun: 他们是相互之间不妥协还是联合起来对外不妥协?

Wilson: 我觉得他们是心中有一个标准。如果一个事情你做不到,他们是不会开始后面的。他们可能不擅长打交道、不擅长管理,但是后面事情真正做对、做大、做出影响,都源于他们这样的坚持。同时也需要我们这样的中间人,在他们不妥协的时候跟外界做出一些妥协,最终把事情做成。事情还是要做的。

第三点就是,这些人非常实干,动手能力强。我们有个VP级别的研究者,谈数学模型、写R代码什么的,可能比很多人要强许多。我想郁彬这些人也是一样的。他们会把事情落到实处、不会那么空。都是非常实实在在的。

第四点就是对细节的关注。大家都说细节决定成败,但我看到的是很多一线的管理者,都会说这是技术细节,让他们解决就可以了。我的感觉就是这些人对细节看的非常的细,会改变整个一个大的结果。说到底,我自己走技术管理路子,这些经验对我来说都非常重要。

Liyun: 你现在还是每天都在读很多书吗?

Wilson: 这是习惯吧。和健身一样,这是我养成的比较好的习惯。

Liyun: 推荐几本书?

Wilson: 说两本非技术的吧。一本是《平凡的世界》,路遥的。还有一本是《约翰·克利斯朵夫》,原型可能是贝多芬。这两本书影响了我个人的很多性格和信念。

《平凡的世界》对我影响比较大可能和我的经历有关系。我的小学和初中都是在农村长大的,这本书主人公从高中生就不放弃梦想,然后到城市去打拼、做建筑工人。但他很喜欢读书,坚持学一些文学哲学的东西,精神世界和现实世界可以分开。他周围的工友可能一起喝个酒啊、发个牢骚啊、唱个歌啊,甚至可能找几个女人。他可以选择那样的生活、或者做个生意变得有钱,他也没有。他就是非常追寻他的精神世界。他给我的激励就是,无论现实处在什么样的环境下,你都可以选择做自己想做的人、不向任何东西妥协。

我们村儿历史上有过一个大学生,我大概是第二个。我家里条件其实还可以,我有三个姐姐我是独子。但是毕竟是处于那种条件下,我转学转到县城高中,再到浙大,再到IBM,再到eBay,再到美国eBay,经历了很多压力。从村庄到县城,发现周围的人见多识广;从县城到浙大,会遇到全国各地很优秀的人,带来不同的视野;到了IBM,很多人在职业发展上走得很远,也给你带来不同角度;从中国来到美国,又是不同的环境,有些东西可能不起作用了。很多人会经历不同的变化。我一直会觉得,你永远会在所在的环境中做的最好。有这么一个信念的话,你就一定会做到。再就是,有的时候现实会让人堕落。传统意义上的堕落也好,工作之后打打游戏消遣娱乐也是一种生活方式。但是如果你有一定的追求,那其他方面一定要付出更多。我也会从中吸取很多力量,激励我做别人不做的事情、远离很多事情。以前在咨询,陪客户吃喝玩乐什么的很容易,很多人也就走在这样的道路上。当然没有什么不好,但是我无法接受这样的生活。

《约翰·克利斯朵夫》如果你没看过,我会推荐你去看一下。我看过你最近的微博,写到你对于经济学的一些热情(Liyun: 那是很久以前写的被我偶尔扒出来了而已…),我很喜欢看到如此的热情。你去看约翰的一生、时时刻刻,都有这样的火在燃烧的。作者罗曼·罗兰写的非常浪漫,非常有激情,让我对生活的热情燃烧的非常非常厉害。一旦你觉得你对生活的激情不够的时候,你去读一下这本书。

至于我最近在看的,是一本旅居美国医生写的,《近距离看美国》系列,他会讲很多美国的历史、怎么成立这样的社会制度、美国的宪法的发展过程。所有的这些又是怎么和美国的现状结合在一起的。这本书让我对我现在的环境有了更好的了解。你现在看微博上大家谈社会制度和变革,这本书会让你比较系统的考虑什么样的社会制度是好的、好的制度是怎么来的。我太太最近刚信教,我也在看一些基督教的历史和文化。了解基督教的历史有助于更多的了解这个世界——政治制度、社会现象、欧美、以色列的战争是怎么来的。你会有一个很清楚的蓝图,不像以前觉得世界太大了。现在你会觉得有个脉络在里面。

Liyun: 说到这里我想起一本书,《新教主义与资本主义精神》,就是说基督教的发展对于整个欧洲西方社会思维方式和生活的影响。你可以抽空翻翻,很薄的一本小册子。

Wilson: 好呀。新教是一部分,旧约你也可以看看。为什么中东战争不断、以色列可以建国、以色列人在美国可以混的很好(犹太人自动获得以色列国籍)。这些都是比较好玩的一些书了。

Liyun: 最后的一个小问题,你最喜欢给你太太和女儿买什么?

Wilson: 给太太和女儿是不一样的。给太太有两类,一类是很实用的她想要的,你买的时候没有惊喜,甚至会把图片发过去确认,你们可能觉得有些老土,但对于老夫老妻来说也是很重要的。另一类一定是浪费、无用的。浪漫跟有用是扯不上关系的,而浪漫对老夫老妻也是重要的。有些时候是对她很重要、有些对她周围的人很重要。我送过一些项链、手表啊,我不确认她一定会喜欢,虽然她告诉我她很喜欢。有些鲜花啊什么的,大日子一定要有的,且一定是要别人看到的。

给我女儿就是逛街的时候看到玩具啊衣服啊,现在也开始买一些书什么的。这个年纪基本上给她买什么她都喜欢。

Liyun: 你觉得家庭对你的支撑主要是哪方面?

Wilson:我觉得两方面。我挺感激我太太的。我会经历各种变化,很多是意想不到的,也不是每个变化都很舒服。中间会有各种困难的时刻,你充满着野心去做一件事情,却突然间什么都变了。这个时候你需要怎么办?怎么去看清后面的一些机会?经历这些的时候我虽然很清楚一步步该怎么做,但总有沮丧、郁闷的情绪和时刻。我和我太太很好的一点是能超越现状看的更远一点,比如从人生的角度、整个公司的角度甚至社会的角度。最近我有些日子挺难过的,我前天和她打了一个电话、帮我分析一些问题。理智上这些分析我都是知道的,但有需要她帮我从情感中拖出来。我们两个除了当时的好感啊爱情啊,我觉得我们两个非常融洽,认定对方是另一半。我们很清楚长远的目标是什么,我们互相会在对方陷入苦难的时候把他拉出来,走向更远的地方。这对我非常重要。

另外一点就是,说到底人一辈子可能活80岁也就差不多了,我现在差不多接近一半了。想想自己到那一天的时候,真正给这个世界留下了什么东西?我可以说我做了一些学问、研究、算法,当然确实是挺有成就的;我也可以通过努力和一些人一起对世界有一些正面的影响。另一方面,我人生的过程也算精彩,尝试了很多不同的事情,不是就那么匆匆而过。但还有一方面,那就是陪你一直在走的人是你的家庭。你的孩子是你留在世界上的。很多时候回头看看,工作一直在变化、事情一直在变化,但你的家庭是不变的、家人是陪你在一起的。很多时候,这是你力量的源泉。你怎么让这些人过得很幸福,就成为了你的责任。我不知道女孩子怎么想,但对于男人来说责任是很重要的。

发表/查看评论