17611538698
webmaster@21cto.com

中国程序员英雄传 - 百度徐海洋访谈录(上)

CTO说 0 6270 2017-03-19 11:54:57
focus.png

《中国程序员英雄传》主要讲述国内最顶级的程序员成长成功的真实故事。
本篇的为给各位介绍的是百度徐海洋,原百度网页搜索首席架构师,后于微软亚洲研究院从事神经网络与人工智能研发。本次访谈篇幅较长,社区会分几部分分批登载。


2017年3月16日,初春的上地。有一段时间没来,还是感觉很亲切,路边有许多的花已经开了,垂柳也绽放出了新芽,西二旗地区涌动着暖暖春意。
 
今天要访谈的人物是原百度网页搜索引擎技术负责人名叫徐海洋,我和他约在硅谷亮城——他的新办公室。
 
此次访谈是经过原创业家杂志的易涛先生介绍,他说徐海洋是人工智能大牛,目前BAT有关搜索引擎和人工智能很多人都是他的『徒弟』。我怀着敬佩的心情在百度上百度了这个百度人,但并没有给我特别多的信息。
 
在21CTO社区,也有一部分来自于百度,早年的技术管理者与我也有相识,这次见徐之前也是心里打着鼓,会不会是一个假的CTO?
 
带着有一点怀疑的心理,来到他的办公室——位于上地的硅谷亮城。徐海洋的办公室还在装修,但里面已经有几位同事和妹子在公办。
 
迎到我眼前是是一位为人和善,颇有亲和力的眼镜男,这便是徐海洋。
 
彼此自我介绍了一番,便开始了程序员与程序员的对话。
 
成长历程
 
徐海洋,生于1978年,一个湖北省武汉市的农村家庭。现在是一位幸福的父亲。
 
2001年,徐海洋研究生毕业。
 
让人好奇的,按正常的进度,2001年该是本科毕业,而徐却研空生毕业,难道我遇到了传说中的神童,少年班的学霸。
 
原来在徐海洋的老家,父母很早就送他上学,五岁就开始上小一,跟着比自己大两三岁的孩子一起读书。
 
这样好处不言而喻,年纪不大就读完了硕士,不好的地方就是与比自己年龄大3岁的同学一起,心智,成熟度的不一致,简单讲就是这些『大孩子』不带他玩。
 
这样实际上让他的社交能力有所减弱,让他变得有一点点孤僻,性格变得内向。他是这样回想总结,也许是这种情况,也许海洋本身性格就是这个样子的。
 
从农村家庭长大的孩子,加上70年代末还是物资贫乏的年代,每家的孩子基本都是散养状态,有一部分外部环境会影响人的性格,好处是可以自我学习,没人管。
 
从此角度看,徐海洋在那个年代能够本硕连读,肯定是当之无愧的学霸。
 
2001年,徐海洋从中科院研究生院走出来,踌躇满志开始寻找工作机会。

那个时候,大部分人还是喜欢进IBM,微软或者人民银行,国泰证券等外企或国企,私企和互联网企业意味着虚浮,不稳定,苦逼。
 
徐海洋在一开始就决定加入一家互联网公司,比如新浪等门户网站,后来选择了还在北大资源宾馆办公的搜索引擎公司,也就是百度。
 
此时的百度总共四十余人,技术团队十几个人,聚集着像刘建国,雷鸣,周利民这样的业界顶级技术专家。
 
百度创立于2000年,创始人李彦宏从美国拿着一笔天使轮资金回到北京,一落地就开始着手本地搜索引擎研发。他把当时在国内做最好的搜索引擎技术团队——北大天网搜索引擎的几位专家全部聚在一起,成为其技术团队的第一批员工。
 
2001年,百度的搜索业务刚有所起步。徐海洋的加入,也给百度的技术DNA又加入了新鲜血液。
 
我问他为什么能进百度?海洋说他喜欢互联网,喜欢技术,进百度也有一部分的运气成分在里面。
 
初入百度的徐海洋,与刘姥姥进大观园一般,新鲜刺激。徐海洋并不是计算机专业,来到工作场合,发现身边都是大牛,还是有些压力的。
 
徐海洋从一个工程师做起,到2004年,不到三年时间跃升为百度搜索部门的首席架构师。
 
百度有一个规则,工程师的决策权在研发层面有绝对的权利,无论是产品需求还是初级工程师的方案,都要经过徐海洋这一层别的评审放行,方可进行实施。
 
百度搜索架构
 
百度有一个Slogan:简单可依赖。它的技术架构也是如此。
 
徐海洋所在网页搜索部门,在2002年左右,最初只有4个人,直到2005年百度在NASDAQ上市,也只有不到20人的规模。
网页搜索所使用的服务器集群也只有600多台,支撑着每天几亿的搜索请求。
 
这和百度的搜索架构有很大关系,所有的技术用最精简的方式开发。
如分布式文件系统只使用Linux的文件系统EXT FS,其余的组件,百度蜘蛛,索引分词等全部自己开发。
 
搜索引擎的核心,拿徐海洋的话说,也就二十几万行代码。并且还有一部分重复的工作,这一部分工作绝大多数是他自己独立开发完的。
 
如果让他再开发一套爬虫系统,他能再倒着写一遍,代码还能再精简几万。
 
这如同我们能把道德经一样倒背如流是一样的道理。

一个人十五年来,不跟风不动摇,只做一件事儿,这就是搜索引擎。
 

作者:杜江(洛逸)
来源:21CTO社区


评论