微信
手机版
网站地图

净水器,升-粉丝联合会,组织每一次聚会,支持我们的爱豆

2019-06-09 15:22:33 投稿人 : admin 围观 : 277 次 0 评论

王海峰

蹭母校 99 岁生日,大叔今日八一八百度新任 CTO,也是哈工大核算机系出色校友王海峰。

左林大叔知道王海峰应该是四分之一个世纪之前的时分了,那时,左林大叔在哈工大读核算机,王海峰比大叔高四届,同一个系,按理高四届是老死不相往来,这原因有二:

原因一是,大叔那一级有不少哈三中的同学,许多当地的大学和当地的重点中学都有着奇妙的共生共荣,川大和成都七中、哈三中与哈工大等等,王海峰是哈三中进的哈工大,是大叔那些哈三中的同学里嘴里常常说到的传奇人物。还有一个人被大叔的哈三中同学一向提及至今的是李健同学,哪个李健?便是从哈三中去清华,然后吟唱《贝加尔湖畔》的歌者李健。

原因二是,大叔的辅导员程晓明教师也是 89 级哈工大核算机系的,程晓明教师是 312 的班长,而王海峰是 322 的班长,321 的班长则是刘挺,刘挺班上的团支书云晓春现在是院士提名人,现已进入了第二轮,学习委员叫杜跃进,哪个杜跃进,曾经是体系里最懂网络安全现在去了阿里的学术派杜跃进杜博士。

于生一

杜跃进

王海峰在哈工大就读期间名声斐然,很大程度在于他的勤勉和乐于助人,有个关于王海峰的段子广为流传。

王海峰是 1993 年读的硕士研讨生,他读硕士研讨生的前两年,互联网尽管开端接入,但仍是不行遍及,王海峰就木事往北京跑,每次一跑便是一个礼拜。在北京的这个礼拜天天跑北京的国家图书馆,在图书管里找各种文献,然后复印,其时复印一页 A4 纸是 2 毛钱,王海峰一印就印几千页,每次光复印费就上千块。

图片来自哈工大官微

那时也木有什么快捷的邮递服务,所以每次,王海峰都要背一个满满都是复印材料的旅行袋坐 20+ 小时的火车吭哧吭哧从北京回到哈尔滨(那时木有高铁),背到后来,旅行袋的港娱之打造芒果王朝背带都背折了。而每次王海峰从北京一回来,便是整个试验室里最欢喜的日子,简直全系这个方向的青年教师和研讨生都过来找王海峰,看材料,聊见识,评论问题,沟通心得,很是热烈。

王海峰在哈工大硕士博士就读期间一共有三个导师,这三个导师和其背面累积的根由都代表着哈工大在我国人工智能细分范畴的一香港三方成就和职业领先位置。

王海峰硕士导师是李生,李生是哈工大核算机系的老系主任,也是哈工大乃至我国人工智能范畴第一个博士生提名人(终究由于在提副教授和读博士之间二选一挑选前者木有读成博士,我国人工智能范畴第一个博士生花落张大鹏教授,安利下,张大鹏教授也是咱们 CCF-GAIR 2019的讲者)。

李生(右)&左林大叔

其时李生还木有当哈工大党委书记,但现已是哈工大党委副书记,其时李生机器翻译试验室里协助李生打理日常事务的是邱祥辉,邱祥辉后来去了深圳,在哈工大深圳圈子里鼎鼎大名。

李生试验室里当打主力是哈工大子弟兵赵铁军,之所以说赵铁军是哈工大子弟兵是由于他是哈工大核算机系教授吴纯园的儿子,赵铁军之所以木有跟着父亲姓吴是由于吴纯园在年青的时分参加革命地下作业,隐姓埋名,所以儿子一开端姓赵。王海峰在本科结业设计期间就跟着赵铁军写代码,其时赵铁军搞了一套机器翻译的体系,王海峰帮着做完成,王海峰从小便是写程序的高手。

王海峰高中时代运用的电脑

李生、赵铁军是哈工大 NLP(自然言语处理)两支中的一支,另一支则是王开铸、王晓龙、刘挺这一支。王开铸 30 时代生人,比李生长十来岁,也是哈工大核算机系的老主任,他的开山大弟子是王晓龙,王晓龙的得意门生王轩现在是哈工大深圳核算机学院的院长。

王晓龙是智能拼音输入法的作者和构架提出者,王轩是该输入法的主力开发,智能拼音输入法1995年被微软看中后,根据此成为 PC 上盛行一时的微软拼音输入法,大学里输入法做到这份上,前无古人。王开铸的关门弟子是刘挺,是公认的横跨 NLP 产学研的中青年业界首领。

赵铁军

在大叔看来,我国的 NLP 学术研讨范畴有许多值得尊敬的老先生,比方马希文先ipfk生以及他的北大继任者俞士汶,再比方清华大学的黄昌宁,山西大学的刘开瑛,东北大学的姚天顺以及中科院的高庆狮、冯志伟,李生是与他们并重的学术咱们,李生后来中选中文信息学会理事长、获得 ACL 终身成就奖都是其江湖位置的显示。

王海峰的第二位导师是洪家荣,即使对许多学核算机的人来说,洪家荣的姓名也有些生疏,但洪是我国在机器学习范畴最早获得国际性名誉的核算机科学家,环绕决策树概括学习算法范畴在国际尖端会议上宣布多篇论文。天妒英才,洪家荣 1997 年2月生病谢世。谢世前,他出书了《概括学习:算法 理论 使用》一书。

洪家荣其时有个学生叫丁明峰,洪家荣最重要的一篇文章《一种新的决策树概括学习算法》丁明峰便是第二作者,惋惜由于弟弟交通事故家里经济出现问题,1987 年哈工大本科入学的丁明峰在 1996 年抛弃读博士参加中兴,最高曾位居中兴母公司总裁,现在的丁明峰转做出资,兴办合创本钱。承继洪家荣衣钵的是今日哈工大人工智能研讨院的院长王亚东,也是当年洪家荣出殡时的抬棺人。

丁明峰

在雷锋网合伙人、《我国人工智能简史》作者之一岑峰看来,洪家荣的扩张矩阵理论给了王海峰不少创意。

洪家荣在机器学习的代表作是根据示例的学习算法 AQ15,示例学习也称为概念获取,在 80 时代,常识获取已被公认为专家体系开展的瓶颈问题,示例学习也获得愈加广泛的注重。除了 AQ15 外,其时示例学习在国际上最有影响的算法还有奎林(J.R.Quillian)提出的 ID3,奎林一同仍是语义网络模型的提出者,对自然言语了解有着长足的影响。扩张矩阵能够用矩阵的办法做常识表明,通过改换后能够将文字串转化成神经网络能够练习的参数,然后处理这一问题。

王海峰还有一位导师是高文,王海峰的本科结业设计是跟着赵铁军做的,硕士期间,他参加了 863306 的机器翻译项目,王海峰自己写了一套体系,并在 863 的测评中拿了个第一名和部级科技进步奖。

应该是 1996 年,高文开端担任 863306 项目组的首席专家。做 863 首席专家有个不成文的规则,便是首席专家必须在北京,高文也从哈工大进京入驻中科院核算所。

中科院核算所

核算所其时最大最火的是李国杰掌管的智能中心,净水器,升-粉丝联合会,安排每一次集会,支撑咱们的爱豆智能中心与摩托罗拉协作了一个试验室,高文落脚核算所的第一站便是这个试验室,王海峰在这里做了一年,回校后仍持续承受高文的辅导。

高文在 2018 CCF-GAIR 大会上

从本科到硕士到博士,王海峰一向都是在做机器翻译,所不同的是,本科的时分担任做完成,硕士的时分自己写了一套体系,到博士的时分,王海峰不期望自己止步不前,而是期望能用新办法做机器翻译。

中科院核算所是国家队,网络条件更是一等一的好,王海峰充沛查阅这个范畴的全球最新研讨成果,直到看到神经网络的相关文献,他登时有醍醐灌顶的感觉,决议用神经网络做一套机器翻译体系。

和王海峰一向揣摩用神经网络做研讨的还有一个一同读博士的,这个人叫徐波,哪个徐波,便是现在中科院自动化所所长徐波。仅仅两个人使用场景纷歧样,一个用在言语上,一个用在语音上,后来和王海峰精诚协作的贾磊,是徐波的博士生,这个国际不大。

徐波

神经网络在视觉、语音上用起来要相对更晓畅一些,但自然言语处理要难不少,王海峰终究乃至是环绕一串文字串不断做神经网络递进。

另一个问题是,尽管处理了 NLP 的参数化问题,但在网络结构上还需求进一步调整。其时干流的网络是 BP 网络,而言语是有上下文的,朴实的 BP 网络搞不定上下文问题。后来王海峰就揣摩在网络结构上怎样变成一个 RNN 加上一个循环层链接回来反映上下文联系,作用还不错。相关成果他写在了自己的博士论文里,这在其时即使放在国际上也归于比较超前的思维。

博士结业后,李生和高文都想留王海峰,但王海峰挑选抛弃留校,他想去企业看一看,净水器,升-粉丝联合会,安排每一次集会,支撑咱们的爱豆所以在 1999 年 3 月参加微软我国研讨院。整个微软我国研讨院其时也就刚刚开端建造,也便是 10 人出面。

王海峰明晰记住他是 NLP 组的第二名到岗者,在此之前的是刚从东京大学回来,后来回沈阳航空航天大学的蔡春风,徐志贺王海峰的大师兄也便是我国 NLP 范畴第一个博士生周明得半年后才从日本回来。

王海峰的别的两位哈工大博士生同学刘挺、荀恩东也比他晚到(刘挺是先留校再到微软我国研讨院的,王海峰则是木有留校直接去微软我国研讨院的)。微软我国研讨院 NLP 的第一任主管黄昌宁也在 4 月份签到,黄昌宁此刻刚从清华退休,今日清华大学核算机系的党委书记孙茂松教授以及周明都是黄昌宁的学生。

微软我国研讨院地点的希格玛大厦

王海峰去找开复,问自己做什么,对谁陈述。开复说,没他人,我来带你吧。开复教师是做语音的,其成名作便是做语音辨认,李开复教王海峰咋做言语模型,咋用核算的办法做验证。王海峰明晰记住,在知春路希格玛大厦李开复的作业室里,李开复手把手教王海峰推公式,王海峰每次都记满满一大篇,然后回去消化,边学边做。

王海峰在微软我国研讨院期间发第一篇顶会论文也不是投的 ACL,这很大原因是由于开复教师是混语音圈子的。王海峰这篇论文的协作者是其时同在微软我国研讨院的高剑锋,高剑锋也是 IEEE 2019 的新晋 Fellow。王海峰和高剑锋协作的这篇论文也是微软我国研讨院的第一篇论文,因而,李开复花的功夫不少,还亲笔改,王海峰前年在家翻了一下,还找到当年李开复亲笔改的稿子,复印了一份发给李开复。

李开复

王海峰在微软我国研讨院呆的时刻不长,也就一年出面,但在这一年多里,王海峰从 NLP 范畴进入了查找这个新范畴,其时担任查找这个组的 leader 是张宏江,其时的组员还有文继荣,文继荣后来回了人大,他呆的时刻比王海峰长许多年,在微软我国研讨院期间做了微软学术查找人立方等产品。很快,杨强也参加微软我国研讨院。哪个杨强,便是今日 IJCAI 的理事会主席,我国人工女囚门智能范畴最具国际影响力的我国学者。

不过,查找这个项目在微软我国研讨院没有做多久就叫停了(微软在 2000 年 4 月停掉查找是微软曩昔 20 年来最大的战略失误,这其间净水器,升-粉丝联合会,安排每一次集会,支撑咱们的爱豆故事多多,咱们择机单扒,邻里们也能够点击阅览原文,到咱们的常识星球与咱们互动),王海峰也由此脱离了微软我国研讨院,但与查找的缘分就此结下。王海峰自嘲自己是我国最早做查找的那一波人,在他做查找的时分,百度也刚刚起步。

高剑锋

查找做了两三年后,王海峰又把自己的重心转回到 NLP 上,2012 年 3 月,他参加了东芝我国的研讨院。

王海峰真实在学术上获得超高成便是其在东芝我国研讨院担任首席研讨员的那五六年期间。王海峰不是最早在 ACL 这样的顶会上宣布论文的人(不过也归于最早的一净水器,升-粉丝联合会,安排每一次集会,支撑咱们的爱豆批学者),但有项我国学者中的记载应该是他坚持的:2006 年 ACL 年会,他一人中了 5 篇文章。

王海峰与 ACL 社群结缘是由于一个香港科大的叫吴德恺的教授,吴德恺也是 NLP 研讨的大牛,其成便是“较早将中文分词办法用于英文词组的切割,并且将英文词组和中文词在机器翻译时对应起来”,也便是 ITG 模型。

吴军在《数学之美》一书中中文分词研讨史的章节里说到了两个人,一个是清华的孙茂松,另一个便是吴德恺。王海峰脱离微软我国研讨院后跟着吴德恺去了香港,有一段时刻短创业的阅历。吴德恺是 ACL 历史上范畴第一位华人 Fellow,有一年 ACL 在香港开会,吴德恺是组委会主席,王海峰因而被拉进组委会,并由此进入 ACL 社群这个咱们庭里。

吴德恺

王海峰还保留了一项与 ACL 有关的记载,那便是从 2004 年起,接连 15 年深度参加参加 ACL 学会,并且根本每年都有文章宣布或深度参加安排。

王海峰也是 ACL 历史上第一位华人主席,这个时分王海峰现已到了百度。王海峰进百度是由于看到百度要做框核算,模糊觉得自己会有英豪山竺民宿用武之地,恰逢此刻,也觉得自己在东芝做到头了。王海峰之前也想曩昔百度,但他觉得框核算之前的百度,更多的是产品运营驱动,需求的更多是写代码的年青人,而不是林雪惠他这种有工程完成才能的科学家,这时恰巧百度也在找 NLP 方向的带头人。

代表百度第一个面试王海峰的是王梦秋,之后百度担任大查找事务的副总裁,百度内部闻名的铁娘子,也是百度的前期创业职工。现已单飞兴办清流本钱的王梦秋也与左林大叔回忆起她其时对王海峰净水器,升-粉丝联合会,安排每一次集会,支撑咱们的爱豆的两点形象:一是聪明,一点就透;二是对技能有满足的热忱。这两点让王梦秋当场就确定王海峰会是百度要的那个人。

更重要的是,王海峰自己创过业,在东芝的时分也有从 0 到 1 的管理经历,知道怎样去做开拓性的作业。

王梦秋

王海峰进入百度后很快协助百度一步步建立起人工智能团队,他自身便是自然言语处理方面的专家。最早,他先把自然言语部分建立起来,并很快协助提高百度的查找成果质量;其次,他找来贾磊,建立起语音部分;自然言语和语音部分后,王海峰的第三枪是图画部分,其时给好几个提名人发了 offer,最早呼应的是余凯,后来黄畅也来了,余凯和黄畅后来出去兴办了地平线,这是后话,按下不表。

王海峰对深度学习的跟进也很早,2011 年下半年,他参加了张长水在清华安排的研讨会。

2012 年下半年,贾磊领导的语音团队获得了让人冷艳的成果,百度上下开端有了建立 IDL 的一致。王海峰是 IDL 的前期组成者之一,并在 2013 年上半年招募了张潼、吴韧等大将。2014 年 1 月,王海峰所领导的团队去了查找,将 AI 与查找事务进行有用的交融和推进。这年 5 月,吴恩达参加百度。

2016 年 6 月,百度只花了 25 天就推出了一套全新的信息流产品,这很大程度在于王海峰带领的技能团队练习有素,以及 2013 年起百度一向在尽力推进的渠道化战略。2017 年 3 月,完毕三年之约的吴恩达脱离,王海峰差不多一同间开端整合百度一切 AI 相关技能团队,组成 AIG。

吴恩达

当然还有一点,那便是,自然言语处理、查找、人工智能这些在底层上是彼此融会贯通的,王海峰的这三十年根本都在与这个打交道,特别是百度的这十年,王海峰跟着百度的 AI 体系一步一步往上不断深入、迭代、交融,从这个意义上说,王海峰与百度,百度查找与 AI 之间现已相生相长在一同,李彦宏请王海峰做 CTO 仅仅时刻问题。

附 《我国人工智能简史》与王海峰谈哈工大和AI产学研(对话于 2019 年 3 月)

《我国人工智能简史》:哈工大对你有多大的影响?

王海峰:哈工大对我影响非常大,我到今日常和我的小伙伴们说起那八个字:标准严厉、功夫到家。了解我的人都说,这八个字不只体现在我的日子中,我的日子也契合这八个字,这是烙在我血液里、灵魂深处的行为准则。我在哈工大呆了九年半,近十年的时刻,人生第一个十年与哈工大在一同,哈工大教会我怎样去认知这个国际。

《我国人工智能简史》:哈工大哪位教师你形象最深入?

王海峰:李仲荣。咱们重生刚入学的时分,李仲荣给咱们在新楼 101 那个大教室做陈述,他跟咱们讲他是怎样给航天、给国家做项目的,讲得咱们一个个热血沸腾的,像打了鸡血似的。我形象特别深,国之所托的那种荣誉感,很鼓舞人心,现在回想起来仍是很激动。今日想想,那真的很难,都是长辈们一点一点给做起来的,后来遇到许多工作,我都不会慌,比起这些前人,咱们做的工作没有那么难。

还有陈光熙(左林右狸频道注:陈光熙先生是哈工大核算机系的创始者、第一任系主任,也做过哈工大的副校长)。陈老先生也给咱们上过课,但陈老先生年岁有些大了,和咱们有些远,李仲荣对咱们的影响是直接的,是巨大的。李教师走得有些早,他要是不那么早走的话,当院士一点问题都没有,哈工大核算机使用的博士点是他创始的,他也是我国最早做人工智能研讨的几个学者之一。很惋惜。

《我国人工智能简史》:你读的是李生书记的研讨生?

王净水器,升-粉丝联合会,安排每一次集会,支撑咱们的爱豆海峰:我本科入学的时分,李教师是咱们的系主任;我研讨生进试验室的时分,他现已是党委副书记了;我博士结业的时分,他是党委书记了。李教师让我很敬佩的是即使行政事务繁忙,他也挤时刻做学问,带学生,给咱们开会,在方向上给予辅导。要统筹很不简单,这需求很强的归纳才能,我从他身上学到许多。到今日,有许多时分,我遇到问题也会讨教他,他总能给咱们许多辅导定见。

《我国人工智能简史》:高文教师对你影响大吗?

王海峰:我记住高教师是 1991 年回来的,他后净水器,升-粉丝联合会,安排每一次集会,支撑咱们的爱豆来也做了咱们的系主任。1991 年刚回国那时分,他带咱们一门课,咱们在那儿上机房,他来机房给咱们辅导。有问题他就能立刻给你主张,依照他的主张一试公然好使,那时分其实形象也挺深的。后来我硕士论文是跟着高教师做的,终究拿了个 863 测验的第一名。

《我国人工智能简史》:还有哪些教师对你有影响?

王海峰:赵铁军是带我结业设计的,李晓明给咱们上过课,他讲课讲得很好,还有方教师(左林右狸频道注:我国工程院院士方滨兴),他们都和海外有许多沟通,都自己在一线干活,能文能武,很厉害,哈工大核算机系那批教师真的很强。还有一批比咱们大不了多少的更年青的教师,咱们有更多的技能交小狂系列流和事务评论,比方陈熙林、程旭,还有李明树。陈熙林和程旭g8010是同学,他们算教师,但更像是师兄。

《我国人工智能简史》:同学里呢?

王海峰:我本科是班长,研讨生后也是班长,研讨生里咱们许多同学都很优异,刘挺、云晓春、杜跃进,陈晓明后来留校再读的研讨生,他是咱们本科一届的,但研讨生纷歧同。还有佟冬(左林右狸频道注:佟冬现为北京大学信息科学技能学院体系结构研讨所副教授),他是咱们本科、硕士、博士一同威斯欧的同学,李国东比咱们高一级,他和程旭他们一同玩,也和咱们一同玩。咱们这些同学都很勤勉,都很尽力,彼此激起,彼此促进。那真是一个黄金时代。

《我国人工智能简史》:博士结业后为什么没有挑选留校?

王海峰:李教师期望我留哈尔滨,高教师则期望我能留北京,但我想去工业界看一看,这首要是由于李开褚字怎样读复 1999 年上半年来哈工大做讲演,他和我谈天。那时分我快结业了,他就跟我聊结业想干啥,我说我搞了这么多年研讨,期望我的东西有用,李开复和我说,那你应该来微软,微软的产品全国际都用。这个打动了我,我想做东西给更多人的用。我就去微软(我国研讨院)了。

《我国人工智能简史》:你在学术和工业上的结合做得很好,有什么心得吗?

王海峰:我对研讨一向也很执着,也想搞,我如同一向两端都搞。要分身也不简单,但我仍是能找到一些点让它结合起来,我做研讨也不是说开小差做副业,对公司也有用。做的东西终究还能用,这个路能打通就比较好了。这个真的不简单,不是说听我两句主张就领会到了,这个还真是挺不简单的。

当然,现在时刻久了,这就会变成我的习气,但开端我仍是挺留意拿捏这种标准,比方说我做研讨时,觉得这个问题特别有爱好,可是还得衡量衡量这东西是不是有用,要没啥用,便是一个纯研讨,我或许也就放一放了,这个标准仍是要拿捏的,拿捏多了到后来逐渐地轻车熟路了,不需求再每天想着去怎样拿捏了。

《我国人工智能简史》:对年青学子生长有哪些主张?你朔风秋水个人的生长经历有哪些?

王海峰:我估量在百度这些年,到外面的、曾经在我团队里的工程师应该也有规划了,真的许多人培养出来在遍地都当技能的顶梁柱。带团队,尤其是工程师的团队,我有三个词:务实、自驱、担任究竟,这是根本的要求。技能功底一定要厚实,这个是没什么说的,这是你的根本技能,然后讲文明,要讲务实、自驱、担任究竟。

关于生长经历,我其实还会常常跟咱们讲别的四个词:膂力、精力、意志力和胸襟。我说具有了这四点,你才或许真实开展。这四个词里,要说重要性,都重要。但你要倒着看,要是胸襟不行,略微有点事就想不开,前面几样是不或许做到的,那身体也不或许好的。你的抱抱没有意志力也坚持不下去。胸襟要好,意志力要好,精力要够,膂力要好。

《我国人工智能简史》:学术界和工业界做研讨最大的差异是什么?

王海峰:咱们在工业界和学术界做的研讨有个很大的差异,我拿一些数据做测验跑,有改善,成果一出来,开端写文章,那就完毕了。工业界实际上是全流程的,从红通黄红回国投案最早的数据怎样收集明晰,然后去处理,练习模型,模型怎样迭代改善,然后有人用,再反应出来,全流程。不是你懂一些算法或许把握一些代码就行的,这个全流程很重要。一个产品终究做得好其实是端到端全流程优化的。

水蔗草

所以,咱们提炼一些这样的渠道沉积下来,其实是对工业价值更大的。

谨以此文献给奔向百年华诞的哈工大,问候那些为我国人工智能tamama二等兵产学研投做出过尽力、贡献过芳华的哈工大人。

CCF-GAIR 2019

由我国核算机学会主办、雷锋网和香港中文大学(深圳)联合承办的 2019 全球人工智能与机器人峰会,将于2019 年 7 月 12 日至 14 日在深圳举办。到时,诺贝尔奖得主JamesJ. Heckman、中外院士、国际顶会主席、闻名Fellow,多位重磅嘉宾将亲身坐阵,一同讨论人工智能和机器人范畴学、产、投等杂乱的生计态势。

智力大冲关
声明:该文观念仅代表作者自己,搜狐号系信息发布渠道,搜狐仅供给信息存储空间服务。

相关文章

标签列表