阿里 “扫地僧” 入职腾讯三个月便跳槽京东,通义AI人才频频被挖
鄢志杰是智能语音领域的技术大牛。公开资料显示,2003年,鄢志杰大学本科毕业,升入中科大语音实验室,攻读博士学位,师从语音领域专家王仁华教授(科大讯飞创始人之一,曾任科大讯飞公司董事长)。
鄢志杰2008年在中国科学技术大学语音实验室获博士学位之后,至2015年在微软亚洲研究院语音组任主管研究员。研究领域主要包括语音识别、语音合成、声纹、语音交互、手写及光学字符识别等。
鄢志杰曾在语音及文本识别领域顶级学术期刊及会议发表多篇论文,长期担任语音领域顶级学术会议及期刊的专家评审,并拥有多项美国及PCT专利。
2015年加入阿里巴巴后,鄢志杰曾担任阿里IDST智能语音交互团队总监。“IDST”也被外界称为阿里最神秘的部门之一,它是达摩院下一代颠覆性人机交互技术和用户体验方面的核心团队,其研究成果被转化并应用于阿里集团、蚂蚁集团及微软公司多项语音相关产品中。
2017年10月,马云发起创办达摩院,分为机器智能、数据计算、机器人、金融科技、X实验室(量子计算)5大领域。其中,最为强大的领域是机器智能领域,下辖5大实验室,分别是:语音实验室、视觉实验室、语言技术实验室、决策智能实验室、城市大脑实验室。鄢志杰担任达摩院机器智能语音实验室负责人,成为彼时达摩院的十三位“扫地僧”之一(最初的核心成员)。
当其在今年2月离职后,市场普遍猜测其会自己进行AI创业,但随后证实其加入腾讯AI Lab出任副主任。
不过随着腾讯在4月进行了TEG架构重组,原AI Lab与多个研究团队被拆解并整合为“大语言模型部”和“多模态模型部”,改由副总裁蒋杰直接统领。这或许是其再次离职的核心原因。
京东本次引入鄢志杰,显然意在补齐其在语音交互与大模型融合上的关键短板。
随着目前AI发展到深水区,如何解决多模态大模型,尤其是以语音为底座完成交互的AI能力,一直是京东战略的核心。鄢志杰的加入,或许将为京东带来一次真正意义上的语音技术“系统升级”。
这些技术陆续落地通义千问 App,并在社交媒体上引发广泛关注。其中,人物动作、换装、替身与唱演四大生成能力,“兵马俑跳科目三”等爆款技术被认为是阿里在对抗OpenAI Sora 等强劲竞争对手时的关键技术底牌,并曾作为展示重点亮相 2024 中国生成式 AI 大会。
而在AI领域,阿里也一直是其他大厂挖人的首选对象。
2024年7月,原阿里通义千问大模型技术负责人周畅(花名 “钟煌”),表面上以 “创业” 为名,实则带领十余名核心成员加入字节跳动,任豆包大模型视觉多模态生成方向负责人。
有各种渠道消息传说,字节为其提供了阿里的5倍薪资及4-2的职级(相当于阿里的P12+),总包达到了千万年薪。
此前,阿里 AI 相关产品收入已经连续六个季度保持三位数增长,如今却面临着核心高层流失的压力。未来,阿里能否快速完成团队重组、优化人才激励机制,将直接关系到其大模型战略能否继续保持竞争力。
本文系观察者网独家稿件,未经授权,不得转载。
1、我家本地的最大寺院,不收门票,上香免费领取,我感觉这才是比较正规的寺院
2、越南河内房价飙升:年轻人月入5000万仍买不起房,在越南河内买一套房多少钱?
3、乌克兰空军开始新单位北约化,老单位野战化,乌克兰北约化进展