对话后摩智能CEO吴强:未来90%的数据处理可能会在端边
作为主打端边大模型和存算一体的芯片企业,后摩智能这次带来的M50芯片专为大模型推理设计,主要面向AI PC(人工智能个人电脑)、智能终端等场景。
他认为,未来的计算格局有可能是端、边、云的混合体,但是90%的数据处理可能会在端和边,只有10%的训练算到云端做更昂贵或者更复杂的任务在云端做。
后摩智能创立于2020年,创立早期定位为基于存算一体技术的大算力AI(人工智能)芯片研发企业。创始人吴强拥有美国普林斯顿大学博士学位,曾任地平线CTO(首席技术官)。
M50芯片被视为后摩智能过去两年交出的一份答卷。
吴强曾表示,国产替代的企业可以对标海外的某类产品,但绝不能用同样的技术路径进行照搬,如英伟达、AMD等国际巨头的研发、工程、供应链能力远超过初创企业,硬碰硬难以取得成功,创业公司需要另辟蹊径,以一种差异化的技术路线来应对和巨头们之间的竞争。
当前,后摩智能通过存算一体技术与大模型的深度融合,推动AI大模型在端边侧实现“离线可用、数据留痕不外露”。
吴强称,M50芯片的发布是后摩智能现阶段迈出的重要的一步,后面会推出更多的芯片去解决端边大模型的算力和功耗问题以及带宽问题。“长期来说,后摩希望定位在端边AI计算。”
图源:观察者网
吴强还披露了当下后摩智能的意向客户,包括联想的下一代AI PC产品、讯飞听见的下一代智能语音设备以及中国移动的全新一代的5G+AI边缘计算设备等。
“目前我们看重几个领域,一是平板和电脑这种消费终端类,大模型是生产力工具。二是智能语音系统,大模型语音会议也是我们重点布局的方面。三是运营商的边缘计算,5G+AI是一个趋势。”他说道。
吴强还提到,机器人包括具身智能机器人(特指陪伴机器人),更像是十年前的智能驾驶,是一个新兴的垂直赛道,格局还未定,“大家还有机会”。
“只要是端边,只要对大模型有需要,对功耗敏感,都有可能是我们的客户,需要我们逐步地拓展。目前大方向是消费终端、智能办公、智能工业,机器人也算其中,这是我们重点在布局的几个领域。”他表示。
面向未来,后摩智能已启动下一代DRAM-PIM技术研发,通过将计算单元直接嵌入DRAM阵列,使计算与存储的协同更加紧密高效。该技术将突破1TB/s片内带宽,能效较现有水平再提升三倍,推动百亿参数大模型在终端设备实现普及,让更强大的AI算力能够融入PC、平板等日常设备。
本文系观察者网独家稿件,未经授权,不得转载。
1、祝贺!中国队获得游泳世锦赛男女4x100米混合泳接力银牌,中国男女混合4x100接力游泳世界纪录
2、华安基金人事变动:原招商基金总经理徐勇接任党委书记,将迎接合并挑战原招商基金总经理徐勇已经入职华安基金,接任华安基金党委书记。
3、和欧洲人辩论的时候很麻烦,标注引入来源,要不他们就嘴硬的很,和欧洲人聊天话题