详解百度大脑5.0的黑科技:SMLTA 鸿鹄芯片 计算架构

人工智能 18kr 7℃

【18kr】7月3日,继今天上午百度AI开发者大会主论坛上百度CTO王海峰发布百度大脑5.0后,下午举办的百度大脑分论坛对5.0版进行了进一步的详细解读,对百度大脑5.0隐含的顶尖技术进行了一一揭晓。

百度大脑5.0是软硬一体AI大生产平台。百度大脑5.0打通了从基础层的深度学习技术到通用AI能力、应用技术方案,再到定制化模型,以及最终的部署和集成,整个人工智能产业化应用落地的全部流程,实现了AI技术的标准化、自动化和模块化。

SMLTA模型

百度语音技术部高级总监高亮介绍,识别方面,百度提出流式多级的截断注意力模型SMLTA,这是国际上首次实现局部注意力建模超越整句的注意力模型,也是国际上首次实现在线语音大规模使用注意力模型。SMLTA在大幅提升识别速度的同时,也提高了识别准确率。在输入法有效产品相对准确率提升15%,音箱有效产品相对准确率提升20%。合成方面,针对现阶段面临风格迁移、音色模拟和情感拟人的三大挑战,百度推出语音合成技术Meitron,可以将语音中的音色、风格、情感等要素映射到不同的子空间,在使用时,不同要素可以任意组合,灵活的控制合成语音的风格。同时降低语言合成门槛,仅需20句话就可以制作一个人的专属声音。

鸿鹄芯片

百度大脑语音团队研发出一款针对远场语音交互打造的芯片——百度鸿鹄芯片。鸿鹄芯片的设计,变革传统芯片设计方法,遵循“软件定义芯片”的全新设计思路。该芯片采用双核HiFi4架构,2.8M大内存,台积电40nm工艺,在此硬件规格上,100mw左右平均工作功耗,即可支持远场语音交互核心的阵列信号处理和语音唤醒能力。同时,按照车规级标准打造使鸿鹄芯片可满足极严格的需求,将为车载语音交互,以及智能家居等场景带来更大想象力。鸿鹄芯片流片的同时,即实现了量产。

百度视觉技术部、增强现实技术部总监吴中勤介绍了人本次全新发布视觉语义化平台2.0,正在推进视觉技术由“看清看懂”向“交互”进行升级。视觉语义化平台2.0在交互升级和软硬件结合两大方面实现突破。

视觉语义化平台2.0更新了许多先进的感知技术,也让机器人技术实现新突破。百度三维视觉首席科学家杨睿刚介绍,机器人就是一个智能体,除了感知技术,智能体需要决策和动作相关的技术,实现从环境感知到主动感知。目前,百度研究的智能体技术主要集中在自动驾驶Apollo、工程机械和服务机器人三大方面。上午主论坛中引人关注的机械臂“茶博士”不仅能说会道,还完成了传统的长嘴壶倒茶工作,其背后依靠的正是服务机器人方案。

ERNIE框架

在语言和知识技术方面,百度大脑也公布了一系列创新和突破。百度AI技术平台体系执行总监吴甜介绍,百度设计并实现了知识增强的语义理解框架——ERNIE,具备可持续学习能力,核心模型能力不断提升。

目前,ERNIE累计学习了超10亿知识,全面刷新中文NLP任务的指标,在百度众多产品应用中提升效果。机器同传方面也有最新进展,在翻译过程中对语音识别结果进行纠错的联合词向量编码技术,可解决多轮翻译一致性和连贯性问题的语篇翻译模型等,结合先进的语音技术,百度大脑实现了高准确、低时延的机器同传技术。

新一代AI计算架构

百度副总裁侯震宇为现场观众分享了百度新一代AI计算架构。面对AI计算的挑战,需要能够从端到端来提供AI计算能力,这要求计算系统从旧有的对海量数据处理能力、对IO高峰值的追求,转变为满足AI训练功能方面IO密集、计算密集、通信密集的需求,和AI推理功能方面大吞吐和低延迟的需求。

除了上述提及的技术外,百度大脑还研发了多项其他顶级技术,同时百度大脑仍将不断开放赋能,目前已经开放210余项领先的AI技术能力,平台的调用次数同比增长108%。定制化平台模型的数量都在飞速增长,平台上的开发者数量已经达到了130万。

转载请注明:18克 » 详解百度大脑5.0的黑科技:SMLTA 鸿鹄芯片 计算架构

喜欢 (0)

关注移动互联网

联系我们