中科院自动化所发布通用AI平台可实现图文音“无缝转换”

新华社2021年07月13日09:11分类：数字经济

新华社2021年07月13日09:11

阅读量：

核心提示：虚拟人“小初”日前亮相2021世界人工智能大会，展示了图、文、音三种模态的智能转换和生成。“小初”具备这样的能力，得益于中国科学院自动化研究所研发的一个名为“紫东太初”的跨模态通用人工智能平台。

新华财经北京7月13日电（记者董瑞丰）从检索图像、描述视频，到吟诗作赋、续写文章，再到识别语音、双语翻译，虚拟人“小初”日前亮相2021世界人工智能大会，展示了图、文、音三种模态的智能转换和生成。

“小初”具备这样的能力，得益于一个名为“紫东太初”的跨模态通用人工智能平台。该平台由中国科学院自动化研究所研发，基于国产化基础软硬件，仅采用一个大模型，即可“锻炼”人工智能在视觉、文本、语音多个场景的理解能力。

中科院自动化所所长徐波介绍，“大数据+大模型+多模态”将改变当前单一模型对应单一任务的人工智能研发范式，多模态大模型将成为不同领域的共性平台技术，是迈向通用人工智能的重要路径探索。

“‘紫东太初’实现了图、文、音三种模态的统一表达，以图生音，以音生图，将开拓AI在视频配音、语音播报、标题摘要、海报创作等更多元场景的应用。”徐波说。

据了解，中科院自动化所构建了中文预训练模型、语音预训练模型、视觉预训练模型，并通过跨模态语义关联，构建了三模态预训练大模型。（完）

编辑：王溯

免责声明：新华财经为新华社承建的国家金融信息平台。任何情况下，本平台所发布的信息均不构成投资建议。

新华社民族品牌工程：服务民族企业，助力中国品牌

[责任编辑：王溯]

中科院自动化所发布通用AI平台 可实现图文音“无缝转换”