“人工智能,跑出光谷未来。”10月底,光谷马拉松鸣枪开跑,由武汉人工智能研究院(以下简称“武智院”)院长王金桥领跑的人工智能方阵,喊出了自己的口号。
作为聚焦跨模态智能国际前沿研究方向的新型研发机构,武智院致力于打造新一代人工智能技术创新策源地和产业发展高地,是中国科学院自动化研究所以技术创新带动产业发展、加速推动人工智能创新成果规模化应用的创新平台。
2022年,武智院在第一建设年度,依托光谷的产业优势、人才优势和算力优势,联合中国科学院自动化研究所相继推出了全球首个全模态大模型“紫东太初”2.0、“紫东太初”人工智能开放服务平台和“江城洛神”AI创作平台等创新成果,不断夯实数字经济的智能底座,持续赋能千行百业。
随着以武智院为代表的一批优质创新载体的不断壮大,有着35年历程的光谷正加快打造国内具有重要影响力的人工智能创新核心区、应用先导区、产业集聚区。“未来需要大家聚在一起,向着目标不断前进。”王金桥说。
■ “国家队”扛国家责,敢为人先勇创新
刚刚举行的2023中国5G+工业互联网大会是该领域首个国家级大会。在大会创新成果展上,武智院推出的数字人“小初”引人驻足,继去年首秀上演“吟诗作赋”后,它又现场展示了一段萨克斯演奏曲,引得众人喝彩。
数字人“小初”由“紫东太初”大模型孕育而来。“我们是国内最早开始大模型研究的团队之一。”王金桥介绍,继全球首个千亿参数多模态大模型“紫东太初”1.0后,武智院在今年6月再度发布“紫东太初”大模型2.0,研究突破了认知增强的多模态关联等关键技术,使大模型具备全模态理解能力、生成能力和关联能力。
“请为5G+工业互联网大会写一篇新闻稿件。”大会期间举行的人工智能赋能新型工业化平行会议上,王金桥向“紫东太初”发问。短短几秒钟,一篇流畅的新闻稿便“跃然纸上”。
“多模态能力进一步提升,语言能力持续优化。”王金桥介绍,迭代升级后的“紫东太初”大模型不仅能读懂文字、图像和音频,还能理解视频、3D点云、传感信号,可以结合图像、声音和视频完成场景分析,其理解和生成能力更加接近人类,向通用人工智能迈出关键一步。
“如何让人工智能更像人?更聪明?我们需要不断地做试验,不断地调整技术方案。”武智院副院长张家俊研究员说,相比绝大多数的语言类大模型,如何让大模型拥有更强的感知能力和理解能力,像人一样学习、感知世界、处理各种各样的信号,是一个非常有挑战和创新的任务。
得益于中国科学院自动化研究所“紫东太初”团队在人工智能领域的多年积累,武智院先人一步选择了多模态大模型这条更艰难的路。“‘国家队’要扛国家责,敢为人先勇创新,敢于闯‘无人区’,敢于在这条路上探索一条属于自己的路。”王金桥说,站上赛道,就一定要跑完。
早布局、大投入、守匠心,继荣获2022世界人工智能大会最高奖SAIL奖(Super AI Leader,即卓越人工智能引领者)后,今年8月,“紫东太初”大模型获2023中国算力大会年度突破成果奖,成为该奖项中唯一的大模型获奖者。
“坚信多模态是未来大模型技术发展的趋势,坚持走全栈国产化路线,不盲从、不跟风,产出属于自己的大模型。”中国科学院自动化研究所所长、武智院首席科学家徐波说。
■ 拥抱AIGC,不断丰富产品矩阵
人工智能赋能新型工业化平行会议上,王金桥发布面向工业互联网的“紫东太初”开放服务平台。依托该平台,在医疗器械领域,已实现一万种手术器械的自动化管理。“赋能工业制造,成为工业数字化转型的‘超级大脑’。”王金桥说。
3个多月前,全栈国产化、支持低代码一站式开发的“紫东太初”大模型开放服务平台2.0正式发布,具备开箱即用、快速定制、一键部署以及多种交付等四大特性。
“既要授之以鱼,更要授之以渔。”王金桥说,使用大模型开放服务平台2.0提供的微调开发工具链,仅需准备少量行业数据和简单的步骤,即可在平台上训练并部署用户的专属模型,“希望各个企业、行业都可以通过大模型来开发行业大模型,而不需要敲下一行行代码”。
基于“紫东太初”多模态大模型,武智院已构建了丰富的产品矩阵。
今年9月,武智院联手首都在线,共同上线“照片说话”应用。创作时,用户仅需要上传自己的真实人物照片,即可一键实现训练、微调、部署自己的算法模型,让照片动起来。“除了方言,还擅长全球200多种语言。”王金桥说。
在“照片说话”应用推出的同一时刻,毗邻星河广场的光谷资本大厦内,一场人工智能AI艺术展正在展出。在现场体验区,参观者只需要输入几个关键词或简单的文本描述,就能通过“江城洛神”AI内容创作平台生成一幅独一无二的绘画作品,实现“妙语生画”。
“江城洛神”是武智院基于“紫东太初”大模型推出的AI内容创作平台,通过多模态技术实现图像编辑与生成,辅助内容生产。这一名称来源于《洛神赋图》,这是现存中国古代绘画中第一幅改编自文学作品的画作。“在人工智能时代,每个人都能成为自己的创作者。”武智院创投转化部总监刘昊说。
“人工智能时代已经到来,正在快速改变我们的生活和审美。”本次展览的策展人、华中科技大学建筑与城市规划学院副院长蔡新元说,未来的设计师必须学会和人工智能合作,勇敢地拥抱这个伟大的时代。
“AIGC(生成式人工智能)已经进入大众的生活”,在王金桥看来,人工智能未来的10年将是AIGC的10年,“如果说这个赛道有1万米,现在才刚刚跑了100米”。
■ 赋能千行百业,实现规模化应用
工厂AI 质检、培养“未来教师”、实现医疗器械和耗材的数字化……不只是作诗更会做事,当人们对人工智能大模型的认知还停留在吟诗作赋、“妙语生画”之时,“紫东太初”大模型已然融入行业场景,成为高质量发展新引擎。
2021年底,中国科学院自动化研究所牵头组建多模态人工智能产业联合体,秘书处设在武智院,旨在以“紫东太初”的示范化应用为基础,打造多模态人工智能产业战略力量。截至目前,已陆续吸纳百余家单位和企业加入。“大模型技术尚在发展初级,核心是解决落地问题。人工智能作为使能技术,必须要与应用结合才能发挥作用。”徐波说。
联合体单位、九州通医疗器械集团项目总监徐琳介绍,今年初,九州通携手武智院,历经半年,完成骨科内植入耗材系统“骨科嫦娥”智慧系统研发,实现对骨科复杂植入物和工具的智慧识别和全程追踪,以及术前、配送、术中、术后全流程系统管控。
“原来一个手术订单要半小时出库,现在几分钟就能完成。”“骨科嫦娥”智慧系统带来的效率提升让徐琳赞不绝口。她说,公司从需求端、应用端和武智院合作,用人工智能解决痛点、难点,让骨科服务智慧化。
教案生成、作业评价、多元辅导、数字人教师……联合体单位、华中师范大学与武智院合作,探索如何利用“紫东太初”大模型实现教育场景的变革。“人工智能和教育双向赋能,促进教育变革的同时,也推动人工智能的演进。”华中师范大学人工智能教育学部教授周东波说。
“立足武汉、辐射中部、服务全国,赋能千行百业。”王金桥介绍,目前“紫东太初”大模型已成功应用于汽车制造质检、媒体信息服务、文化旅游、手语教育、纺织生产质检、医疗器械等10余个领域,形成规模化应用落地。
数据显示,作为武汉国家新一代人工智能试验区的核心承载区,光谷已聚集包括武智院在内的人工智能相关企业800余家,产业规模在全市占比超过八成,围绕智能制造、智慧医疗、智能驾驶等重点领域形成了一批可复制、可推广的标杆性示范应用场景。
王金桥表示,未来武智院将继续深耕大模型领域,提高大模型技术能力,迭代大模型版本,推进大模型赋能各行各业产业升级,不断推动人工智能产业链的拓展延伸,促进区域经济高质量发展。