报告显示:中国人工智能大模型已发布79个
在5月28日举办的中关村论坛人工智能大模型发展分论坛上,由中国科学技术信息研究所、科技部新一代人工智能发展研究中心联合相关研究机构编写的《中国人工智能大模型地图研究报告》正式发布。
据中国科学技术信息研究所党委书记、所长,科技部新一代人工智能发展研究中心主任赵志耘介绍,以ChatGPT为代表的人工智能大模型引领新一轮全球人工智能技术发展浪潮,大模型相关新研究、新产品竞相涌现。中国前期在人工智能领域的各项部署为大模型发展奠定了坚实基础,在政产学研各方共同推动下,建立起涵盖理论方法和软硬件技术的体系化研发能力,大模型研发呈现蓬勃发展态势。该报告借助大模型地图的可视化方式,分析了中国大模型阶段性发展特征,描绘中国大模型发展最新全貌,也揭示大模型发展中尚存在的问题与不足,希望对中国大模型未来发展有所促进。
大模型技术群快速壮大
报告对全球大模型技术发展脉络进行梳理发现,自谷歌2017年发布的Transformer网络结构以来,仅用五年多时间全球已迅速成长出庞大的大模型技术群,衍生出涵盖各种技术架构、各种模态、各种场景的大模型家族。
中美引领全球大模型发展
报告分析发现,美国谷歌、OpenAI等机构不断引领大模型技术前沿。欧洲、俄罗斯、以色列、韩国等地越来越多的研发团队也在投入大模型的研发。从全球已发布的大模型分布来看,中国和美国大幅领先,超过全球总数的80%,美国在大模型数量方面始终居全球最高。
中国大模型呈现蓬勃发展态势
中国自2020年进入大模型快速发展期,目前与美国保持同步增长态势。在自然语言处理、机器视觉和多模态等各技术分支上均在同步跟进、迅速发展,涌现出盘古、悟道、文心一言、通义千问、星火认知等一批具有行业影响力的预训练大模型,形成了紧跟世界前沿的大模型技术群。
中国大模型分布地图
报告基于公开信息梳理分析了中国已发布的79个大模型,分析结果显示,目前中国在14个省市/地区均有团队在开展大模型研发,北京、广东两地最多,地域集中度相对较高。从领域分布来看,自然语言处理仍是目前大模型研发最为活跃的重点领域,其次是多模态领域,在计算机视觉和智能语音等领域的大模型还较少。国内大学、科研机构、企业等不同创新主体都在积极参与大模型研发,学术界与产业界之间的联合开发相对较少。
中国大模型算力要素地图
报告通过调研全国范围内的算力基础设施分布情况发现,北京、广东、浙江、上海等地的大模型数量最多,同时这4个地方也是近三年人工智能服务器采购数量最高的地区,表现出非常明显的强相关性,为大模型研发应用提供了重要支撑。同时,各地也在通过提供公共算力方式补充快速增长的人工智能算力需求,为大模型研发提供更多算力支撑。
中国大模型人才要素地图
大模型具有较高门槛,需要高素质AI人才。报告结果显示,从数量上看目前各地大模型人才仍不充足。报告统计了国内人工智能相关论文的作者,从区域分布上看,北京不论在人工智能学者数量方面还是大模型学者数量方面都遥遥领先于其它地区,体现出明显的人才储备优势,江苏、广东、上海也是大模型人才相对较多的地区。
中国大模型学术影响力地图
报告认为,中国大模型通过学术论文发表方式已经形成一定学术影响力。其中北京、广东、上海三地不论是论文发表量还是引用量都居国内最高。
中国大模型学术影响力前十
从模型影响力方面看,清华大学与阿里和百度联合开发的CogView模型论文引用数最高,华为的FILIP、百度的ERNIE3.0以及阿里的M6-OFA引用数也位居国内前列,在大模型领域形成了较好的学术影响力,但与国外领先大模型的学术影响力相比差距仍然较大。
中国大模型开源影响力地图
开源开放是人工智能研发协作的重要模式,也是中国人工智能发展重要理念。报告分析发现,中国大模型研发团队积极推进大模型开源发展,目前已经有超过半数大模型实现开源。北京、广东、上海三地开源数量和开源影响力均居国内前三。
中国大模型开源影响力前十
报告显示,目前大模型开源更多是高校和机构在推动,清华大学的ChatGLM-6B、复旦大学的MOSS以及百度的文心系列大模型已形成最高的模型开源影响力。
通用模型与专用模型并行发展
报告分析认为,目前中国大模型产业化应用大致出现两种并行的发展路径,文心一言、通义千问、紫东太初等一批通用化大模型正在快速发展,打造跨行业通用化人工智能能力平台,其应用行业正在从办公、生活、娱乐向医疗、工业、教育等加速渗透。
与此同时,一批针对生物制药、遥感、气象等垂直领域的专业类大模型,正在发挥其领域纵深优势不断深化落地,提供针对特定业务场景的高质量专业化解决方案。
赵志耘指出,大模型技术推动人工智能实现了一次历史性跨越,未来仍有广阔的持续创新空间。中国经济社会高质量发展为大模型创新提供了丰富场景和数据基础,人工智能在中国发展潜力巨大。建议加强资源和研发力量统筹,促进大模型有序发展;加快基础研究和技术创新,提升学术和开源影响力;强化大模型发展中的场景牵引作用,打造大模型标杆项目;强化国际合作,积极参与全球人工智能治理。(经济日报记者 佘惠敏)
责编:胡盼盼
一审:胡盼盼
二审:曹娴
三审:李伟锋
来源:经济日报