中国新闻网-上海新闻
上海分社正文
阿里巴巴发布最新AI大模型系列 核心模型面向全球开发者开源开放
2022年09月02日 20:15   来源:中新网上海  

  中新网上海新闻9月2日电 (记者 李佳佳)阿里巴巴达摩院副院长周靖人2日在上海举行的世界人工智能大会“大规模预训练模型”主题论坛上,发布了阿里巴巴最新“通义”大模型系列,并宣布相关核心模型向全球开发者开源开放。

  近年来,大模型表现出前所未有的理解与创造能力,且打破了传统AI(人工智能)只能处理单一任务的限制,让人类离通用人工智能的目标近了一步。但大模型仍存在许多技术难点,同时受算力资源限制,其训练与落地应用颇具挑战。

  据周靖人介绍,为了让大模型更加“融会贯通”,达摩院在中国国内率先构建了AI统一底座,在业界首次实现模态表示、任务表示、模型结构的统一。

  在不引入新增结构的情况下,通义统一底座中M6-OFA模型,可同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等10余项单模态和跨模态任务,且效果达到国际领先水平。

  “大模型模仿了人类构建认知的过程,这是当下我们面临的重要机遇。通过融合AI在语言、语音、视觉等不同模态和领域的知识体系,我们期望多模态大模型能成为下一代人工智能算法的基石,让AI从只能使用‘单一感官’到‘五官全开’,且能调用储备丰富知识的大脑来理解世界和思考,最终实现接近人类水平的认知智能。”周靖人表示。

  同时,达摩院构建了层次化的模型体系,其中通用模型层覆盖自然语言处理、多模态、计算机视觉,专业模型层深入电商、医疗、法律、金融、娱乐等行业。

  通过部署超大模型及轻量化版本,阿里巴巴“”通义”大模型系列已在超过200个场景中提供服务,实现了2%-10%的应用效果提升。典型使用场景包括电商跨模态搜索、AI辅助设计、开放域人机对话、法律文书学习、医疗文本理解等。(完)

注:请在转载文章内容时务必注明出处!   

编辑:李佳佳  

5
本网站所刊载信息,不代表中新社和中新网观点。 刊用本网站稿件,务经书面授权。
未经授权禁止转载、摘编、复制及建立镜像,违者将依法追究法律责任。
常年法律顾问:上海金茂律师事务所