中国新闻网-上海新闻
上海分社正文
加速产业数智化升级 岩芯数智发布全新通用大模型
2024年01月25日 11:47   来源:中新网上海  

  中新网上海新闻1月25日电(高志苗)大模型的讨论,2024年开年热度不减。24日,岩芯数智召开“新架构,新模力”大模型发布会,正式发布了通用自然语言大模型——Yan模型。

“新架构,新模力”大模型发布会现场。主办方供图
“新架构,新模力”大模型发布会现场。主办方供图

  作为上海岩山科技股份有限公司旗下的科技创新型人工智能企业,上海岩芯数智人工智能科技有限公司(以下简称“岩芯数智”)是国内较早布局人工智能大模型的企业之一,始终坚持技术创新和产品研发,为社会提供可控、可信的 AI 解决方案。

  据悉,Yan模型也是业内少有的非Transformer架构大模型。拥有相较于同等参数Transformer的7倍训练效率、5倍推理吞吐、3倍记忆能力,同时支持CPU无损运行、低幻觉表达、100%支持私有化应用。

  上海市人工智能技术协会秘书长朱伟民发表开场致辞时提出,AIGC是未来人工智能产业发展的重要趋势,将重塑内容与平台的生态和商业模式。推动AIGC技术研发与应用的深度融合,已成为构建开创安全、多模态人工智能新生态的关键路径。

  岩芯数智CEO刘凡平围绕Yan架构的诞生和优势与在场观众进行分享。Transformer作为GPT、LLAMA、PaLM等大模型的基础架构,虽然已经取得了显著的成功,但它仍存在算力消耗、显存占用、成本高昂以及难以处理长序列数据等诸多缺陷。因此,岩芯数智的研究团队历经近1000多个日夜,超过几百次的设计、修改、优化、对比、重来,自主研发出了不再依赖Transformer的全新架构——“Yan架构”,同时,基于Yan架构的通用大模型应运而生。

  刘凡平表示:“我们期望Yan架构可作为人工智能领域的基础设施,并以此建立AI领域的开发者生态,最终让任何人在任何设备上都能使用通用大模型,获取更加经济、便捷、安全的AI服务,推动构建普惠的人工智能未来。”(完)

注:请在转载文章内容时务必注明出处!   

编辑:高志苗  

本网站所刊载信息,不代表中新社和中新网观点。 刊用本网站稿件,务经书面授权。
未经授权禁止转载、摘编、复制及建立镜像,违者将依法追究法律责任。
常年法律顾问:上海金茂律师事务所