中新网上海新闻1月25日电(高志苗)大模型的讨论,2024年开年热度不减。24日,岩芯数智召开“新架构,新模力”大模型发布会,正式发布了通用自然语言大模型——Yan模型。
作为上海岩山科技股份有限公司旗下的科技创新型人工智能企业,上海岩芯数智人工智能科技有限公司(以下简称“岩芯数智”)是国内较早布局人工智能大模型的企业之一,始终坚持技术创新和产品研发,为社会提供可控、可信的 AI 解决方案。
据悉,Yan模型也是业内少有的非Transformer架构大模型。拥有相较于同等参数Transformer的7倍训练效率、5倍推理吞吐、3倍记忆能力,同时支持CPU无损运行、低幻觉表达、100%支持私有化应用。
上海市人工智能技术协会秘书长朱伟民发表开场致辞时提出,AIGC是未来人工智能产业发展的重要趋势,将重塑内容与平台的生态和商业模式。推动AIGC技术研发与应用的深度融合,已成为构建开创安全、多模态人工智能新生态的关键路径。
岩芯数智CEO刘凡平围绕Yan架构的诞生和优势与在场观众进行分享。Transformer作为GPT、LLAMA、PaLM等大模型的基础架构,虽然已经取得了显著的成功,但它仍存在算力消耗、显存占用、成本高昂以及难以处理长序列数据等诸多缺陷。因此,岩芯数智的研究团队历经近1000多个日夜,超过几百次的设计、修改、优化、对比、重来,自主研发出了不再依赖Transformer的全新架构——“Yan架构”,同时,基于Yan架构的通用大模型应运而生。
刘凡平表示:“我们期望Yan架构可作为人工智能领域的基础设施,并以此建立AI领域的开发者生态,最终让任何人在任何设备上都能使用通用大模型,获取更加经济、便捷、安全的AI服务,推动构建普惠的人工智能未来。”(完)
注:请在转载文章内容时务必注明出处!
编辑:高志苗