中新网上海新闻3月29日电(郑莹莹)2026全球开发者先锋大会“语料筑基、智生时代”主题论坛28日在上海举行。
论坛由全球开发者先锋大会组委会指导,全球开发者先锋大会组委会办公室、上海库帕思科技有限公司、上海人工智能实验室主办。上海市国资委副主任、一级巡视员陈东,上海市经信委副主任潘焱出席论坛并致辞。
本次论坛以“语料筑基、智生时代”为主题,聚焦语料数据如何更好支撑模型训练、智能体开发和场景落地,重点突出应用导向、普惠开源和生态协同。
陈东在致辞中表示,当前以大模型、多模态、智能体为代表的新一轮人工智能技术正在加快演进,国资国企既是产业发展的推动者,也是技术应用的重要场景提供者。近年来,上海持续深化国企AI+行动,推动AI应用从“单点突破”向“系统赋能”跃升,重点从强化基础支撑能力、促进场景开放共建、营造开放协同创新生态三个方面持续发力。希望通过本次论坛和大赛,让更多优秀创意在上海汇聚、更多创新成果在上海落地、更多青年人才在上海成长。
潘焱在致辞中表示,当前人工智能正加快进入应用落地新阶段,产业竞争正在从“拼算法”向“拼数据”转变,高质量语料数据已成为人工智能发展的重要胜负手。近年来,上海持续实施“模塑申城”工程,在语料供给、平台建设和生态营造等方面取得显著成效。下一步,上海将围绕语料关键技术攻关、行业高价值流程语料建设和OPC等新业态培育持续发力,更好支撑模型训练、智能体开发和行业应用。

过去一年,模塑申城语料普惠计划持续为中小企业、高校师生、创新创业者提供低成本、高质量、可持续的语料服务。今年,该计划正式升级至2.0版本,延续“普惠、创新、链接”的总体要求,在原有基础上进一步增强应用导向;聚焦科学智能,提供“高真值、多模态、过程化”语料数据供给服务;面向OPC群体,提供更加轻量化、低成本的语料服务支撑。
另外,2026 CICC语料数据智能创意大赛暨MinerU数据智能与前沿语料挑战赛启动。本届大赛聚焦语料数据智能创新与前沿应用探索,面向开发者搭建交流展示、同台竞技和成果转化的平台。大赛围绕“语料支撑、场景牵引、应用落地、生态共建”的发展路径,设置三个赛道:MinerU数据智能与前沿语料挑战赛、场景开放与行业应用挑战赛、智能体开放主题黑客松挑战赛。大赛也将进一步面向社会寻找好场景、好应用、好技术、好团队。
国资国企拥有丰富的业务场景、数据资源和应用需求,是推动人工智能赋能实体经济的重要阵地。2026国资国企AI+场景征集正式启动,进一步面向重点行业、重点企业、重点任务梳理形成一批可落地、可复制、可推广的AI+应用场景,推动真实业务需求加快转化为模型训练需求、智能体开发机会和产品落地空间。
围绕科学智能发展需求,论坛举行共建高质量科学数据签约仪式。当前,科学研究正加快从“文献驱动”迈向“数据驱动、模型驱动、实验验证驱动”深度融合的新阶段。此次签约将进一步把上海在科学智能领域的优势资源组织起来、联动起来,推动高质量科学数据的汇聚、治理、加工与应用,为AI4S发展夯实数据底座。签约代表来自上海市研发公共服务平台管理中心、上海人工智能实验室、蛋白质科学研究(上海)设施、上海科学智能研究院、上海创智学院及相关科研机构和企业。
徐汇作为上海人工智能创新策源的重要载体,正加快打造更加便捷、高效、可获得的语料服务体系。当天发布的徐汇语料惠享专区,专为徐汇区AI企业打造,重点服务OPC创业者,提供开箱即用的AI-ready高质量语料。
2026语料风云榜也再次启航,将继续围绕“好企业、好产品、好规则”的基本框架,在未来三个月开展征集与遴选,并于2026世界人工智能大会期间正式发布“2026中国语料生产商风云榜TOP10”“2026中国语料服务商风云榜TOP10”。
在主旨演讲和圆桌对话环节,来自科研机构、创新平台、产业企业、投资机构和创业一线的专家,围绕科学数据建设、数据加工技术、行业场景落地、未来产业投资、OPC生态位重构、数据潜能释放以及具身智能发展趋势等议题展开深入交流。论坛讨论既聚焦高质量语料数据如何更好支撑模型训练和智能体开发,也关注人工智能如何加快驶入城市交通等真实场景;既讨论“好数据”如何形成,也回应“好技术”如何突破、“好应用”如何涌现。圆桌对话进一步把视角延伸到具身智能前沿,从技术成熟度、产业节奏、产品形态到生态机会,嘉宾们围绕“具身智能的ChatGPT时刻:渐近,还是已至?”展开交流,呈现从语料底座、技术能力到行业应用、产业生态的多方面进展。(完)
注:请在转载文章内容时务必注明出处!
编辑:李秋莹






