中国新闻网-上海新闻
上海分社正文
相关合作研究成果登上Nature子刊 商汤以生成式AI助力医疗大模型迭代
2023年09月12日 19:18   来源:中新网上海  

  中新网上海新闻9月12日电(郑莹莹)商汤科技联合行业合作伙伴,结合生成式人工智能和医疗图像数据的多中心联邦学习发表的最新研究成果《通过分布式合成学习挖掘多中心异构医疗数据》(Mining Multi-Center Heterogeneous Medical Data with Distributed Synthetic Learning)近日登上国际知名学术期刊Nature的子刊《自然-通讯》(Nature Communications)。

  该论文提出一个基于分布式合成对抗网络的联邦学习框架DSL(Distributed Synthetic Learning),可利用多中心的多样性医疗图像数据来联合学习图像数据的生成。

  深度学习模型需要大量且多样性的数据“喂养”,但医疗领域对用户个人隐私保护有着极高的要求,这使得用于模型训练的医疗数据,在多样性和标注质量上都受到限制,也使多中心的医疗数据收集和医疗AI模型的开发迭代面临较大的挑战。

  与主流的联邦学习模式不同的是,DSL框架的学习目标是数据生成器,而非具体应用的任务模型。该分布式架构由一个位于中央服务器的数据生成器和多个位于不同数据中心的数据鉴别器组成。在学习过程中,中央生成器负责生成“假”的图像数据,并发送给各个数据中心,各个数据中心用本地的真实数据和收到的“假”数据进行对比后将结果回传给中央服务器,并基于反馈结果训练中央生成器生成更仿真的图像数据。分布式的合成学习结束之后,中央生成器可以作为“数据生产工厂”,根据给定的约束条件(标注)生成高质量仿真图像数据,从而得到一个由生成数据组成的数据库。

  据介绍,DSL框架已通过多个具体应用的验证,包括大脑多序列MRI图像生成及下游的大脑肿瘤分割任务,心脏CTA图像生成及下游的全心脏结构分割任务,多种器官的病理图像生成及细胞核实例分割任务等。

  随着DSL框架的推出,医疗大模型的训练将有望迎来新突破,有助加速模型开发迭代,使医疗大模型的应用范围得以进一步延伸,覆盖更多临床医疗问题。(完)

注:请在转载文章内容时务必注明出处!   

编辑:郑莹莹  

本网站所刊载信息,不代表中新社和中新网观点。 刊用本网站稿件,务经书面授权。
未经授权禁止转载、摘编、复制及建立镜像,违者将依法追究法律责任。
常年法律顾问:上海金茂律师事务所