



时间:2025-05-19 关注公众号 来源:网络
在智慧医疗的前沿阵地,一场革命悄然兴起。上海的智慧火花,交大、复旦与上海人工智能实验室的精英们,共同锻造了一把破译生命密码的钥匙——MedS3。这不再是一场简单的技术升级,而是医疗推理的深层觉醒。MedS3,如同一位内功深厚的医界宗师,摒弃传统预训练的繁复,以独创的“慢思考”范式,仅凭数千条精选种子数据,便能在复杂的医疗迷宫中找到真理的光芒。
在这虚拟与现实交织的诊疗室里,MedS3挑战着人类认知的极限,它不是简单地模仿,而是自我进化,每一步推理都如蒙特卡洛的赌局,精准而充满策略。规则与直觉的碰撞,通过过程奖励模型(PRM)的引导,就如同医术与哲学的深度融合,确保每一次决策的严谨与全面。
它在16个战场上的辉煌战绩,是对传统医疗AI的一次华丽超越。从微观的生物医学问答到宏观的医疗诊断,MedS3以一己之力改写着智能医疗的未来。这不是科幻,这是现实的突破,是智慧医疗的新纪元,一个由精准推理和深度学习编织的医疗梦想,正逐步照进现实,为人类健康护航。
上海交通大学、复旦大学和上海人工智能实验室的研究团队推出新型医学推理系统meds3,该系统采用自我进化“慢思考”范式,无需预训练和模型蒸馏,即可实现细粒度推理流程验证。
MedS3克服了现有医疗推理模型在长链推理和数据效率方面的不足。现有模型通常依赖于医疗考试题上的模型蒸馏,忽略了推理过程的可验证性和医疗任务的全面覆盖。而MedS3通过策略模型和过程奖励模型(PRM),结合蒙特卡洛树搜索(MCTS)和规则验证,在16个不同数据集上进行迭代优化,仅需7465条种子数据。
论文链接:
项目主页:
MedS3的创新之处在于其自我进化框架。MCTS生成可验证的推理链,每一步都进行正确性验证并赋予展开值,用于训练策略模型和PRM。PRM引导的投票求和(P-VS)策略选择最终答案,兼顾PRM评判和回复间的语义一致性。
MedS3优势:高数据利用率、支持单步监督、高效支持多任务学习。实验结果显示,MedS3在医疗知识问答、生物医学问答、长上下文问答和医疗诊断任务上显著优于现有模型,成为首个在医疗诊断任务上实现长链推理“R1”的大语言模型框架。MedS3展现了几乎无界的性能外推潜力,并且MCTS+PRM方法在医疗推理领域展现出显著优势。
MedS3为医疗领域大模型的推理能力带来了显著提升,为未来研究提供了新的方向。研究团队也指出,将强化学习与MCTS+PRM结合,有望进一步提升模型的泛化能力。
以上就是慢思考助力医学大语言模型突破数据瓶颈:上海交大联合上海AILab推出MedS3系统的详细内容,更多请关注其它相关文章!
文章内容来源于网络,不代表本站立场,若侵犯到您的权益,可联系我们删除。(本站为非盈利性质网站)
电话:13918309914
QQ:1967830372
邮箱:rjfawu@163.com