



时间:2025-05-16 关注公众号 来源:网络
在当今人工智能与化学科学的交叉路口,我们见证了革命性的一步——TOMG-Bench的诞生。这一创新基准的设立,标志着语言模型在开放域分子设计中的应用迈入了全新的纪元。TOMG-Bench,即“Target-Oriented Molecular Generation Benchmark”,它不仅仅是技术名词的堆砌,而是一把钥匙,开启了一扇通往高效、精准分子设计的大门。在传统药物研发与材料科学中,分子设计往往依赖于繁琐的实验与直觉,但TOMG-Bench通过利用大型语言模型的深度学习能力,彻底改变了这一格局。它挑战了现有界限,将人工智能的预测精度与创造潜力推向了前所未有的高度,为科学家们提供了一个评估和比较不同模型在分子生成任务中性能的标准化平台。这一基准的建立,预示着未来药物发现、新材料开发将更加依赖智能化解决方案,加速科学探索的步伐,开启个性化医疗与高性能材料的新纪元。
TOMG-Bench:评估大语言模型开放域分子生成能力的新基准科学家们开发了一个新的基准测试——tomg-bench,用于评估大型语言模型(llm)在分子领域的开放域生成能力。该基准测试旨在弥补现有分子-文本数据集的不足,更准确地评估llm在实际分子设计中的应用潜力。
项目资源:
项目主页: 数据集和测试脚本: 预印本: Huggingface数据集: PaperWithCode:挑战与机遇:
传统的分子发现方法效率低且成本高。虽然图神经网络(GNN)等AI工具展现出潜力,但其泛化能力和生成特定性质分子结构的能力有限。LLM强大的语言理解和生成能力为分子发现带来了新的机遇,但分子与文本数据的对齐仍然是一个挑战。现有数据集通常是目标导向的,无法满足化学家在实际工作中对模糊需求的多种解决方案的生成。
TOMG-Bench的设计:
TOMG-Bench旨在评估LLM在开放域分子生成中的能力,更贴近实际应用场景。它包含三个主要任务,每个任务又细分为三个子任务:
分子编辑(MolEdit):添加、删除或替换分子中的官能团。 分子优化(MolOpt):优化分子的LogP、MR或QED值。 定制分子生成(MolCustom):根据原子数量、键数量或官能团生成分子。每个子任务包含5000个测试样本,提供全面的性能评估。
数据生成和评估指标:
TOMG-Bench使用Zinc250K数据库和随机生成的方法创建测试用例。评估指标包括成功率、相似性、有效性以及新颖性(针对MolCustom任务)。为了综合评估,引入了平均加权成功率指标。
OpenMolIns指令微调数据集:
为了提升LLM的性能,研究人员还开发了OpenMolIns指令微调数据集,包含不同规模的数据,涵盖所有九个子任务。
实验结果与发现:
实验结果表明,开放域分子生成任务具有挑战性,即使是先进的LLM也存在局限性。开源模型的性能正在快速提升,模型能力与性能正相关,数据规模也对性能有显著影响。TOMG-Bench揭示了LLM在分子领域的优势和不足,为未来的研究提供了方向。
排行榜(Leaderboard):
TOMG-Bench提供了模型性能排行榜,方便比较不同LLM的表现。
总结:
TOMG-Bench为评估LLM在开放域分子生成能力方面提供了一个重要的基准,推动了LLM在分子发现领域的应用和发展。其开源的数据集和测试脚本为研究人员提供了宝贵的资源。
以上就是TOMG-Bench:大语言模型开放域分子生成新基准的详细内容,更多请关注其它相关文章!
文章内容来源于网络,不代表本站立场,若侵犯到您的权益,可联系我们删除。(本站为非盈利性质网站)
电话:13918309914
QQ:1967830372
邮箱:rjfawu@163.com