



时间:2025-05-16 关注公众号 来源:网络
在科学探索的最前沿,清华大学的一支精英团队成功地架起了理论与实践的桥梁,推出了一款革命性的工具包——DeepTFBU。这款工具包专为实现基因表达的精细调控而设计,标志着生物信息学领域的一大步跨越。DeepTFBU以其深厚的学习能力,深入剖析基因调控的复杂网络,为科研人员提供了前所未有的精准操作平台。通过结合先进的深度学习算法与生物学专业知识,该工具包能够预测和解析转录因子与DNA的相互作用,从而开启了一扇通往基因精准调控的大门。这一创新不仅极大地提升了生物医学研究的效率,更为遗传疾病治疗、作物改良等应用领域带来了新的曙光,展现了科技如何在微观世界中促进生命的奥秘被更细腻地理解和掌握。
编辑|萝卜皮
增强子通过与转录因子(TF)相互作用,在各种生物过程中充当基因表达的关键调节器。虽然转录因子结合位点(TFBS)被广泛认为是TF结合和增强子活性的关键决定因素,但其周围背景序列的重要作用仍有待定量表征。
清华大学的研究团队提出了转录因子结合单元(transcriptionfactorbindingunit,TFBU)概念,通过使用深度学习模型量化TFBS周围上下文序列的影响,模块化地建模增强子。
基于这一概念,研究人员开发了DeepTFBU,这是一个用于增强子设计的综合工具包。
该团队证明设计TFBS上下文序列可以显著调节增强子活性并产生细胞类型特异性反应。DeepTFBU在从头设计包含多个TFBS的增强子方面也非常高效。此外,DeepTFBU可以灵活地解耦和优化广义增强子。
该研究以「Modelinganddesigningenhancersbyintroducingandharnessingtranscriptionfactorbindingunits」为题,于2025年2月8日发布在《NatureCommunications》。
相关背景
精确调控基因表达在发育和分化等复杂生物过程中至关重要。这种调控的核心是转录因子(TF)与增强子的结合。解读增强子的活性有助于深入了解基因调控的基本原理,并有助于设计合成增强子以在基因工程和基因治疗应用中操纵基因表达。
传统上,转录因子结合位点(TFBS),特别是通常为5至20个碱基对的TF结合基序,被认为是TF与增强子结合的关键决定因素。研究表明,在DNA序列中排列多个TFBS可以提高其作为增强子的功能。TFBS的方向和序列顺序也会显著影响增强子活性。利用这些特性,操纵DNA序列上的TFBS排列和组合被广泛用于设计合成增强子。
TFBU概念
在最新的研究中,研究人员提出了转录因子结合单元(TFBU)的概念,用于模块化增强子建模和设计。TFBU概念整合了核心TFBS及其周围上下文序列(TFBS-context)的作用。
这种整合使得定量评估长DNA序列结合目标TF和驱动特定细胞类型中的转录(增强子活性)的潜力成为可能。利用深度学习模型,研究人员从染色质免疫沉淀测序?(ChIP-seq)数据中确定了影响TF结合的TFBS环境中的关键模式。这些模型有助于合理设计具有所需功能的合成增强子,将特定TF的设计范围从核心TFBS扩展到整个增强子序列。
DeepTFBU工具包
图示:基于TFBU构建TFBS-上下文模型及下游任务的过程。(来源:论文)
基于TFBS上下文模型,该团队开发了一系列增强子设计方法,并将它们集成到名为DeepTFBU的工具包中。
该研究中,基于大规模并行报告基因检测(MPRA)实验的限制和模型性能,TFBU的典型长度被设置为168个碱基对。每个TFBU由两部分组成:核心TFBS及其上下文序列(表示为TFBS-context)。
为了评估TFBU的绑定效果,研究人员分别量化了特定TF的两个部分的匹配分数。核心TFBS的匹配分数是使用位置概率矩阵直接计算的。与核心TFBS不同,TFBS上下文包含无法直接量化的复杂和隐式特征。为了解决这个问题,我研究人员采用深度学习模型来提取人类基因组中TFBS上下文的TF特定偏好,从而获得TFBS上下文匹配分数。
测试与应用
研究人员测量了DeepTFBU设计的超过36,000个序列的增强子活性,用于验证在各种情况下的增强子建模和设计策略。结果表明,功能性TFBS上下文的序列模式可以特定于TF和细胞类型。
设计TFBU内的上下文序列可以显著调节大多数TFs(82.9%,97/117)的增强子活性。对于单个TFBU,这样的设计可以在不引入其他明显TFBS的情况下实现平均20倍以上的增强子活性增加。
图示:MPRA实验表明TFBS环境显著影响增强子活性。(来源:论文)
它还可以产生高达60倍的细胞类型特异性增强子活性。此外,基于TFBU的策略可以扩展到包含多个TFBS的增强子的从头设计。并且,设计上下文序列可以将包含串联重复TFBS的典型合成增强子的活性提高30倍以上。
研究人员还提出了一个灵活且通用的增强子优化框架,将增强子效应分解到各个TFBU中。利用这个框架,他们仅用少量突变就将巨细胞病毒(CMV)增强子的活性提高了60%。
这表明增强子序列可以模块化为TFBU,并以直观易懂和模块化自下而上的方式使用TFBU进行重新设计。所有这些结果证明TFBU是增强子建模和设计的关键概念,而DeepTFBU是合理设计增强子的强大工具包。
结语
该团队之前的工作中,研究人员利用深度学习模型DeepSEED提取的天然增强子的共同特征,通过在TFBS之间设计序列成功地提升了增强子的活性。该方法适用于提供靶基因调控元件一般模式信息的序列数据。
在这项工作中,研究人员强调了TF特异性和细胞类型特异性偏好对核心TFBS周围上下文序列的影响。
这使得对核心TFBS之外的序列进行详细而精确的建模成为可能,并且可以在大量公开数据的支持下作为增强子的通用基本特征。该方法还可以精确设计针对特定TF和细胞类型的基因调控元件。
在未来的研究中,通过利用更多有关TFs和TFBU特性的信息,研究人员可以构建更详细、更全面的TFBU系统,从而促进基于TFBU的更精确的DNA序列建模和调控元件设计。
论文链接:
以上就是从概念到应用,清华团队开发DeepTFBU工具包助力基因表达精准调控的详细内容,更多请关注其它相关文章!
文章内容来源于网络,不代表本站立场,若侵犯到您的权益,可联系我们删除。(本站为非盈利性质网站)
电话:13918309914
QQ:1967830372
邮箱:rjfawu@163.com