立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 173|回复: 5

[分享] 定量生物学(系统生物学、计算生物学、理论生物学)是否将成为未来生命科学研究的热点?

[复制链接]
发表于 2025-5-21 19:20 | 显示全部楼层 |阅读模式

登陆有奖并可浏览互动!

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录 手机动态码快速登录

×
定量生物学(系统生物学、计算生物学)指的是运用数学知识,建立数学模型,定量解释生命体内复杂的生命现象。比如,生物体内调控原理,蛋白质折叠原理与功能预测,大脑思维本质研究等。
“一门学科只有当它用数学表示的时候,才能被最后称为科学。”
十六、十七世纪以来,开普勒、牛顿等人使用数学描述行星运动规律,物理学真正进入了可以被定量理论描述的时代;
十九、二十世纪以来,随着原子物理与量子力学的发展,化学反应得到了更科学的解释,化学正式成为真正的定量科学;
然而,生命科学一直由于其高度复杂性,至今仍处于实验至上的时代,相关专业学生由于长期只会从事实验研究,缺乏理论知识,被冠以“伪化生”头衔。随着复杂网络理论等数学物理工具的发展,随着交叉学科研究的不断深入,未来生命科学的理论研究是否会有突破。
(PS:目前世界各大院校与研究机构已经开展此方面研究,也出版了不少论文和书籍,但整体看来没有实质性突破,甚至不知道前路何方。之前数学在生命科学上应用最多的是生态学,使用数学模型研究种群增长等问题)
原文地址:https://www.zhihu.com/question/54117103
楼主热帖
回复

使用道具 举报

发表于 2025-5-21 19:20 | 显示全部楼层
从《The Scientist2019年度具有代表性和突破性的生物技术来抛个砖:

一、人工智能技术


纵观今年生物学的许多重大发现,机器学习作为一种工具不断促进生命科学领域的发展
今年的众多研究项目中,有研究人员报道他们已成功通过机器学习来检查机体是否存在癌症或病原体感染;也有研究人员通过机器学习鉴定血液样本中与糖尿病患者血管并发症相关的表观遗传标志物……

二、活细胞记录技术


今年8月,麻省理工学院的研究人员报道了利用DNA以及类似CRISPR的碱基编辑机制记录细胞内部的生命活动,然后通过测序对其进行解码的方法。他们对大肠杆菌和人类细胞进行了工程改造,使它们可以记录多种分子事件以及它们发生的时间和顺序
该方法的基本操作单位是两种类型的基因序列:一种在诱导型启动子的控制下编码特定的gRNA,一种编码与核酸酶的CRISPR-Cas9酶(与gRNA结合)融合的碱基编辑酶。遗传序列被转染到细胞中,当这些细胞暴露于诱导剂(诱导剂是实验人员希望在DNA中蚀刻的任何分子事件)时,表达gRNA序列,RNA结合到Cas9-base编辑器融合蛋白,然后将其转运到目标DNA序列(与gRNA匹配)进行编辑。这些编辑可以稍后通过DNA测序进行分析。文章的共同作者,麻省理工学院的Timothy Lu说,这项研究在环境毒素的检测和发育过程的记录方面也具有潜在的应用价值。【1】

三、DNA芯片技术


今年,基于CRISPR-Cas9编辑进行的另一项创造性技术是开发了针对特定DNA序列的检测设备。目前,在众多实验室中主要采用目标扩增的方式,在DNA样本中寻找特定的碱基序列。但这种方法需要耗费时间,还有可能产生偏差。
为了避免目标扩增的缺点,加利福尼亚州Keck Graduate 研究院Kiana Arand的团队将研究对象转向了CRISPR-Cas核酸酶家族,当它与特定的指导RNA配对时,可以搜寻整个基因组以发现并切割精确的序列。他们将Cas9酶与RNA和石墨烯芯片结合,且经过改造设计后不会切割DNA。当RNA-Cas9复合物与其目标DNA序列连接,芯片内的电场就会发生变化,继而可进行阳性读数

四、PE编辑技术


David Liu及其团队研究的编辑技术prime editing,旨在通过避免双链DNA断裂来降低CRISPR的脱靶效应并提升CRISPR的准确性,该技术在今年10月于Nature发表。PE编辑技术仅通过切割一条DNA单链添加、去除或取代碱基对,即可改写DNA
它使用的是CRISPR系统中常用的Cas9核酸酶,但将该酶与一种名为pegRNA的引导RNA和另外一种逆转录酶相结合,后者可以向基因组中添加新的序列或碱基。一旦新的遗传物质掺入到DNA的切割链中,PE就会对未编辑的DNA链进行刻迹,向细胞发出信号对它进行重建,并与已编辑的链进行匹配【2】。详见BioArt报道:
BioArt生物艺术:专家点评Nature | David Liu再出重磅基因编辑新工具,可实现碱基随意转换与增删
五、新型多功能干细胞诱导技术


Shinya Yamanaka在2006年首次发表了诱导多功能干细胞的方法,该方法通过在分化过的细胞中过表达Oct4,Sox2,Klf4,cMyc四种转录因子,将细胞重置为多能状态,形成诱导多能干细胞(iPSC)。且Oct4是四个过表达的转录因子中最重要的一个。但在今年十一月,马克斯·普朗克分子生物医学研究所 (Max Planck Institute for Molecular Biomedicine) 的Sergiy Velychko团队宣布,他们不仅能在不调整Oct4水平的情况下制造出小鼠iPSC,而且具有更高的效率。Yamanaka在给《The Scientist》的邮件中谈道:“若这种新的方法可应用于人的细胞,将极有利于iPS细胞在临床上的应用。”【3】

参考文献
[1] F.Farzadfard et al.,“Single-nucleotide-resolution computing and memory in living cells,” Molecular Cell ,75:P769-780.E4,2019.
[2]A.Anzalone et al.,“Search-and-replace genome editing without double-strand breaks or donor DNA,”Nature,doi:10.1038/s41586-019-1711-4,2019
[3]S. Velychko et al.,“Excluding Oct4 from Yamanaka cocktail unleashes the developmental potential of iPSCs,” Cell Stem  Cell, doi:10.1016/j.stem.2019.10.002, 2019.
回复 支持 反对

使用道具 举报

发表于 2025-5-21 19:21 | 显示全部楼层
首先一点,在这个问题下所谓系统生物学的工作都出现了各个分支不同的人,但他们其实所能揭示的结论是完全不同的。这点从他们“可预测”的对象可以看的出。
从本质上说,系统生物学其实是某种反问题的研究,或者说逆向工程,而区别在于使用工具的不同。比如有些工作使用的是微分方程的工具,而有些工作使用的是概率模型,但最终它们能够揭示的结果反馈是不同意义,使用微分方程可能可以预测某个元件的动力学参数,而使用概率模型可能预测的是某个宏观的调控现象,而非具体到调控的细节。因而他们所能指导实验设计的方向也会存在区别。在这一点上北大定量生物中心和清华合成与系统生物学中心做的很好,两方面的研究者都有。
就我个人的观点而言,这些工具适用的对象也是不一样的。过去可能在酵母大肠杆菌的数据运用概率模型进行调控预测,而现在已经可以使用微分方程甚至进行复杂的实验设计了。因而运用概率模型揭示真核生物更复杂的个体的现象是比较有用的,而这方面使用微分方程就显得较为困难。但从另一方面去说,实现更精细的设计还是需要微分方程这类的工具,但其在模型的灵活性上(如何自适应的确定参数和模型形式)以及模型选择上需要在算法工具上进行创新。
回复 支持 反对

使用道具 举报

发表于 2025-5-21 19:21 | 显示全部楼层
短时间内,定量生物学难出大突破。因为目前定量生物学的算法,缺得特别厉害。
举个例子,一个定量组学数据出来,大部分就是做个PCA压缩,做个t-SNE压缩;或者做个聚类,或者共表达网络分析。压缩分类后,做下已知通路的富集分析。期和期之间,做下GSEA。
我写出来,不懂的会觉得不明觉厉,懂的都知道,这就是常规套路。全都依靠现有知识,解释自己的组学数据,全在凑已知通路。
大数据出来不应该预测新基因吗?炒冷饭有什么用呢?找未知功能基因,用机器学习里的模式识别啊。

目前行业里和机器学习搭边,最常用就是SVM,其他算法用得特别少。2000年就有人用卵巢癌和正常卵巢组织基因芯片数据,通过SVM预测哪个是癌组织。20年后,其他行业各种算法百花齐放,生物还是一水的SVM。
目前我看的文章里,做的最高级的SVM是2016年一篇寻找自闭症未知基因的Nature Neuroscience。通过2015年所有组织转录组数据,做基因共表达谱,再根据已知自闭症阳性和阴性基因和其他基因的共表达状况,用SVM找新基因。这篇文章预测的AUC能到0.75,后续用自闭症病人的测序数据,验证了预测基因与疾病的相关性。理论预测和实验很契合。
因为我也做过SVM预测,它有个很大问题,支持向量决定分离平面,所以支持向量数据的准确性严重影响分离平面的准确性。而普通实验中测个序,数据都有一定置信区间,不可能很准,这就制约了SVM在生物学预测的实用度。2016年那篇Nat Neuroscience为什么特别好,因为他用了成千上万篇文章里基因表达的相关性,不是单纯的基因定量值,大样本加上上升到co-occurancy层面,抹掉了数据不准的局限。所以预测就很准。
这才是未来。
---
说个题外话,为什么生物行业算法层面进步缓慢?
首先因为穷。做生信的大多是调包侠,能自己编程的不多;少数会编程的,大多是计算机专业,数学不行;能做核心算法的,本来就不多,都在其他高薪行业。真心希望机器学习大佬光顾下生物行业,救救孩子们。然而这工资水平,实在拿不出手。
另外一点,业内对算法不够重视。2000年那篇SVM引用量上千还是上万,也只发在Bioinformatics上。我目前做的工作也是组学的机器学习,做了新算法改良,也做了实验验证,还挺准。本来想做成方法学的文章,很多人都觉得做算法文章发不好。最后我改成了组学传统套路分析的Resourse。心累。
回复 支持 反对

使用道具 举报

发表于 2025-5-21 19:22 | 显示全部楼层
关于系统生物学,在PHD刚开始时候,我还是想搞点偏这方面的东西,不过现在越来越偏forward engineering了。原因主要是下面两个。

  • 系统生物学并不系统,很多人系统生物学的研究方法是看到一个现象,然后发展一个唯象模型,然后调整几个变量(参数)验证一番,很大一部分是在蹭热点。目前用理论/数学理论描述的比较好的只是很多孤立的小岛,但不能连成体系。出现这个问题的原因很多,具体到题主“生物体内调控原理,蛋白质折叠原理与功能预测,大脑思维本质研究”,这些都是最本质的内容,难度也各不相同。生物体内调控原理:这个问题在简单层次上(不构成网络),在短时间内有望取得重大突破,原理,实验条件,数据,分析方法都已经逐渐成熟。在复杂层次上(网络调控),难点目前有两个,一个是简单层次的东西还没完全搞清楚,这个在个人观点里是可解决的,一个是现在数学工具太过复杂(基本都是ODE PDE SDE DDE从头模拟),导致预测能力有限(当然也有些比较好的模型,但不能解决一般问题),这个问题难度因为样本和实践太少,暂时没法说(不过这个在描述层面上至少是可解决的问题,凭个人直觉猜测这个以后也是能基本解决的问题)。蛋白质折叠原理与功能预测:这个问题更难一些,当然难度也和预测要求的精度有关,目前做得最漂亮的是David Baker。折叠这个层面逻辑上随着计算能力加强,近似算法逐渐提高(包括AI找pattern能力的进步),以后能解决的可能比较大。功能预测和正向设计难度大了一个P到NP的距离(比喻),有高效算法可能很低,感觉极限就是基于已有模块改造(定向进化目前能做一部分这种东西)。大脑思维本质目前没有任何可以接受的模型/假说,完全未知难度,在生物实践领域,受限于数据获得,实验方法,个人看法这是无底洞,不知道以后AI能不能从理论上搞出点什么名堂。
  • 实践水平不足以验证理论预测,在开始了解这个领域后,实践水平之低让人汗颜。对于一个模型,最重要的就是可预测性,现在很多东西在预测完后只能调两下参数然后看是不是符合(很多发得很好的文章都是些非常显然/trivial的调整),连根据模型搞一个设计都做不到,作为科学理论只能是空中楼阁(在第一点里说的怎么处理那些复杂的数学方程,怎样通过方程找到结构也是问题,但这种问题如果有实践印证要好处理很多)。关于实践的话,稳态向我之前说的,这个问题在近一段时间内应该会逐步解决,进一步是在时间轴上网络的动力学,更进一步的是空间结构。这点我要提醒下LZ,在目前的阶段,实践对于处理问题是必须的,不然只能落入一般系统生物学家的层次,东处理一个问题,西蹭一个热点。“未来生命科学的理论研究是否会有突破” 这种突破如果出现,从个人观点来看,不会是简单的,统一的理论,而是大量可以处理的唯象理论的叠加(当然在一些层次上可以找到漂亮的结构),而且对于不同研究对象,也需要从不同角度来选择可以计算的模型,从这个角度来说,我不是很认可“实质性突破”这个词。

以上一点个人的粗浅观点,有些东西不是自己方向的,只是粗略看看或者同别人交流的想法,很可能不对。不过有一点可以支持下LZ,至少从你的提问看,你关注的都是问题的本质,而不是很多系统生物学研究搞得不知所谓的东西。
回复 支持 反对

使用道具 举报

发表于 2025-5-21 19:22 | 显示全部楼层
突破会有的,热度也会有的,我就准备用自己的职业生涯放一把火。
P.S.: 如今生物学的五大块中,实验、生信其实都属于empirical的范畴——虽然统计和生信都是“干”的。真正属于定量生物学的应该是数学建模和计算模拟这些包含theories的考量的部分。统计的情况很特殊,既可以是Biostatistics领域服务于生物实验的量化设计和数据分析,但也包含基于随机数学对生命现象做统计建模的理论工作。一些数学生物学工作完全只是analogical性质的工作,远离实际数据,也一般不在定量生物学的主要方向之中。
现在的不少工作是两边的人合作完成的,甚至一些实验室自己就能同时产raw data并给出系统生物学模型。
—————————————update—————————————
看了一些回答,觉得作为在实验、理论都有些经历的人,我补充一下自己对目前生物学现状与将来的一点看法。
<hr/>先谈谈目前实验、定量学科各自的局限性
目前理论工具对具体实验的帮助还不大,实验的确仍然是主流,但如果一些实验生物学家藉此鄙视理论就很可笑了:

  • 论思维水准,伪化生说的就是这种,可是实际上化学一直、也进一步跑到前面去了,计算模拟在药物化学中已经大行其道;
  • 论学科法发展,如果理论工具不能成功,这种小作坊的路数不但离认知生物学的本义相去甚远,还将继续耗费、甚至浪费极大的智力、财力资源——没有系统性框架,很多看似确凿无疑的实验结果不过只有Artificial的意义,而真正的科学家绝对不会面对黑箱操作心安理得;
  • 即使论实验生物学现状,各种计算工具已经在生命科学中起到不可替代的作用,高通量筛选、预测目的基因再去做功能比查文献瞎蒙的都高到不知道哪里去了,国内高水平的机构都在融合实验、统计和计算等多方面的力量,迷信实验只能说格局真不行。TX下:你还想不想发好文章了?
如前面孟祥溪君所言,其实定量生物学已经是非常热的方向了,毕竟门槛高,方向多,比起实验其实很容易做出让人惊叹的东西,很多做数学、物理和计算的人在生物学领域的确已经做了很多有趣、有深度的作品。不过问题在于,这里面很大程度上都是在拿着手电筒找问题,而不是建立真正可以在生命科学中大行其道的标准解决方案。那些偏微分方程很美,但生物学的结构注定面向经典物理学对象发展的数学工具难有大的作为,图灵的工作就是一例,斑点模型很精彩,但仅此而已,他绝顶的数学天才在生物学上的大量投入和牛顿在化学上的努力一样,整体上无功而返。
不过这个局面也不奇怪,人都不愿意走出自己学术上的舒适区,如果用自己的方法就能发一些亮眼的工作,又何必直面生物学的挑战?我认为迄今这个领域的确相对缺乏真正有学科担当与雄心的顶级科学家。AI当前也是这样,既然略有改进就可以大行其道,自然就很少有人“不明智”地去碰强AI的钉子。
当今定量生物学的使命就在于发展理论工具的时候像牛顿、庞加莱这些经典的数理双修的科学家一样,致力于发展对物理学/生物学有重大影响的数学/计算方法。不然就会重蹈上古的覆辙——像古希腊学者跟随欧几里得等几何逻辑学派、而不是阿基米德结合推理与计算的现代思想一样,大大延滞可以改变科学面貌的方法论的发展进程。

好在希望当然有,一些理论工具已经有意无意地触及到生物学最本质的东西,只要加以发展真的前途无量。这些方法引入计算模拟的方法、统计物理学的思想,主要集中在复杂网络等领域,在生物学、经济学中都已经颇见功力,如清华的雷锦誌老师的转型就是一个很好的例子(【雷锦誌:关于计算系统生物学未来得发展趋势(2013, 7月5日)】)。
特别地,神经科学推动的理论计算领域的成就已经非常厉害了,如今与人工智能深度互动,更是不可限量,在这个智能科学改变一切的时代,神经科学的理论工具每进一步都深度影响着整个世界。

对了,理论物理学的情怀在理论生物学可能要打些折扣,大统一的理论基本不可能,每一种工具都只能适用于特定的层次、类型,有些像凝聚态物理学。当然,在领域发展的初期,简洁优美的框架性理论还是会有的,有眼光的可以入手了。整体而言,任重道远,但机会也就在眼前(恕利益相关,只能对一些东西有所保留,先让我享受秘境之旅吧)。
| 240609 知友 kBlnW (梁师翎) 发表的论文提供了一个生动的案例[1]:从70多年前的图灵斑图、到如今处于生物学中心的分子网络,中间有一个巨大的 gap 需要理论的解释和量化的方法  ——  他们对这个问题基于非平衡系统动力学的突破,对正在崛起的生物物理学而言是 constitutional 的贡献[2]。
<hr/>
李政道先生曾提出过关于物理学家的两个定律,用来说明理论和实验的相互促进。
第一个定律是:“没有实验物理学家,理论物理学家就要漂浮不定。”
第二个定律是:“没有理论物理学家,实验物理学家就会犹豫不决。”
——《物理学家的两个定律》[3]
科学的王国中,没有不包含理论设想的实验,也没有不指向实在的科学理论,实验构成理论架构验证、实现的手段(当然,实验也一直是理论发展的挑战和灵感之源)。理论和计算只不过是把科学中高度集中用脑的部分独立出来而已,是学科高度成熟分工的标志(其实理论物理学真正从物理学理论-实验不分家的传统格局中独立出来也只有一百多年)。否则,如果一门学科做实验的觉得自己就是统治阶级、而且将来也不可颠覆,实验就是绝对客观的政治正确,那真是这门学科的悲哀。
好在有志于此的理论、计算生物学家并不这么想。我期待着理论生物学工具对实验、合成生物学的意义,可以在不远的将来像数学之于物理、工程科学那样根本,而这一幕的拉开,才是这个时代生物学最好的戏。
<hr/>我的相关回答对其中一些点有一定的延伸,有兴趣者可以参考:
生物数学里的建模与理论研究对于纯生物研究有什么指导意义?中科院生物方面的现况如何?为什么生物学的发展远落后于物理化学等学科?更多技术性的内容,特别是数理计算基础的补充和方向的选择,非常推荐另外一个问题下面一些很棒的回答:
请问计算机生物学,生物信息学,生物统计这三门专业哪个更适合这样的我?
回复 支持 反对

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表