作者:雨燕体育直播 | 发表于:2024-06-21 05:30:22 | 阅读:123次
算法,机器学习,deepmind,alphafold

新智元报道

编辑:庸庸 乔杨

【新智元导读】谷歌DeepMind开发的AlphaFold一夜之间颠覆了生物学,这一革命性的突破背后,有一支怎样的团队?AlphaFold的缔造者之一、DeepMind研究副总裁分享了成功的秘密——如何组建一个团队来应对这一巨大的跨学科挑战并取得胜利。

一个月前,DeepMind开发的AlphaFold 3惊艳了整个生物圈和AI圈。

AlphaFold 3能够根据氨基酸序列预测蛋白质的三维结构,解决了生物学中一个长期存在的难题。

这一突破对生物医学研究、疾病认识(如在COVID-19大流行期间对蛋白质结构的认识)和生物技术具有深远影响。

AlphaFold的伟大,只因做对了这5件事!DeepMind副总裁:团队注定会取得突破

除了技术上的成就,AlphaFold项目还在解决问题、团队管理和跨学科合作方面提供了宝贵的经验。

AlphaFold的成功不可被复制,但是它成功的经验却可以迁移。

那么,震惊整个科学界的AlphaFold开发团队究竟做对了什么?Google DeepMind的研究副总裁Pushmeet Kohli,分享了AlphaFold成功的秘密。

- 组建多元化团队:吸纳具有不同专长的人才,以解决不同方面的问题。

- 促进开放式交流:营造一种环境,让团队成员在需要帮助和分享知识时能畅所欲言。

- 促进持续学习:鼓励团队成员相互学习以及向其他学科学习。

- 注重循序渐进:优先考虑持续、渐进的改进,而不是寻求单一的突破。

- 利用跨学科见解:利用不同领域的知识为项目提供信息并加以改进。

关于AlphaFold

AlphaFold将蛋白质的氨基酸序列作为主要输入,并输出该蛋白质的预测三维结构。

输入:相关蛋白质的氨基酸序列

输出:预测蛋白质复合物的三维结构及原子坐标

蛋白质是在生物体内发挥各种功能的重要分子。

它们的功能由其三维结构决定,而三维结构则由其组成的氨基酸序列决定。

了解蛋白质的结构可能需要花费数月时间,但一旦完成,就可以深入了解蛋白质的工作原理和功能。准确的蛋白质结构预测至关重要,而且有多方面的下游应用。

- 加速药物发现:通过了解蛋白质结构,研究人员可以设计出更有效的药物。

- 增进对疾病的了解:蛋白质结构知识可以帮助人们深入了解疾病的机理,包括COVID-19。

AlphaFold的伟大,只因做对了这5件事!DeepMind副总裁:团队注定会取得突破

- 推进生物技术:它允许设计具有特定功能的新型酶和其他蛋白质。

在蛋白质结构预测关键评估(Critical Assessment of protein Structure Prediction,CASP)竞赛中,以往的获胜方案稳定在40.0左右。AlphaFold打破了这一瓶颈,并大幅超越了之前的分数。

历年CASP竞赛中表现最佳的模型

AlphaFold2再次刷新了这一新纪录,给该领域带来了革命性的冲击,让蛋白质结构预测直接进入「后AlphaFold时代」。

确定蛋白质结构的传统方法,如X射线晶体学和冷冻电子显微镜,既耗时又昂贵。AlphaFold提供了一种可扩展的高效替代方法,但开发如此复杂的模型也面临着一系列挑战。

AlphaFold项目团队是如何做到的呢?

跨学科合作

AlphaFold项目的突出特点之一是不同团队之间的有效合作。DeepMind 汇集了来自不同领域的专家,包括:

- 生物学家:深入了解蛋白质的生物学意义。

- 机器学习专家:开发复杂的算法和模型。

- 结构生物学家:确保预测在物理上合理。

AlphaFold项目汇集了各个团队来解决复杂的跨学科问题

主要经验

- 聘请领域专家:让相关领域的专家参与进来,全面了解问题。

- 跨职能团队:促进不同学科间的合作,从多个角度解决复杂问题。

渐进式改进

罗马不是一天建成的。

AlphaFold的成功不是单一突破的结果,而是一系列渐进式改进的结果。无论是模型架构、训练数据,还是算法调整,每一个微小的改进都为整体成功做出了贡献。

没有任何单一突破能够带来AlphaFold最先进的性能,持续的迭代开发和渐进式改进提供了性能的巨大综合提升

主要经验

-迭代开发和改进:强调持续改进和迭代测试,以完善模型。接受你所获得的胜利,无论大小。这样做的目的是通过了解失败案例,并使用更好的数据和方法,提高性能,不断改进。

-消融实验(Ablation Studies):进行彻底的消融实验,以了解每个组件的影响并优化性能。这个方法来自神经科学,有许多实验是通过损伤(ablate)一个或多个特定的神经元来研究它们的功能。

消融实验表明,AlphaFold的性能之所以如此出色,并不是依靠单一的灵丹妙药,而是一系列渐进式改进的组合

从上述消融实验的总结中可以看出,并没有一个明确的主导思想能带来如此巨大的性能提升。只有通过许多渐进式的改进才能解决这一难题,最终形成最先进的系统。

ML模型的归纳偏差:模型的基础

归纳偏差(Inductive Bias),是AI领域的一个关键概念,它描述了机器学习算法在学习过程中对特定解决方案的偏好或倾向。归纳偏差有助于算法在面对有限数据和不确定性时,做出合理的预测和泛化。

在某些领域,例如生物学或物理学,有些规律是我们人类已经知道的,比如牛顿运动定律。

当然,只要有足够多的相关数据,我们也能让机器学习模型自己找到这些规律。

AlphaFold的伟大,只因做对了这5件事!DeepMind副总裁:团队注定会取得突破

不过,有时在这些模型中预埋这些信息是非常有必要的,这样当模型学习时就不需要从这些基础知识开始,而是可以直接去学习那些难以用正式方程或定律写下来的细微差别。

DeepMind做得很好的一点是,他们没有使用通用的现成模型,而是给模型注入了领域内的专业知识,以及对所要解决问题的了解,让模型更「好」,也更「相关」,从而赢在了起跑线上。

让所有团队达成共识

对于AlphaFold的机器学习工程师来说,了解问题背后的基础科学至关重要。

这种深刻的理解使他们能够将特定领域的知识纳入模型设计,从而实现更准确的预测。

「对齐颗粒度」,让整个团队发挥更大的影响力

对于一个包含生物学家、计算机科学家和工程师等各领域人才的跨学科团队来说,让每个人都参与到项目中来,保持同频至关重要。

要让生物学家理解机器学习,让计算机科学家理解蛋白质,并不是一件简单的事情。

然而,一旦完成这项艰巨的工作,所有团队都将达成一致,并对更广泛的情况有一个总体的了解。

这就像一种「催化剂」,让团队中的每个成员都能提供比通常情况下更多的价值,因为他们已经将问题内化并清楚地理解了它。

主要经验

- 领域知识:投入时间学习问题领域的基础知识,建立更有效的模型。

- 跨学科培训:鼓励跨学科教育,弥合各领域之间的差距,让领域专家在更好地了解当前问题的背景下发挥最大作用。

AlphaFold的成功证明了跨学科合作、渐进改进和深厚领域知识的力量。

通过培养开放、持续学习和迭代开发的文化,团队甚至可以应对最复杂的挑战并推动创新。

AlphaFold的开发经验提供了一幅通往项目成功管理和执行的蓝图。

参考资料:

https://codecompass00.substack.com/p/inside-alphafold-deepmind-recipe-success?r=rcorn

算法,机器学习,deepmind,alphafold

标签:

相关资讯
最新直播
更多 >
  • 墨女超

    蒂华纳女足

    蒂华纳女足

  • 0-0

    未直播

  • 09-23 11:10

    老虎大学女足

    老虎大学女足

  • 墨女超

    马萨特兰女足

    马萨特兰女足

  • 0-0

    未直播

  • 09-23 11:10

    阿特拉斯女足

    阿特拉斯女足

  • 印孟超

    联合市FSA

    联合市FSA

  • 0-0

    未直播

  • 09-23 11:30

    孟买精英

    孟买精英

  • 日女甲

    FC高槻女足

    FC高槻女足

  • 0-0

    未直播

  • 09-23 12:00

    群马白星女足

    群马白星女足

  • 日足联

    滋贺湖王

    滋贺湖王

  • 0-0

    未直播

  • 09-23 12:00

    浦安矛船

    浦安矛船

  • 日职丙

    FC大阪

    FC大阪

  • 0-0

    未直播

  • 09-23 13:00

    福岛联

    福岛联

  • 印孟超

    KSA青年

    KSA青年

  • 0-0

    未直播

  • 09-23 13:30

    西区联合

    西区联合

  • 日足联

    铃鹿无限

    铃鹿无限

  • 0-0

    未直播

  • 09-23 14:00

    横河武藏野FC

    横河武藏野FC

  • 印锡联

    男孩俱乐部

    男孩俱乐部

  • 0-0

    未直播

  • 09-23 14:00

    锡金警察

    锡金警察

  • 中U21

    南通支云U21

    南通支云U21

  • 0-0

    未直播

  • 09-23 15:00

    天津津门虎U21

    天津津门虎U21

  • 中U21

    梅州客家U21

    梅州客家U21

  • 0-0

    未直播

  • 09-23 15:00

    武汉三镇U21

    武汉三镇U21

  • U20亚洲杯

    柬埔寨U20

    柬埔寨U20

  • 0-0

    未直播

  • 09-23 15:00

    乌兹别克斯坦U20

    乌兹别克斯坦U20

  • 南亚杯U17

    斯里兰卡U17

    斯里兰卡U17

  • 0-0

    未直播

  • 09-23 16:00

    尼泊尔U17

    尼泊尔U17

  • 印尼甲

    万隆

    万隆

  • 0-0

    未直播

  • 09-23 16:30

    佩西加雅加达

    佩西加雅加达

  • 印尼甲

    伯希索罗

    伯希索罗

  • 0-0

    未直播

  • 09-23 16:30

    佩斯克谏义里

    佩斯克谏义里

足球录像
更多 >

沙特联  2024-03-03

  • 利雅得新月 利雅得新月
  • 吉达联合 吉达联合

VS

全场录像

德甲  2024-03-03

  • 弗赖堡 弗赖堡
  • 拜仁 拜仁

VS

全场录像

法甲  2024-03-03

  • 摩纳哥 摩纳哥
  • 巴黎 巴黎

VS

全场录像

意甲  2024-03-03

  • 拉齐奥 拉齐奥
  • AC米兰 AC米兰

VS

全场录像

西甲  2024-03-03

  • 塞尔塔 塞尔塔
  • 阿尔梅里亚 阿尔梅里亚

VS

全场录像

中超  2024-03-03

  • 沧州雄狮 沧州雄狮
  • 北京国安 北京国安

VS

全场录像

中超  2024-03-03

  • 天津津门虎 天津津门虎
  • 南通支云 南通支云

VS

全场录像

中超  2024-03-03

  • 成都蓉城 成都蓉城
  • 青岛海牛 青岛海牛

VS

全场录像

NBA  2024-03-03

  • 奇才 奇才
  • 快船 快船

VS

全场录像

NBA  2024-03-03

  • 雄鹿 雄鹿
  • 公牛 公牛

VS

全场录像