陶术生物logo(抑制剂,化合物库,重组蛋白,天然产物,药物筛选)
首页热点资讯特大喜讯!AlphaFold3开源了!

特大喜讯!AlphaFold3开源了!


AlphaFold3 终于开放源代码了!!!


六个月前,谷歌 DeepMind 表 AlphaFold3 的算法文章,但是并未公布算法。2024.11.11公布了对应的算法(链接见末尾),并将该工具用于非商业用途。



AlphaFold3开源的背景


刚开始,AlphaFold 研发团队表示仅通过网络服务器提供 AlphaFold3 试用,以期望在实现研究访问权限和保护商业野心之间取得了适当的平衡。


同时,伦敦的 DeepMind 衍生公司 Isomorphic Labs 正在将AlphaFold3 应用于药物研发。但是 AlphaFold3 的发布没有代码的行为引起了科学家的批评,他们表示此举破坏了可重复性。DeepMind 迅速改变了方针,并表示将在半年内推出该工具的开源版本。




AlphaFold3同行竞争


过去几个月,几家公司推出了基于 AlphaFold3 的开源蛋白质结构预测工具,依赖于AlphaFold3原始论文中描述。


两家中国公司——百度和抖音母公司字节跳动,已经推出了各自受AlphaFold3启发的模型。同时,加利福尼亚州旧金山的一家初创公司 Chai Discovery 也发布了类似的模型。




纽约市哥伦比亚大学的计算生物学家 Mohammed AlQuraishi 表示,这些模型的一个关键限制是,与 AlphaFold3 一样,没有一个模型被授权用于药物研发等商业应用。然而,Chai Discovery 的联合创始人 Jack Dent 表示,Chai-1 模型可以通过网络服务器用于此类工作。



AlphaFold3安装


服务器要求: Linux 系统AlphaFold 3 不支持其他操作系统。


完整安装需要最多 1 TB 的磁盘空间来保存遗传数据库(建议使用 SSD 存储)和具有计算能力 8.0 或更高版本的 NVIDIA GPU(具有更多内存的 GPU 可以预测更大的蛋白质结构)。


官方已经验证,最多 5,120 个 token 的输入可以放在单个 NVIDIA A100 80 GB 或单个 NVIDIA H100 80 GB 上。且已经验证了 NVIDIA A100 和 H100 GPU 上的数值准确性。


特别是对于长目标结构,遗传搜索阶段会消耗大量 RAM - 建议至少使用 64 GB 的 RAM 来运行。


GITHUB为配备 NVIDIA A100 80 GB GPU 和干净的 Ubuntu 22.04 LTS 安装的机器提供安装说明,并希望这些说明能够帮助其他具有不同设置的人。


下面是安装步骤:


  1. Provision a machine on GCP.

  2. Install Docker.

  3. Install NVIDIA drivers for an A100.

  4. Obtain genetic databases.

  5. Obtain model parameters.

  6. Build the AlphaFold 3 Docker container or Singularity image.


更多的介绍可以在GITHUB上查找


AlphaFold算法网站:


https://github.com/google-deepmind/alphafold3?tab=License-1-ov-file




Chai Discovery


https://www.chaidiscovery.com/blog/introducing-chai-1




文献参考:

https://www.nature.com/articles/d41586-024-03708-4