AlphaFold3 终于开放源代码了!!!
六个月前,谷歌 DeepMind 发表 AlphaFold3 的算法文章,但是并未公布算法。2024.11.11公布了对应的算法(链接见末尾),并将该工具用于非商业用途。
AlphaFold3开源的背景
刚开始,AlphaFold 研发团队表示仅通过网络服务器提供 AlphaFold3 试用,以期望在实现研究访问权限和保护商业野心之间取得了适当的平衡。
同时,伦敦的 DeepMind 衍生公司 Isomorphic Labs 正在将AlphaFold3 应用于药物研发。但是 AlphaFold3 的发布没有代码的行为引起了科学家的批评,他们表示此举破坏了可重复性。DeepMind 迅速改变了方针,并表示将在半年内推出该工具的开源版本。
AlphaFold3同行竞争
过去几个月,几家公司推出了基于 AlphaFold3 的开源蛋白质结构预测工具,依赖于AlphaFold3原始论文中描述。
两家中国公司——百度和抖音母公司字节跳动,已经推出了各自受AlphaFold3启发的模型。同时,加利福尼亚州旧金山的一家初创公司 Chai Discovery 也发布了类似的模型。
纽约市哥伦比亚大学的计算生物学家 Mohammed AlQuraishi 表示,这些模型的一个关键限制是,与 AlphaFold3 一样,没有一个模型被授权用于药物研发等商业应用。然而,Chai Discovery 的联合创始人 Jack Dent 表示,Chai-1 模型可以通过网络服务器用于此类工作。
AlphaFold3安装
服务器要求: Linux 系统;AlphaFold 3 不支持其他操作系统。
完整安装需要最多 1 TB 的磁盘空间来保存遗传数据库(建议使用 SSD 存储)和具有计算能力 8.0 或更高版本的 NVIDIA GPU(具有更多内存的 GPU 可以预测更大的蛋白质结构)。
官方已经验证,最多 5,120 个 token 的输入可以放在单个 NVIDIA A100 80 GB 或单个 NVIDIA H100 80 GB 上。且已经验证了 NVIDIA A100 和 H100 GPU 上的数值准确性。
特别是对于长目标结构,遗传搜索阶段会消耗大量 RAM - 建议至少使用 64 GB 的 RAM 来运行。
GITHUB为配备 NVIDIA A100 80 GB GPU 和干净的 Ubuntu 22.04 LTS 安装的机器提供安装说明,并希望这些说明能够帮助其他具有不同设置的人。
下面是安装步骤:
Provision a machine on GCP.
Install Docker.
Install NVIDIA drivers for an A100.
Obtain genetic databases.
Obtain model parameters.
Build the AlphaFold 3 Docker container or Singularity image.
更多的介绍可以在GITHUB上查找
AlphaFold算法网站:
https://github.com/google-deepmind/alphafold3?tab=License-1-ov-file
Chai Discovery
https://www.chaidiscovery.com/blog/introducing-chai-1
文献参考:
https://www.nature.com/articles/d41586-024-03708-4