Alphafoldのインストールから実行までのメモ

Alphafoldをインストール・実行した時に起こったトラブルのメモ


pdb_mmcifがrsyncでダウンロードできない

PDBj も RCSB も Connection time out となってしまって接続できない。pingは通っていたのでおそらくrsyncのポートが大学で塞がれている可能性がある? 結局、ftpでダウンロードした。


mgnifyのファイル名が違う

mgnifyのファイルをダウンロードするとmgy_clusters.faになっているが、参照しているのはmgy_clusters_2018_08.fa なので設定かファイル名をリネームして揃える。


jaxlibのpipインストールができない

docker/Dockerfile を見ると、pip3でjax, jaxlibをインストールしている。この時、storage.googleapis.comを参照しているが、これに接続できない。ターミナル上ではwgetで.whlをダウンロードできたのでDockerfileを書き換えたが、run_docker.pyからは同じく接続できない。Docker内からの名前解決がうまく行ってないのかもしれない?結局、DNSの設定に8.8.8.8を追加して解決した。


tensorflowとcuda周りのバージョンが合わない

https://github.com/deepmind/alphafold/pull/28 を参考にdocker/Dockerを

ARG CUDA=11.1
#FROM nvidia/cuda:${CUDA}-base

FROM nvidia/cuda:11.1.1-cudnn8-runtime-ubuntu20.04

上記のように変更。

githubに書いてある通りにcuda11.2.2にするとjaxlibのバージョンが1.65までしか存在していないためインストールエラーが起きる(1.69が必要)。


HHblitsがエラーで落ちる

"Unrecognized HMM file format in '1271622666'."とエラーを吐いて落ちた。結局、bfdのbfd_metaclust_clu_complete_id30_c90_final_seq.sorted_opt_hhm.ffdata のファイルサイズが本来のものより小さかったので再度解凍し直して解決?データベースファイルのハッシュかファイルサイズはチェックしておいたほうが良いかもしれない。(スクリプトあると便利そう)


コメント

このブログの人気の投稿

Excelで近似直線の傾きと切片を得る

塩基配列のデータを扱うときは専用エディタ ApE を使おう

Illustrator で稲妻マークを描く