週報(大塚)

GPUサーバーのコンテナにPyTorchをインストールする際に少しハマったのでメモを残します。

PyTorchはインストールできたけど、GPUが使えないって人は以下を参考にしてください。

・PyTorch 1.13 からCUDA 10.2 がdeprecatedになったらしい。

PyTorch 1.13 release, including beta versions of functorch and improved support for Apple’s new M1 chips.

・そのため、GET STARTEDからインストールしようとしてもCUDA 10.2が選べない。

・現在のGPUサーバーのCUDAのバージョンは10.2で、そのバージョンのcudatoolkitが入ってないとおそらく動かない。

・コンテナに新しいCUDAをインストールしようとするとコンテナが壊れるみたいなのでやめた方が良い。

・解決策としては、Previous PyTorch Versionsに古いバージョンのPyTorchをインストールするコマンドが乗ってるのでそれを使う。

・PyTorch 1.12.1をインストールしたい場合は、以下のコマンドでインストールできる。

conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=10.2 -c pytorch

本当はGPUサーバー本体のCUDAのバージョンを上げた方が良いと思いますが、この時期に今動いてるコンテナが使えなくなると困ると思うので、次の年度になってからどうするか考えます。

コメントを残す