GPUサーバーのコンテナにPyTorchをインストールする際に少しハマったのでメモを残します。
PyTorchはインストールできたけど、GPUが使えないって人は以下を参考にしてください。
・PyTorch 1.13 からCUDA 10.2 がdeprecatedになったらしい。
・そのため、GET STARTEDからインストールしようとしてもCUDA 10.2が選べない。
・現在のGPUサーバーのCUDAのバージョンは10.2で、そのバージョンのcudatoolkitが入ってないとおそらく動かない。
・コンテナに新しいCUDAをインストールしようとするとコンテナが壊れるみたいなのでやめた方が良い。
・解決策としては、Previous PyTorch Versionsに古いバージョンのPyTorchをインストールするコマンドが乗ってるのでそれを使う。
・PyTorch 1.12.1をインストールしたい場合は、以下のコマンドでインストールできる。
conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=10.2 -c pytorch
本当はGPUサーバー本体のCUDAのバージョンを上げた方が良いと思いますが、この時期に今動いてるコンテナが使えなくなると困ると思うので、次の年度になってからどうするか考えます。