深度学习环境配置是很多朋友迈不过去的坎。不过有了大模型,遇到问题定位的速度能快很多。
我花了一些时间去适配老版本的 paddle,搞定了,这里发一篇文章记录一下。
docker image 里面,很多 cuda11 镜像,在 cuda12 的环境下是跑不起来的。原因我也不太清楚。这个时候,可以选择大版本一致的 cuda。
为了保证不影响 server 其他人的环境,不要更新 nvidia 驱动,安装自己的 cuda 版本,然后修改环境变量,就能改变系统的 cuda。
# CUDA_VERSION=11.7
export CUDA_HOME="/usr/local/cuda-$CUDA_VERSION"
export LD_LIBRARY_PATH="$CUDA_HOME/lib64:$LD_LIBRARY_PATH"
export PATH=$CUDA_HOME/bin:$PATH
应用这个环境变量,然后查看nvidia-smi
,就能看到版本的变化。