0. 서론
GPU를 딥러닝 학습에 사용하기 위해서는 여러 환경 구성을 해주어야 합니다.
- Nvidia graphic card
- CUDA
- cuDNN
- Anaconda
위와 같은 것들이 모두 호환되는 버전을 찾아 설치해주어야 하기 때문에 처음 설치할 때 정확히 알고 설치를 하는 것이 좋습니다.
필자는 처음 설치를 잘못해서 재설치 해야 했습니다 ㅜㅜ
정말 번거로우니 꼭!!!! 처음에 정확히 알고 설치하세요!!!
1. CUDA 삭제
1-0 CUDA 버전 확인하기
nvidia 그래픽 카드 정보를 볼 수 있는 nvidia-smi를 통해 설치된 CUDA 버전을 확인하였습니다.
CUDA version이 12.0으로 되어 있는데, cuda12.0을 지원하는 파이토치가 아직 없어서(pytorch는 공식적으로 11.0까지만 지원한다고 함) 삭제하고 다른 버전을 설치하려고 합니다.
1-1 CUDA 삭제
# cuda remove
sudo apt-get --purge -y remove 'cuda*'
sudo apt-get --purge -y remove 'nvidia*'
sudo apt-get autoremove --purge cuda
# cudnn remove
cd /usr/local/
sudo rm -rf cuda*
~/.bashrc나 /etc/profile에 추가되어있는 CUDA 관련 설정도 제거해야 합니다.
export PATH=$PATH:/usr/local/cuda-{version}/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-{version}/lib64
export CUDADIR=/usr/local/cuda-{version}
2. 학습 환경 세팅
PC 환경은 다음과 같습니다.
- OS: Ubuntu 22.04.2 LTS
- graphic card: 510
- CUDA : 11.6
- cuDNN : 8.4.1
2-1 Nividia graphic card 설치
$ sudo apt-get update
$ ubuntu-drivers devices
# 추천하는 드라이버 확인
# 510 사용
$ sudo apt-get install nvidia-driver-510
#설치
$ sudo reboot
#재부팅
$ nvidia-smi
#설치확인
하... reboot 하고 nvidia-smi로 설치 확인을 해보면 계속!!!!!!!!!!! CUDA-VERSION 12.0이 떴습니다.....
저번 시도 때는 내가 잘못했겠지.. 했는데 또 그러니까 화가 나네요
그냥 코랩을 쓸까.. 하다가 오늘까지만 시도해보려고요..
구글링 해본 결과 저와 같은 상황을 겪은 분들이 있더라고요 ㅜㅜ
이 분도 저와 같은 상황을 겪은듯 해서 참고하였습니다.
방법)
일반적으로, NVIDIA 그래픽 카드 드라이버를 설치하면 동일한 패키지에 CUDA도 함께 설치된다고 합니다.
일단 Nvidia graphic card를 설치하고 cuda와 cudnn을 다시 삭제해보았습니다.
2-2 CUDA 설치
graphic card 510을 다운로드 하였기 때문에 호환되는 버전인 11.6 다운로드 할 것입니다.
다운로드 사이트
CUDA Toolkit 11.6 Update 1 Downloads
Resources CUDA Documentation/Release NotesMacOS Tools Training Sample Code Forums Archive of Previous CUDA Releases FAQ Open Source PackagesSubmit a BugTarball and Zip Archive Deliverables
developer.nvidia.com
사이트에서 다음을 선택합니다.
- linux
- x86_64
- Ubuntu, 18.04
- runfile(local)
터미널 명령어
아주 조심해서 입력해야 합니다!!!!!!!
$ wget https://developer.download.nvidia.com/compute/cuda/11.6.1/local_installers/cuda_11.6.1_510.47.03_linux.run
$ sudo sh cuda_11.6.1_510.47.03_linux.run
※ 주의 사항
1.Continue 선택 후 엔터
2.accept 입력 후 엔터 (nividia 라이센스에 관련된 내용)
3.Driver 선택 후 엔터 입력하여 체크 해제 (1번에서 드라이버를 이미 설치했기 때문에 cuda에서 자동으로 드라이버를 잡지 않도록 하는 설정)
4.Install 선택 후 엔터
설치 후 다음을 입력합니다.
$ sudo nano ~/.bashrc
export PATH=/usr/local/cuda-11.6/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDADIR=/usr/local/cuda-11.6
위의 내용을 추가하고 Ctrl+O, Enter, Ctrl+x 순으로 입력하면 됩니다.
$ source ~/.bashrc
#설치 및 버전 확인하려면 다음을 입력
$ nvcc -V
2-3 cuDNN 설치
graphic card 510을 다운로드 하였기 때문에 호환되는 버전인 8.4.1 다운로드 할 것입니다.
다운로드 사이트
https://developer.nvidia.com/rdp/cudnn-archive
cuDNN Archive
Download releases from the GPU-accelerated primitive library for deep neural networks.
developer.nvidia.com
Download cuDNN v8.4.1 (May 27th, 2022), for CUDA 11.x 선택 후 Local Installer for Linux x86_64 (Tar)를 설치합니다.
$ cd /mnt/c/users/user/downloads #CuDNN다운로드 위치
$ tar -xvzf cudnn-linux-x86_64-8.4.1.50_cuda11.6-archive.tar.xz
$ sudo cp cudnn-linux-x86_64-8.4.1.50_cuda11.6-archive/include/cudnn.h/usr/local/cuda-11.6/include
$ sudo cp cudnn-linux-x86_64-8.4.1.50_cuda11.6-archive/include/cudnn_version.h/usr/local/cuda-11.6/include
$ sudo cp -P cudnn-linux-x86_64-8.4.1.50_cuda11.6-archive/lib/libcudnn*/usr/local/cuda-11.6/lib64
$ sudo chmod a+r /usr/local/cuda-11.6/include/cudnn.h/usr/local/cuda-11.6/lib64/libcudnn*
# 위 명령어를 입력했는데 오류가 나서 아래 명령어로 입력
$ sudo chmod a+r /usr/local/cuda-11.6/lib64/libcudnn*
# 설치 확인 방법
$ ldconfig -N -v $(sed 's/:/ /' <<< $LD_LIBRARY_PATH) 2>/dev/null | grep libcudnn
3. CUDA & PyTorch compatibility + PyTorch intallation
PyTorch는 이전 버전의 uninstall 없이 바로 설치해도 됩니다.
가장 최신 version의 PyTorch는 아래 링크에서 다운로드할 수 있습니다.
https://pytorch.org/get-started/locally/
CUDA와 마찬가지로 설치할 PyTorch version, 현재 운영체제, 다운로드할 방법, 사용할 언어, CUDA version을 선택하면 명령어를 알려줍니다.
이전 version은 다음 링크에서 다운로드할 수 있습니다.
https://pytorch.org/get-started/previous-versions/
# cuda 11.6
pip install torch==1.13.1+cu116 torchvision==0.14.1+cu116 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu116
4. REFERENCE
GPU 사용을 위한 CUDA 환경 구성하기
이번에 데스크탑을 맞추면서 Geforce RTX 3080 그래픽카드를 구매하였다.근데 GPU를 딥러닝에 학습에 사용하기 위해선 여러 환경 구성이 필요하다는 걸 깨닫고 설치하는데5일이 걸렸다;;글카 가격만
velog.io
'AI' 카테고리의 다른 글
(AI-03) 딥러닝 개발 환경 (0) | 2021.05.23 |
---|---|
(AI-02) 인공지능 개발 이해 (0) | 2021.05.23 |
(AI-01) 인공신경망 이해 (0) | 2021.05.23 |
(OSS) 공개SW 라이선스 이해 (0) | 2021.05.23 |