AI / / 2023. 7. 31. 12:27

Ubuntu CUDA 재설치 + PyTorch

0. 서론

GPU를  딥러닝 학습에 사용하기 위해서는 여러 환경 구성을 해주어야 합니다.

  • Nvidia graphic card
  • CUDA
  • cuDNN
  • Anaconda

위와 같은 것들이 모두 호환되는 버전을 찾아 설치해주어야 하기 때문에 처음 설치할 때 정확히 알고 설치를 하는 것이 좋습니다.

필자는 처음 설치를 잘못해서 재설치 해야 했습니다 ㅜㅜ

정말 번거로우니 꼭!!!! 처음에 정확히 알고 설치하세요!!!

1. CUDA 삭제

1-0 CUDA 버전 확인하기

nvidia 그래픽 카드 정보를 볼 수 있는 nvidia-smi를 통해 설치된 CUDA 버전을 확인하였습니다.

 CUDA version이 12.0으로 되어 있는데, cuda12.0을 지원하는 파이토치가 아직 없어서(pytorch는 공식적으로 11.0까지만 지원한다고 함) 삭제하고 다른 버전을 설치하려고 합니다. 

1-1 CUDA 삭제

# cuda remove
sudo apt-get --purge -y remove 'cuda*'
sudo apt-get --purge -y remove 'nvidia*'
sudo apt-get autoremove --purge cuda

# cudnn remove
cd /usr/local/
sudo rm -rf cuda*

~/.bashrc나 /etc/profile에 추가되어있는 CUDA 관련 설정도 제거해야 합니다.

export PATH=$PATH:/usr/local/cuda-{version}/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-{version}/lib64
export CUDADIR=/usr/local/cuda-{version}

2. 학습 환경 세팅

PC 환경은 다음과 같습니다.

- OS: Ubuntu 22.04.2 LTS
- graphic card: 510

- CUDA : 11.6
- cuDNN : 8.4.1

2-1 Nividia graphic card 설치

$ sudo apt-get update

$ ubuntu-drivers devices
# 추천하는 드라이버 확인
# 510 사용

$ sudo apt-get install nvidia-driver-510
#설치

$ sudo reboot
#재부팅

$ nvidia-smi
#설치확인

하... reboot 하고 nvidia-smi로 설치 확인을 해보면 계속!!!!!!!!!!! CUDA-VERSION 12.0이 떴습니다.....

저번 시도 때는 내가 잘못했겠지.. 했는데 또 그러니까 화가 나네요

그냥 코랩을 쓸까.. 하다가 오늘까지만 시도해보려고요..

구글링 해본 결과 저와 같은 상황을 겪은 분들이 있더라고요 ㅜㅜ

https://github.com/imhyunho99/python_vision_with.Prof.Ryu/blob/main/Cuda_%EC%84%A4%EC%A0%95_%EB%8B%A4%EC%82%AC%EB%8B%A4%EB%82%9C_%ED%9B%84%EA%B8%B0.ipynb

이 분도 저와 같은 상황을 겪은듯 해서 참고하였습니다.

방법)

일반적으로, NVIDIA 그래픽 카드 드라이버를 설치하면 동일한 패키지에 CUDA도 함께 설치된다고 합니다. 

일단 Nvidia graphic card를 설치하고 cuda와 cudnn을 다시 삭제해보았습니다.

 

2-2 CUDA 설치

graphic card 510을 다운로드 하였기 때문에 호환되는 버전인 11.6 다운로드 할 것입니다.

다운로드 사이트

https://developer.nvidia.com/cuda-11-6-1-download-archive?target_os=Linux&target_arch=x86_64&Distribution=Ubuntu&target_version=20.04&target_type=runfile_local 

 

CUDA Toolkit 11.6 Update 1 Downloads

Resources CUDA Documentation/Release NotesMacOS Tools Training Sample Code Forums Archive of Previous CUDA Releases FAQ Open Source PackagesSubmit a BugTarball and Zip Archive Deliverables

developer.nvidia.com

사이트에서 다음을 선택합니다.

  • linux
  • x86_64
  • Ubuntu, 18.04
  • runfile(local)

터미널 명령어

아주 조심해서 입력해야 합니다!!!!!!!

$ wget https://developer.download.nvidia.com/compute/cuda/11.6.1/local_installers/cuda_11.6.1_510.47.03_linux.run
$ sudo sh cuda_11.6.1_510.47.03_linux.run

※ 주의 사항

1.Continue 선택 후 엔터
2.accept 입력 후 엔터 (nividia 라이센스에 관련된 내용)
3.Driver 선택 후 엔터 입력하여 체크 해제 (1번에서 드라이버를 이미 설치했기 때문에 cuda에서 자동으로 드라이버를 잡지 않도록 하는 설정)
4.Install 선택 후 엔터

 

설치 후 다음을 입력합니다.

$ sudo nano ~/.bashrc

export PATH=/usr/local/cuda-11.6/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.6/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
export CUDADIR=/usr/local/cuda-11.6
위의 내용을 추가하고 Ctrl+O, Enter, Ctrl+x 순으로 입력하면 됩니다.

$ source ~/.bashrc

#설치 및 버전 확인하려면 다음을 입력
$ nvcc -V

2-3 cuDNN 설치

graphic card 510을 다운로드 하였기 때문에 호환되는 버전인 8.4.1 다운로드 할 것입니다.

다운로드 사이트

https://developer.nvidia.com/rdp/cudnn-archive

 

cuDNN Archive

Download releases from the GPU-accelerated primitive library for deep neural networks.

developer.nvidia.com

Download cuDNN v8.4.1 (May 27th, 2022), for CUDA 11.x 선택 후 Local Installer for Linux x86_64 (Tar)를 설치합니다.

 

$ cd /mnt/c/users/user/downloads #CuDNN다운로드 위치
$ tar -xvzf cudnn-linux-x86_64-8.4.1.50_cuda11.6-archive.tar.xz
$ sudo cp cudnn-linux-x86_64-8.4.1.50_cuda11.6-archive/include/cudnn.h/usr/local/cuda-11.6/include
$ sudo cp cudnn-linux-x86_64-8.4.1.50_cuda11.6-archive/include/cudnn_version.h/usr/local/cuda-11.6/include
$ sudo cp -P cudnn-linux-x86_64-8.4.1.50_cuda11.6-archive/lib/libcudnn*/usr/local/cuda-11.6/lib64
$ sudo chmod a+r /usr/local/cuda-11.6/include/cudnn.h/usr/local/cuda-11.6/lib64/libcudnn*
# 위 명령어를 입력했는데 오류가 나서 아래 명령어로 입력
$ sudo chmod a+r /usr/local/cuda-11.6/lib64/libcudnn*

# 설치 확인 방법
$ ldconfig -N -v $(sed 's/:/ /' <<< $LD_LIBRARY_PATH) 2>/dev/null | grep libcudnn

3. CUDA & PyTorch compatibility + PyTorch intallation

PyTorch는 이전 버전의 uninstall 없이 바로 설치해도 됩니다.

가장 최신 version의 PyTorch는 아래 링크에서 다운로드할 수 있습니다.

https://pytorch.org/get-started/locally/

CUDA와 마찬가지로 설치할 PyTorch version, 현재 운영체제, 다운로드할 방법, 사용할 언어, CUDA version을 선택하면 명령어를 알려줍니다.

 

이전 version은 다음 링크에서 다운로드할 수 있습니다.

https://pytorch.org/get-started/previous-versions/

# cuda 11.6
pip install torch==1.13.1+cu116 torchvision==0.14.1+cu116 torchaudio==0.13.1 --extra-index-url https://download.pytorch.org/whl/cu116

4. REFERENCE

https://velog.io/@mactto3487/%EB%94%A5%EB%9F%AC%EB%8B%9D-GPU-%ED%99%98%EA%B2%BD-%EA%B5%AC%EC%84%B1%ED%95%98%EA%B8%B0

 

GPU 사용을 위한 CUDA 환경 구성하기

이번에 데스크탑을 맞추면서 Geforce RTX 3080 그래픽카드를 구매하였다.근데 GPU를 딥러닝에 학습에 사용하기 위해선 여러 환경 구성이 필요하다는 걸 깨닫고 설치하는데5일이 걸렸다;;글카 가격만

velog.io

 

'AI' 카테고리의 다른 글

(AI-03) 딥러닝 개발 환경  (0) 2021.05.23
(AI-02) 인공지능 개발 이해  (0) 2021.05.23
(AI-01) 인공신경망 이해  (0) 2021.05.23
(OSS) 공개SW 라이선스 이해  (0) 2021.05.23
  • 네이버 블로그 공유
  • 네이버 밴드 공유
  • 페이스북 공유
  • 카카오스토리 공유