(AI-02) 인공지능 개발 이해

1강 인공지능, 머신러닝, 딥러닝

▣ 인공지능(AI; Artificial Intelligence)

- 사람의 손이 아닌 기계가 알아서 하면 인공지능이다.

- 전문가의 지식을 기반으로 (전문가 시스템)

- 데이터를 기반으로 (머신러닝)

▣ 데이터를 기반으로 한 작업

- 회귀(regression)

- 분류(classification)

- 군집화(clustering)

- 기타 ...

▣ 회귀

- 기존 데이터로 새 데이터에 대한 예측

ex) 기존 집 값을 가지고 새 집 값 예측, 과거 주가 데이터를 기반으로 미래 주가 예측, 계절에 따른 과일 수요량 예측

▣ 분류

- 예측 대상이 카테고리일 때

ex) 사진을 보고 고양이와 강아지 분류, 지난 주가 데이터로 이후의 상승과 하강을 예측, 마케팅 데이터로 판매 상승과 하강을 예측, 증세를 가지고 질병 유무를 예측, 메일의 스팸 여부 판단

▣ 군집화

- 데이터의 군집을 찾아냄

▣ 머신러닝(ML; Machine Learning)

- 데이터를 기반으로 한 인공지능의 한 분야

- 아주 다양한 방법이 있다.

SVM, 의사결정트리, Random Forest, Bayesian, K-Means Clustering, K-NN, Neural Network

▣ 딥러닝(DL; Deep Learning)

- 신경망(NN; Neural Network)을 사용한 머신러닝 방법

- 신경망의 은닉층이 많아서 (deep) DNN(Deep NN)라 칭함.

▣ AI, ML, DL

- 전문가 지식에 기반하든, 데이터에 기반하든 기계가 스스로 처리하면 인공지능(AI)

- 데이터에 기반하면 머신러닝(ML)

- 그 중 신경망을 사용하는 것이 딥러닝(DL)

- 서로 다르지만, 그냥 AI=ML=DL이라 부른다.

2강 딥러닝의 함수 근사화 능력

▣ DNN의 함수 근사화 능력

- DNN은 임의의 함수를 근사화 할 수 있다.

- 함수의 내부를 모르더라도

- 입력과 출력 데이터로

▣ 함수 근사화

- 학습된 후에는 처음 보는 입력이라도 의미 있는 출력을 낸다.

- 고양이, 강아지 구분 함수

- 어떻게 구분하는지는 정의하지 않았다.

- 정의하기는 힘들어도, 그런 함수는 존재한다.

- 단순한 입출력 데이터로 그 함수를 근사화하였다.

→ 단순히 입출력 쌍을 반복하여 학습시키지만, 얼굴 인식, 물체 인식 같은 로직을 찾아내기 어려운 문제에는 효과적

▣ 딥러닝

- DNN은 함수 근사화 능력이 있다.

- 입출력 쌍을 반복적으로 제공하여 내부를 업데이트 한다.

- 충분한 입출력 데이터와 컴퓨팅 파워를 필요

- DNN으로 특정 함수 근사화 하는 것을 딥러닝이라 한다.

▣ 딥러닝의 단점

- 입력과 출력의 데이터쌍이 있어야 한다.

- 출력 데이터(레이블링 데이터)를 사용한 지도학습

- 출력 데이터(레이블링 데이터)를 구하기 힘들다.

▣ 딥러닝의 단점 극복을 위한

- 레이블링 데이터 없는 비지도학습

- 동적으로 레이블링 데이터를 구하는 강화학습

3장 머신러닝 개발 프로세스

▣ 전체 프로세스

데이터 수집 → 데이터 전처리 → 학습 데이터 생성 → 모델 학습 → 모델 검증 → 모델 적용

▣ 데이터 수집

- 물리적인 장치에서 데이터 수집

ex) 카메라, 온도 센서, 컴퓨팅 장치

- 열악한 환경에서 수집 자체에 집중

▣ 데이터 전처리

- 데이터 파악

- 인코딩 : 데이터를 숫자화

ex) 남 -> 0, 여 -> 1

- 비정상값 처리

- 결측치 처리 (데이터가 비어 있는 것 처리)

- 정규화

▣ 학습 데이터 생성

- 모델 학습에 사용될 데이터를 생성

- 데이터 증강

- 학습 데이터와 검증 데이터로 분류

▣ 모델 학습

- 다양한 모델 중 작업에 적합한 모델 선정

- 모델의 구조와 파라미터 결정

- 모델의 구현과 학습 실행

▣ 모델 검증과 적용

- 학습된 모델을 검증 데이터로 검증

- 검증되고 성능이 좋을 경우 모델을 적용하여 SW 시스템을 구현

▣ 반복

- 모델 자체의 변경

- 모델 구조의 변경

- 모델 파라미터 변경

- 데이터 전처리 오류 수정

- 모델 입출력 변경에 따른 데이터 모양 변경

- 데이터 수집 방법 변경

- 데이터 수집 상의 오류 픽스

- 수집 대상 확대

'AI' 카테고리의 다른 글

Ubuntu CUDA 재설치 + PyTorch (0)	2023.07.31
(AI-03) 딥러닝 개발 환경 (0)	2021.05.23
(AI-01) 인공신경망 이해 (0)	2021.05.23
(OSS) 공개SW 라이선스 이해 (0)	2021.05.23

'AI' 카테고리의 다른 글

티스토리툴바