[AI] 1. 머신러닝의 개념과 종류
1) 머신러닝이란?
머신러닝 또는 기계학습은 인공지능(AI) 연구 분야 중 하나로, 컴퓨터가 인간의 학습 능력과 같은 기능을 하도록 하는 기술 및 기법입니다.
머신러닝 (기계 학습) : 기계나 컴퓨터가 데이터로부터 학습할 수 있도록 하는 인공지능 기술, 규칙을 프로그래밍하지 않아도 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야.
머신러닝이 작동하기 위한 필수조건은 '데이터'이며, 데이터를 통해 문제를 해결하고자 하는 어떤 분야든 머신러닝 기술을 적용할 수 있습니다.
2) 인공지능과 머신러닝
머신러닝은 인공지능의 하위집합 중 하나입니다. 인공지능의 첫 번째 하위집합이 머신러닝이고 그 안에 딥러닝이 있습니다.
인공지능 (AI) : 사람처럼 학습하고 추론할 수 있는 지능을 가진 시스템을 만든는 기술. 강인공지능과 약인공지능으로 분류됨. => 사고나 학습 등 인간이 가진 지적 능력을 컴퓨터를 통해 구현하는 기술
=> 사고나 학습 등 인간이 가진 지적 능력을 컴퓨터를 통해 구현하는 기술.
머신러닝 : 규칙을 프로그래밍하지 않아도 데이터에서 자동으로 규칙을 학습하는 알고리즘을 연구하는 분야.
=> 컴퓨터가 스스로 학습하여 인공지능의 성능을 향상시키는 기술 방법.
딥러닝 : 머신러닝 알고리즘 중 인공신경망을 기반으로 한 방법.
=> 인간의 뉴런과 비슷한 인공신경망 방식으로 정보를 처리하는 방법.
* 인공신경망(ANN) : 사람 또는 동물이 가진 생물학적 두뇌의 뉴런을 기반으로 모델링된 네트워크.
3) 머신러닝 알고리즘 종류
머신러닝은 다루는 데이터의 특성과 도출되는 결과에 따라 세 가지의 작동 방식으로 구분됩니다.
우선 정답의 존재 유무에 따라 지도학습과 비지도학습으로 나뉘고, 이 두 가지 알고리즘과는 다른 종류의 알고리즘인 강화학습이 있습니다.
이런 알고리즘은 절대적인 것은 아니며 상황에 따라 변경하거나 중복해서 사용할 수도 있습니다.
① 지도학습 : 정답(레이블)이 존재하는 환경에서 데이터와 정답(타깃 데이터) 사이의 관계를 학습.
* 준지도학습 : 정답이 일부만 존재.
② 비지도학습 : 정답(레이블)이 주어지지 않은 상태에서의 학습 방법.
③ 강화학습 : 알고리즘이 행동한 결과로 얻는 환경으로부터의 보상을 최대화하도록 학습.
여기서 '데이터'는 입력(Input), '정답'은 타겟(Taget) 또는 출력(Output)이라고 하며 입력으로 사용되는 각각의 변수를 특성(Feature)이라고 합니다.
4) 지도학습의 종류
정답이 존재하는 머신러닝 알고리즘인 지도학습은 예측 대상에 따라 다시 분류와 회귀 문제로 구분됩니다.
① 회귀 : 출력(타켓)이 연속형 변수. ex. 속도, 몸무게, 성적 점수, 주가, 국민소득
② 분류 : 출력(타겟)이 이산형 변수(클래스(Class) 또는 범주(Category)). ex. 성별, 암의 종류, 꽃의 품종
5) 머신러닝 프로젝트 진행 순서
머신러닝은 다음과 같은 프로세스를 통해 수행됩니다.
문제 정의 → 데이터 수집 → 데이터 탐색 및 시각화 → 머신러닝 알고리즘을 위한 데이터 준비 → 모델 선택 및 훈련 → 모델 상세 조정 → 솔루션 제시 → 시스템 론칭 및 모니터링 → 유지 보수