비지도학습 2

[인공지능] 비지도학습 - 개념 정리부터 프로세스 및 기법까지

1. 비지도학습이란? - 지도학습에서는 레이블이 모델의 학습 방향을 지도한다. 모델의 예측값과 레이블을 손실함수를 이용해 비교하고, 오차가 감소하는 방향으로 모델의 학습을 유도한다. 비지도학습에서는 데이터에 레이블이 존재하지 않으므로 모델의 학습 방향을 직접 지도할 기준이 없다. 따라서 이를 '비지도학습'이라 부른다. 비지도학습은 레이블이 없을 때 사용하기에 모델이 데이터를 얼마나 잘 학습했는지, 즉 모델의 성능을 지도학습처럼 직접 측정하기 어렵다. 그렇기에 간접적 또는 정석정 평가 지표를 이용해 평가한다. 비지도학습은 레이블이 없어서 명확한 기준으로 분석하기 어렵다는 단점이 있는 동시에 레이블이 있을 때는 볼 수 없었던 데이터의 새로운 특성을 파악할 수 있다는 장점도 있다. 이러한 장점 때문에 데이터 ..

빅데이터와 머신러닝 (지도학습, 비지도학습, 강화학습)

1. 빅데이터 직종별 머신러닝의 중요도 1. 데이터 사이언티스트, 데이터 리서처 - 모델을 만드는 것이 주업무인 데이터 사이언티스트와 리서처는 머신러닝 모델을 만들고 발전시키는 데 많은 시간을 할애한다. 따라서 머신러닝 기법과 모델 구축 알고리즘에 대한 지식은 필수다. 또한 머신러닝 프로세스 지식도 갖추고 있어야 한다. 해당 지식이 없으면 좋은 모델을 만들기 어렵고, 새로운 알고리즘을 구성해 실제로 구현할 수 있는 프로그래밍 실력을 갖췄더라도 모델 구축을 둘러싼 전반적인 흐름과 논리를 이해하거나 전개하지 못하게 된다. 2. 데이터 애널리스트 - 데이터 애널리스트는 주로 애널리틱스 도구나 머신러닝 패키지에 내장된 몇 개의 기법 중 하나를 선택해 모델을 만들게 된다. 따라서 모델을 만드는 알고리즘의 내부 작..