전체 글 22

데이터 라벨링

Semi-Supervised Learning (SSL)Supervised Learning 라는게 정답이 있는 것이라는 건데Semi가 붙었다? 정답이 없다는 것.그러니까 일부에는 레이블이 있는데 나머지 대부분은 레이블이 없다는 것이다.Supervised 라는 게 정답이 있어야 학습이 가능하다. 그렇다면 SSL은 어떻게 학습이 되는것일까?정답이 없는 데이터는 어떻게 학습을 시킬 수 있는 것인가?비슷한 데이터들은 같은 정답을 가질 것이다.같은 군집 내의 데이터들은 정답도 같을 것이다. same label -> 클러스터링 : 레이블 없이 데이터 가지고 군집화 한것manifold assumptionSSL은 Self training 방법론을 사용하는데,일부는 레이블을 가지고 있다면 이들은 Supervised Lea..

데이터 사이언스

인공지능, 머신러닝, 딥러닝이 세가지는 각각 포함되어지는 관계이다. 인공지능은 다양한 산업 분야에서 중요한 기술로 자리 잡고 있으며,그 중 머신러닝은 인공지능을 구현하는 주요 기법 중에 하나이다.요즘에는 특히 딥러닝(Deep Learning)이라고 해서 머신러닝의 한 분야가 매우 활발히 사용되고 있다.   산업 종류먼저 IT 기업이 있다. 대표적으로 Google, Meta 가 있다.Retail 분야에는 Amazon, Coupang 등이 있는데, 제품을 판매하는 기업인 만큼 제품을 추천해주는 추천시스템,고객을 응대하기 위한 챗봇(고객센터), 수요 예측을 위한 시스템 등에 인공지능이 들어간다. Manufacturing 분야에는 제조업, 공장 생산 라인을 유지하도록(지속적이고 안정적 + 언제 망가지는지 등의 ..