Artificial Intelligence 4

뉴런 네트워크

왜 뉴런 네트워크인가? binary classification로 예시를 들자면빨간색과 파란색을 구분을 하고자 하면 선형적으로는 깔끔하게 구분을 못한다.     그런데 Activation Function를 사용하게 되면3차원으로 바꿔준다.x1와 x2은 2차원이었는데 3차원으로 변환된다. 깔끔하게 이 두가지를 구분시켜준다. 이런 관점으로 히든 유닛을 만들어 사용하는 이유이다. Universal Approximation Theoremneural network can approximate any continuous function   뉴런네트워크를 쓰면 세상의 함수를 Approximation 할 수 있다.     왼쪽은 뉴런 네트워크를 사용하지 않은 것이다.오른쪽은 뉴런 네트워크를 사용한 것인데 공간을 새로운 ..

딥 러닝

딥러닝이라는게 사실 상용화된게 얼마 되지 않았다.딥러닝 이전은 머신러닝이 활발했을 당시에는 코드를 공유하는 경우가 별로 없었다.그러다보니 논문을 보고 재구현 하는 경우가 많았는데 이또한 쉽지 않았다. 딥러닝이 시작되면서 코드가 공유되면서 빠른 속도로 성장할 수 있었다. 요즘 딥러닝에서 가장 많이 쓰이는 라이브러리는 구글의 TensorFlow랑 Meta의 PyToch라는 것을 많이 쓰고 있다.이 라이브러리의 장점은 레고를 조합하며 사용할 수 있듯이 딥러닝을 쉽게 시작할 수 있다는 진입장벽이 낮다. 쉽지는 않지만 할 수 있다는 거!  “an algorithm that is able to learn from data”     학습(learning)이라는 것은?task?   분류하는 것, 예측하는 것, 수치를 ..

데이터 라벨링

Semi-Supervised Learning (SSL)Supervised Learning 라는게 정답이 있는 것이라는 건데Semi가 붙었다? 정답이 없다는 것.그러니까 일부에는 레이블이 있는데 나머지 대부분은 레이블이 없다는 것이다.Supervised 라는 게 정답이 있어야 학습이 가능하다. 그렇다면 SSL은 어떻게 학습이 되는것일까?정답이 없는 데이터는 어떻게 학습을 시킬 수 있는 것인가?비슷한 데이터들은 같은 정답을 가질 것이다.같은 군집 내의 데이터들은 정답도 같을 것이다. same label -> 클러스터링 : 레이블 없이 데이터 가지고 군집화 한것manifold assumptionSSL은 Self training 방법론을 사용하는데,일부는 레이블을 가지고 있다면 이들은 Supervised Lea..

데이터 사이언스

인공지능, 머신러닝, 딥러닝이 세가지는 각각 포함되어지는 관계이다. 인공지능은 다양한 산업 분야에서 중요한 기술로 자리 잡고 있으며,그 중 머신러닝은 인공지능을 구현하는 주요 기법 중에 하나이다.요즘에는 특히 딥러닝(Deep Learning)이라고 해서 머신러닝의 한 분야가 매우 활발히 사용되고 있다.   산업 종류먼저 IT 기업이 있다. 대표적으로 Google, Meta 가 있다.Retail 분야에는 Amazon, Coupang 등이 있는데, 제품을 판매하는 기업인 만큼 제품을 추천해주는 추천시스템,고객을 응대하기 위한 챗봇(고객센터), 수요 예측을 위한 시스템 등에 인공지능이 들어간다. Manufacturing 분야에는 제조업, 공장 생산 라인을 유지하도록(지속적이고 안정적 + 언제 망가지는지 등의 ..