기계학습을 설명하기 위해서는 인공지능에 대해 먼저 공부해야 한다. 인공지능은 인간의 학습 능력, 추론 능력, 지각 능력을 인공적으로 구현하려는 컴퓨터 과학의 세부 분야이다. 즉, 인간의 지능을 모방한 기능을 갖춘 컴퓨터 시스템이다. 반면 기계학습은 컴퓨터가 빅데이터로부터 자동으로 지능에 대한 정보를 얻어내는 방법이라고 보면 된다.
인공지능의 역사는 개척기, 황금기, 암흑기, 개화기로 나누어진다. 먼저 개척기에 대해 살펴본다. 1950년대부터 미국의 주요 대학과 연구소에서 수학, 공학자들이 인공지능 연구 분야를 개척하기 시작했는데, 그 대표적인 예로는 1950년도의 앨런 튜링의 튜링 테스트가 있다. 튜링 테스트의 본래 목적은 심리학에 대한 실험적인 접근이었다고 한다. 기계가 인간의 사고를 얼마나 이해하고 생각, 행동할 수 있는지 판단하는 테스트이다. 1956년대 다트머스 학회에서 존 매카시가 인공지능이라고 명명한 이후 해당 용어가 지속해서 사용되게 되었다. 1956년부터 1974년까지 인공지능의 여러 분야의 발전이 비약적으로 이루어졌다. 이에 따라 인공지능이 사람이 하는 일 대부분을 처리할 수 있게 될 것이라는 낙관론이 등장하며 인공지능 연구 분야가 꽃 피우기 시작했다. 하지만 사람들은 이내 인공지능이 실제 사람과 대화가 불가능하단 것을 깨닫기 시작했다. 이에 따라 인공지능 발전 분야로 투입되던 막대한 자금이 끊기면서 연구의 암흑기가 시작되었다. 인공지능 역사의 암흑기로 기억되는 1974년부터 1980년 동안에는 인공지능 연구가 매우 더디게 진행되었다. 그 후 개화기가 화려하게 등장했다. 1980년대에는 전문가 시스템의 형식으로 인공지능 프로그램이 활용되었다. 1982년도에는 물리학자인 존 홉필드가 신경망 모형의 정보학습 및 처리능력을 증명하였고, 1986년도에 데이비드 러멜하트는 신경망 모형을 학습하는 새로운 알고리즘인 역전파 알고리즘을 새롭게 제안하였다. 1990년대 들어서는 인공지능 기술들이 실제 산업에 적용되기 시작했다.
기계학습에 대해서 이제 배워보자. 기계학습이란 데이터를 기반으로 컴퓨터가 자동으로 새로운 지식을 학습하고, 알고리즘을 구현하는 방식이다. 기계학습은 크게 지도학습, 비지도 학습, 강화학습으로 분류되는데 각각의 장단점이 뚜렷하다. 먼저 지도학습부터 살펴본다. 지도학습이란 입력변수를 기반으로 출력변수를 예측하는 기계학습의 핵심 분야이다. 비지도 학습은 주어진 데이터들의 관계를 규명하는 것을 목적으로 하여 차원 축소, 새로운 데이터의 생성 등에 응용되는 학습 방식이다. 강화학습은 변화하는 환경에서 최적의 의사결정을 목표로 하는 기계학습법이다. 지도학습의 경우 크게 선형모형, 의사결정나무 및 앙상블, 신경망 모형 및 딥러닝 분야로 나누어진다. 비지도 학습은 지도학습과 달리 데이터 라벨을 주지 않는다는 특징이 있다. 비지도 학습의 대표적인 분야로는 군집분석과 차원 축소법이 있다. 군집분석은 또 계층적 군집분석, 비 계층적 군집분석으로 나누어진다. 계층적 군집분석은 덴드로그램을 이용하여 표현되며, 비 계층적 군집분석은 K-평균 군집분석, 가우시안 혼합 모형 등으로 표현된다. 차원 축소법은 선형결합을 이용한 차원 축소, 신경망 모형을 이용한 차원 축소가 있다. 선형결합을 이용하여 차원을 축소하는 기법에는 주성분 분석, 인자 분석 등이 있다. 신경망 모형이란 생물과 인간의 뇌 구조를 모방하여 만든 모형이다.
다음으로는 여러 가지 산업 분야에서 다양하게 응용되고 있는 기계학습 사례에 관해 설명해 보고자 한다. 대표적인 예로는 역시 의료 분야이다. 그뿐만 아니라 금융 분야, 교육 분야, 쇼핑 분야, 기계 번역, 지능형 개인비서 분야에도 사용된다. 먼저 의료분야를 살펴보면 최근 기계학습을 이용하여 유전자와 유전체 정보를 이용해 질병을 진단하는 알고리즘을 해결하려는 연구가 이루어지고 있다. 방대한 양의 자료를 저장, 처리해야 하는 만큼 기계학습에 적합한 산업 분야이다.
그다음으로는 금융 분야의 응용 사례를 살펴본다. 금융 분야의 응용 사례는 투자자문과 신용평가가 있다. 기존 금융공학 기법에서 탈피하여 실시간으로 SNS 자료를 분석하여 투자 관련 의사결정에 필요한 정보와 동향을 제공하는 기업체까지 등장했다. 교육 분야에도 활용되고 있는 기계학습은, 개인의 관심사와 관심 수준에 맞는 강의를 추천해 주고 있다.
쇼핑 분야가 아마 일반인이 가장 체감할 수 있는 분야일 것이다. 아마존에서는 구매 이력과 사용자의 평점을 통해 맞춤 상품을 제공하며, 국내에서는 쿠팡과 같은 온라인 플랫폼이 이와 유사하게 기능하고 있다. 또한 지그재그와 같은 패션 애플리케이션도 사용자에게 최적화된 검색 결과와 추천 결과를 제공하고 있다. 이를 위해 구매 이력, 상품 클릭 정보, 평정, 사용자 정보 등을 활용하고 있다. 우리 모두 관심 있는 상품을 한 번 검색하면 그와 유사한 사이트가 계속 등장하는 것을 체감했을 것이다. 이런 추천 시스템이 모두 인공지능과 기계학습을 통해 일반 사용자에게 적용되고 있다.
기계번역은 초기에는 주로 언어학자들의 규칙에 기반을 두었지만, 지금은 각종 포털 사이트들에서 자체적인 알고리즘을 통해 학습시킨 번역 애플리케이션들이 제공되고 있다. 이런 애플리케이션의 성능은 매우 뛰어나서 다른 나라 언어를 하지 못한다고 해도 해외여행을 갈 때 전혀 지장이 없을 정도로 발전했다. 그 외에도 택배 회사, 택시 회사 등 다양한 산업 분야에서 사용되고 있다.