본문 바로가기

자기계발/데이터사이언스

[머신러닝] 인공지능과 머신러닝이란, 머신러닝의 종류

반응형

우선 글을 시작하기 앞서서, 나는 컴퓨터 공학 전공도 아니고, 통계학을 깊게 공부하지도 않은 비전공자 일반인이다. 대학원 진학을 앞두고 통계학이 도움이 될 것 같아서 저번 학기에 통계학 과목을 수강하게 되었고, 자연스럽게 통계학이 최근 많이 활용 되는 분야인 머신러닝이나 딥러닝 쪽, 데이터사이언스 분야에 관심을 많이 갖게 되었다. 그래서 현재는 스스로 관련된 공부를 하고 학교나 외부에서 관련 특강이 있으면 참석해서 그 개념과 실제 사용되는 예시들을 공부하고 있다.

이번 글을 시작으로 머신러닝부터 딥러닝까지 내가 책이나 논문이나 유튜브를 통해 공부한 내용을 주제에 맞춰 나만의 글로 정리하여 올릴 것이고, 중간중간 실습하는 과정도 넣을 것이다. 혹시나 전공자 분들이나 관련 직종에 근무하고 계시는 분들이 보시면 정말 초보적인 수준이겠지만, 초보자들의 입장에서는 도움이 될 만한 글이 되었으면 좋겠다. 물론 나도 이 글을 쓰면서 여러 매체에 있던 내용을 정리하는 느낌으로 쓸것이기 때문에 스스로에게도 많은 도움이 될 것이다. 각 글을 쓰면서 참고한 내용은 각 글의 마지막에 첨부하겠다. 이번 글에서는 인공지능과 머신러닝의 개념에 대해 서술하겠다.

 

인공지능, 머신러닝, 딥러닝, 빅데이터, 데이터사이언스... 듣기만 하면 정말 멋있어 보이고 기술의 최전선에 있는듯한 느낌이 들기도 한다. 비전공자인 나의 주관적인 입장에서는, 이러한 분야들을 어떻게 활용할 수 있을 지가 주 관심사이다. 물론 각 개념이 어떻게 만들어졌고, 그 역사가 어떻고, 모델이 작동하는 원리가 어떤지도 나름대로 중요하다. 하지만 이제 막 이런 것들을 접한 나의 경쟁력을 따져 봤을 때에는, 4년 이상 관련 분야를 공부해 온 컴퓨터공학이나 통계학 전공인 사람들과는 정말 경쟁이 전혀 되지 않을 것이다. 그렇다면 나는 이것들을 이용하여 무엇을 할 수 있을까. 미래를 봤을 때 나의 경쟁력을 위해서는 내 전공 분야를 최대한 살리는 동시에 머신러닝 등등을 활용하는 사람이 되어야 할 것이다. 따라서 대학원에 들어가기 전에 남은 반 년동안 이 분야를 간단하게나마 이해하고, 실제 데이터를 가지고 적용해봄으로써 나중에 대학원에서 연구하거나 실제 직장에 가서 그 때의 상황에 맞게 응용 하겠다는 목적으로 공부를 하고 있다.

 

Types of AI (https://www.jedox.com/en/blog/artificial-intelligence-business-intelligence-fpa-part-2/)

 


 

인공지능”이라는 말은 최근엔 거의 마케팅 용어로 사용되는 것 같다. 냉장고부터 시작해서 에어컨, 스피커까지.. 가전 제품에는 인공지능이라는 말이 거의 다 붙어있다. 또 자동차에서는 인공지능이 자율주행으로써 아주 핫하다.  그렇다면 이 인공지능이라는 것이 대체 무엇일까. 내가 앞으로 주로 다루고 싶은 것은 인공지능이 아니므로, 간단하게 말하자면 "기계가 지능을 갖고 자신을 둘러싼 주변의 환경을 인식하여 적절한 행동을 통해 목표를 이루는 것”이라고 할 수 있다. 그래서 기계의 지능 수준에 따라 Narrow, General, Super AI로 구분하는데, 몇 년전에 유명했던 알파고는 바둑 이외의 것은 아무것도 하지 못하는 인공지능이기 때문에 Narrow AI이다.

 


 

머신러닝”은 인공지능의 한 분야로, 컴퓨터를 이용해 데이터 속에 숨어있는 패턴을 학습하는 분야이다. 좀 더 구체적으로 이야기하자면, 데이터를 이용하여 데이터를 가장 잘 설명할 수 있는 모델을 찾고 만들어서 그 결과를 활용하는 것이다. 한마디로 말하자면 컴퓨터를 이용한 통계학이라고 보면 된다. 

머신러닝에는 세 종류가 있다.

Types of ML(Kim, Ki-Jo & Tagkopoulos, Ilias. (2018). Application of machine learning in rheumatic disease research. The Korean Journal of Internal Medicine. 34. 10.3904/kjim.2018.349.)

 

1. Supervised Learning(지도학습)

Supervised Learning은 입력 데이터와 출력 데이터가 있는 경우로, 입력 데이터에 대한 대답을 얻는 것이 목표이다. Supervised Learning의 종류로는 회귀, 분류 등이 있는데, 회귀는 변수에 따른 결과값을 예측하는 것이다. 예를 들자면 집 위치, 집 크기, 집 연식 등에 따라 집 값을 예측하는 것이다. 분류는 예를 들면 고양이랑 고양이 아닌 동물 사진이 쭉 있으면 고양이인지 아닌지를 구분하는 것을 말한다.

 

2.  Unsupervised Learning(비지도학습)

Unsupervised Learning은 입력 데이터만 존재하는 경우이다. 출력 데이터(답)가 존재하지 않기 때문에 그 답을 모델이 스스로 찾아야한다. 고양이, 강아지, 토끼 등등 여러 동물이 있으면 알아서 각각의 비슷한 점을 찾아 모아놓는 클러스터링이 Unsupervised Learning의 한 예이다. 또한 차원감소, 행렬보완 등이 있는데 자세한 내용은 이후에 다루도록 하겠다.

 

3. Reinforcement Learning(강화학습)

Reinforcement Learning은 여러번 시도를 함으로써 최적의 답을 찾아가는 과정이고, 각 시도마다 얻게되는 보상을 평가함으로써 최종 답은 보상을 최대로 하는 것으로 얻게 된다. 그 예로는 로봇을 제어하거나 공정을 최적화 하는 것이 있다.

 

 


2020/01/17 - [관심거리 -> 자기계발/데이터사이언스] - [통계] Simple Linear Regression(단순선형회귀) 개념과 R 실습

 

[통계] Simple Linear Regression(단순선형회귀) 개념과 R 실습

저번 글에서는 머신러닝의 개념을 인공지능과 비교하여 알아보았다. 머신러닝의 종류로 Supervised Learning(지도학습), Unsupervised Learning(비지도학습) 그리고 Reinforcement Learning(강화학습)가 있다고 했..

dragsoseumon.tistory.com

 

반응형