상세 컨텐츠

본문 제목

강화학습이 필요한 이유

머신러닝

by miracleai 2024. 3. 20. 14:21

본문

반응형

강화학습이 필요한 이유

강화학습(reinforcement learning)은 머신러닝의 한 종류로 어떠한 환경에서 어떠한 행동을 했을 때 그것이 잘 된 행동인지 잘못된 행동인지를 나중에 판단하고 보상(또는 벌칙)을 줌으로써 반복을 통해 스스로 학습하게 하는 분야를 말한다. 

강화학습은 인공지능을 구현하는 데 중요한 요소이기도 하지만 우리 생활에서 쉽게 찾아 볼 수 있기도 하다. 축구리그를 예로 든다면 보상과 벌칙이 철저하게 보장된다. 여기서 말하는 벌칙은 법을 어긴 것이 아니라, 일종의 페널티라고 보면 된다. 손흥민이 뛰고 있는 잉글랜드 프리미어리그의 경우 2022~23시즌, 그러니까 지난 시즌을 기준으로 1위~4위 팀은 UEFA 챔피언스리그 출전권이 주어진다. 반면에 18위~20위 팀은 2부리그인 챔피언십리그로 강등이 된다. 더 중요한 것은 UEFA 챔피언스리그 출전과 2부리그 강등이 전부가 아니라는 것이다.

 

출처:TCPschool.com

 

반응형


UEFA 챔피언스리그에 출전하면 구단에서 벌어들이는 수입은 늘어나게 된다. 조별리그만 해도 6경기를 치르고, 여기에 홈경기가 3번이다. 그리고 이기면 승리 수당, 높은 단계로 가면 더 많은 돈을 받는다. 이것으로 구단 운영에 도움이 된다. 또한 챔피언스리그에 출전한다는 것만으로 선수 영입을 하는데 유리한 측면이 있다. 선수 입장에서는 당연하지만 몸값을 높이는 계기가 될 수 있다.

잉글랜드의 경우 1부리그인 프리미어리그와 2~4부리그는 다른 연맹에서 관리한다. 1부리그는 프리미어리그 연맹에서 2~4부리그는 풋볼 리그에서 관리한다. 프리미어리그에 있으면 중계권료 수익이 20개 팀이 나눠 갖는다. 여기에는 연맹 운영비를 제외하고 나머지 절만은 20개 팀에게 공평하게 분배되고 나머지는 성적에 따라 분배된다. 이 금액이 최소 3000~4000억원 정도다. 그래서 2부리그인 챔피언십리그에서 프리미어리그로 승격을 하면 재정적으로 도움이 된다.

반면 2부리그로 떨어지면 구단 수입이 줄어든다. 잉글랜드의 경우 2~4부리그는 풋볼 리그에서 관장한다. 여기에 소속된 팀은 각 리그당 24팀, 총 72팀이다. 중계권료도 프리미어리그보다 적은데 이조차 프리미어리그와 같은 방식으로 나눠 갖는다. 즉, 72개 팀이 나눠 갖기에 적을 수밖에 없고, 하부리그일수록 더 적다. 그래서 하부리그로 강등되지 않으려고 하는 이유가 여기에 있다.

이처럼 강화학습은 우리 생활에 많이 쓰이고 우리 생활을 흉내 내는 인공지능에도 당연히 적용되어야 한다. 인공지능에도 강화학습이 적용되어 있고, 어떤 행동을 할 때 결과 유무에 따라 보상이 주어지는 방식으로 이뤄진다 그 대표적인 것이 알파고다. 승부에 유리한 위치에 두었다면 승리하는 것이고, 그렇지 않으면 패배하는 것, 이것은 어덯게 보면 보상과 벌칙이다. 바로 이것이 강화학습이고, 인공지능을 구현하는 데 있어 강화학습이 중요한 이유이기도 하다.

반응형

관련글 더보기