강화학습이 필요한 이유
강화학습(reinforcement learning)은 머신러닝의 한 종류로 어떠한 환경에서 어떠한 행동을 했을 때 그것이 잘 된 행동인지 잘못된 행동인지를 나중에 판단하고 보상(또는 벌칙)을 줌으로써 반복을 통해 스스로 학습하게 하는 분야를 말한다.
강화학습은 인공지능을 구현하는 데 중요한 요소이기도 하지만 우리 생활에서 쉽게 찾아 볼 수 있기도 하다. 축구리그를 예로 든다면 보상과 벌칙이 철저하게 보장된다. 여기서 말하는 벌칙은 법을 어긴 것이 아니라, 일종의 페널티라고 보면 된다. 손흥민이 뛰고 있는 잉글랜드 프리미어리그의 경우 2022~23시즌, 그러니까 지난 시즌을 기준으로 1위~4위 팀은 UEFA 챔피언스리그 출전권이 주어진다. 반면에 18위~20위 팀은 2부리그인 챔피언십리그로 강등이 된다. 더 중요한 것은 UEFA 챔피언스리그 출전과 2부리그 강등이 전부가 아니라는 것이다.
UEFA 챔피언스리그에 출전하면 구단에서 벌어들이는 수입은 늘어나게 된다. 조별리그만 해도 6경기를 치르고, 여기에 홈경기가 3번이다. 그리고 이기면 승리 수당, 높은 단계로 가면 더 많은 돈을 받는다. 이것으로 구단 운영에 도움이 된다. 또한 챔피언스리그에 출전한다는 것만으로 선수 영입을 하는데 유리한 측면이 있다. 선수 입장에서는 당연하지만 몸값을 높이는 계기가 될 수 있다.
잉글랜드의 경우 1부리그인 프리미어리그와 2~4부리그는 다른 연맹에서 관리한다. 1부리그는 프리미어리그 연맹에서 2~4부리그는 풋볼 리그에서 관리한다. 프리미어리그에 있으면 중계권료 수익이 20개 팀이 나눠 갖는다. 여기에는 연맹 운영비를 제외하고 나머지 절만은 20개 팀에게 공평하게 분배되고 나머지는 성적에 따라 분배된다. 이 금액이 최소 3000~4000억원 정도다. 그래서 2부리그인 챔피언십리그에서 프리미어리그로 승격을 하면 재정적으로 도움이 된다.
반면 2부리그로 떨어지면 구단 수입이 줄어든다. 잉글랜드의 경우 2~4부리그는 풋볼 리그에서 관장한다. 여기에 소속된 팀은 각 리그당 24팀, 총 72팀이다. 중계권료도 프리미어리그보다 적은데 이조차 프리미어리그와 같은 방식으로 나눠 갖는다. 즉, 72개 팀이 나눠 갖기에 적을 수밖에 없고, 하부리그일수록 더 적다. 그래서 하부리그로 강등되지 않으려고 하는 이유가 여기에 있다.
이처럼 강화학습은 우리 생활에 많이 쓰이고 우리 생활을 흉내 내는 인공지능에도 당연히 적용되어야 한다. 인공지능에도 강화학습이 적용되어 있고, 어떤 행동을 할 때 결과 유무에 따라 보상이 주어지는 방식으로 이뤄진다 그 대표적인 것이 알파고다. 승부에 유리한 위치에 두었다면 승리하는 것이고, 그렇지 않으면 패배하는 것, 이것은 어덯게 보면 보상과 벌칙이다. 바로 이것이 강화학습이고, 인공지능을 구현하는 데 있어 강화학습이 중요한 이유이기도 하다.
인공지능과 강화학습 (0) | 2024.03.14 |
---|---|
인간과 인공지능의 학습 방법 차이는 (0) | 2023.06.27 |
폰 노이만 컴퓨터에서 인공지능은 어떻게 구현될까? (0) | 2023.06.26 |
머신 러닝(Machine Learning)의 약점 (0) | 2023.02.23 |
인간의 학습과 머신러닝의 차이 (0) | 2022.12.26 |