제로샷 예측모델링이 필요한 이유
인간의 학습 방식과 인공지능의 차이
우리가 어린 시절을 떠올려보면, 처음 보는 동물이나 사물을 접했을 때 어떻게 그것을 인식했는지 생각해볼 수 있다. 예를 들어, 한 번도 실제로 본 적 없는 얼룩말을 동화책이나 사진으로 처음 접했을 때, 우리는 "말처럼 생겼는데 줄무늬가 있네"라고 이해하며 쉽게 받아들였다. 부모님이나 선생님께서 "얼룩말은 말과 비슷하지만 온몸에 검은색과 흰색 줄무늬가 있단다"라고 설명해주시면, 실제로 동물원에서 얼룩말을 처음 봤을 때도 우리는 금방 알아볼 수 있었던 이유가 바로 여기에 있다.
이것이 바로 인간이 가진 놀라운 능력이다. 우리는 직접 경험하지 않은 것도 설명만 들으면 이해하고 인식할 수 있다. 단 한 번도 보지 못한 것을 언어적 설명이나 다른 지식과의 연결을 통해 파악하는 이 능력은 인간 지능의 핵심적인 특징이다.
그런데 전통적인 인공지능은 이렇게 작동하지 않았다. 기존의 인공지능 모델은 마치 암기만 하는 학생처럼, 수천, 수만 개의 예시를 반복해서 학습해야만 그것을 인식할 수 있었다. 고양이를 인식하는 인공지능을 만들려면 수만 장의 고양이 사진을 보여주며 "이것이 고양이다"라고 가르쳐야 했다. 새로운 종류의 동물을 인식하게 하려면? 또다시 수만 장의 사진을 준비해서 처음부터 학습시켜야 했다.

전통적인 방식의 한계
이러한 전통적인 학습 방식은 여러 가지 심각한 문제를 안고 있었다.
첫째, 데이터 수집의 어려움이다. 모든 것을 학습시키려면 엄청난 양의 데이터가 필요하다. 흔한 물건이나 동물은 인터넷에 사진이 많아서 괜찮지만, 희귀한 질병의 의료 영상이나 특수한 제조 결함 사진 같은 것은 애초에 데이터를 모으기가 거의 불가능하다. 또한 데이터를 모으는 것만으로는 부족하고, 각 데이터에 정확한 라벨을 붙이는 작업도 필요한데, 이것은 전문가의 시간과 노력이 엄청나게 들어가는 고된 작업이다.
둘째, 시간과 비용의 문제이다. 새로운 작업을 할 때마다 처음부터 데이터를 모으고, 라벨을 붙이고, 모델을 학습시키는 과정을 반복해야 한다. 이 과정은 몇 주에서 몇 달이 걸릴 수 있고, 강력한 컴퓨팅 자원과 전문 인력이 필요하기 때문에 비용도 천문학적으로 증가한다. 기업이나 연구소가 인공지능을 활용하려 해도 이 진입장벽이 너무 높아서 포기하는 경우가 많았다.
셋째, 변화에 대응하기 어렵다는 점이다. 세상은 끊임없이 변화하고 있다. 새로운 제품이 출시되고, 새로운 질병이 나타나며, 새로운 트렌드가 생겨나고 있다. 전통적인 인공지능은 이러한 변화에 빠르게 적응할 수 없다. 새로운 것이 등장할 때마다 다시 데이터를 모으고 학습시켜야 하기 때문에, 실시간으로 변화하는 현실 세계의 속도를 따라잡을 수 없다.
제로샷 학습이라는 돌파구
이러한 한계를 극복하기 위해 등장한 것이 바로 '제로샷 예측모델링'이다. '제로샷(Zero-shot)'이라는 이름은 '한 번도 쏘지 않고'라는 뜻으로, 단 한 번의 학습 예시도 없이 새로운 작업을 수행할 수 있다는 의미라 할 수 있다.
제로샷 학습의 핵심 아이디어는 인간의 학습 방식을 모방하는 것이다. 우리가 얼룩말을 처음 봤을 때, 얼룩말 사진을 수천 장 본 것이 아니라 '말'과 '줄무늬'라는 이미 알고 있는 개념들을 조합해서 이해했듯이, 인공지능도 이미 학습한 지식을 새로운 상황에 응용할 수 있도록 만드는 것이다.
예를 들어, 최신 언어 모델들은 방대한 양의 텍스트를 학습하면서 세상의 다양한 지식과 개념들 사이의 관계를 이해한다. 이렇게 쌓인 이해를 바탕으로, 구체적인 예시 없이도 새로운 작업을 수행할 수 있다. "이 문장이 긍정적인가 부정적인가?"라는 질문에 대해, 감정 분석을 위한 특별한 학습 데이터 없이도 언어에 대한 일반적인 이해를 바탕으로 답할 수 있는 것이다.
| 폰 노이만 아키텍쳐에서 제로샷 모델링 구현의 한계 (1) | 2025.10.28 |
|---|---|
| 지금의 컴퓨터 시스템에서 제로샷 모델링을 완벽히 구현하기 어려운 이유 (0) | 2025.10.23 |