상세 컨텐츠

본문 제목

인공지능이 자연어처리를 완벽하게 하지 못하는 근본적인 이유는?

자연어처리

by miracleai 2023. 10. 13. 14:25

본문

반응형

인공지능이 자연어처리를 완벽하게 하지 못하는 근본적인 이유는?

자연어처리(NLP)는 인공지능의 중요한 분야 중 하나이다. 그러나 완벽하게 처리하는 것은 아직 어렵다. 인공지능이 자연어처리를 완벽하게 하지 못하는 근본적인 이유는 다음과 같다.

1. 언어의 복잡성: 인간이 사용하는 언어는 문법, 어휘, 의미, 문맥 등 다양한 측면에서 복잡하다. 언어마다 알파벳도 다르고, 어순도 다르다. 예를 들어 한글의 자모와 영어의 알파벳이 다르고, 한글은 ‘주어+목적어+동사’ 순으로 어순이 이루어지는데, 영어는 ‘주어+동사+목적어’ 순으로 이루어진다. 이를 본다면 인간이 사용하는 언어는 이진법으로 이루어진 컴퓨터가 사용하는 언어와 비교하면 훨씬 복잡하다. 이러한 복잡성은 컴퓨터가 인간의 언어를 이해하기 어렵게 만든다.

2. 문맥의 이해: 자연어처리 모델은 문장 내 단어들의 의미를 파악하고 문맥을 이해해야  한다. 문맥을 이해하는 것은 앞뒤 문장과의 관계를 통해서 무엇을 뜻하는 건지 파악하는 것이다. ‘잘한다’라는 단어가 있을 때 앞뒤 문장을 모고 파악을 해야 진짜 잘하고 있는지, 아니면 한심하다는 뜻으로 사용하는지 파악이 가능하다. 그런데 인공지능은 이런 것을 할 수 없다. 이 말은 문맥을 제대로 이해하지 못한다는 것이다.

3. 다의어에 대한 이해: 한 단어가 여러 가지 의미를 가질 수 있으며, 유의어가 많이 존재한다. 예를 들어 ‘밀어준다’는 말은 ‘리어카가 잘 움직이게 하기 위해 힘을 전달한다’는 말도 있지만 선거에서 특정 후보를 ‘밀어 달라’고 할 때는 지지해 달라, 혹은 선택해 달라는 의미를 지니고 있다. 이처럼 한 단어지만 여러 가지 의미를 자진 단어가 있다.

 

반응형


게다가 발음을 어떻게 하느냐에 따라서 의미가 달라지는 것도 있다. ‘눈’을 예로 들면 짧게 발음 하면 신체 기관(eye)을 가리킨다. 반면 ‘눈’을 길게 마련하면 겨울철에 하늘에서 내리는 하얀 눈(snow)을 가리킨다.

이처럼 인간의 언어는 하나의 단어가 여러 가지 의미를 지닐 수도 있고, 발음을 어떻게 하느냐에 따라 의미가 달라지는 단어도 있다. 인간은 이런 것을 쉽게 구분하고 이해하지만 인공지능은 이해하기 어렵다.

4. 시대에 따라 의미가 변하는 단어 이해: 우리가 사용하는 단어 중 시대에 따라 그 의미가 다르게 사용되는 단어가 있다. 예를 들어 ‘어리다’라는 말은 조선시대에는 ‘어리석다’라는 의미로 사용되었다. 지금은 ‘나이가 적다’라는 의미로 사용되고 있다. 용비어천가에서 ‘어린 백성’은 ‘어리석은 백성’을 의미하고, ‘어린 친구’라는 말은 ‘나이가 적은 친구’라는 의미로 사용되고 있다. 인간은 특히 글을 읽을 때 글은 시기를 알면 어떤 의미로 썼는지 이해할 수 있지만 인공지능은 그렇지 못하다. 인공지능은 이해능력이 떨어지기 때문에 인간의 언어를 완벽하게 이해할 수 없는 것이다.

인공지능이 인간의 언어를 완벽하게 처리하지 못하는 것, 즉 자연어처리를 완벽하게 하지 못하는 근본적인 이유는 아직 완벽하게 인간을 흉내 내지 못하기 때문이다. 그 이유는 지금의 인공지능이 계산에 특화된 폰 노이만 컴퓨터에서 구동되기 때문이다.

반응형

관련글 더보기