1948년 클로드 섀넌(Claude E. Shannon, 이하 Shannon)은 ‘A Mathematical Theory of Communication‘이라는 기념비적인 논문을 통해 정보를 비트 단위로 정량화하기 위한 엔트로피라는 개념을 도입했다. 또한 그는 정보를 압축하고 전송하는 문제에 대한 근본적인 이론들을 정립했고, 이를 통해 정보 이론이라는 학문 분야를 창시했다.
Shannon은 정보를 손실 없이 최대한 압축할 수 있는 이론적 한계가 그가 정의한 엔트로피와 동일하다는 것을 증명했다. 이후 다른 연구자들에 의해 효율적인 압축 알고리즘이 제안됐고, 이러한 연구는 현재 우리가 사용하는 △ZIP △JPEG △MPEG 등의 압축 파일의 핵심 요소 기술로 활용되고 있다. 또한 Shannon은 통신 시스템의 기본 개념을 정립했다(그림 1). 특별히, Shannon은 채널 용량 이론(Channel Capacity Theory)을 통해 주어진 채널에서 전송할 수 있는 최대 정보량의 이론적 한계를 규명했다. 정보 이론의 틀(Framework) 안에서, 정보를 효율적으로 전송하기 위한 통신 기술에 관한 연구가 활발히 이뤄졌다. 그리고, 이러한 통신 기술의 발전은 현재 우리가 사용하는 인터넷 및 스마트폰 등의 모바일 기기의 근간이 된다.
최근 △인공지능 △AR·VR △사물인터넷 △자율주행 등의 응용이 확대되면서 이전보다 더욱 방대한 양의 정보를 고속으로 전송하고 처리하는 것이 더욱 절실해졌다. 정보 이론의 이론적 한계에 근접하는 통신 기법이 제안됐음에도 불구하고, 현재의 제한된 정보 송신량은 전체 시스템의 병목이 되고 있다. 따라서 기존의 정보 이론적 한계를 넘어서기 위한 다양한 연구가 탐색 되고 있는데, 이 중 유망한 연구 주제가 시맨틱 통신(Semantic Communications) 패러다임이다.
시맨틱 통신의 개념은 Shannon과 Weaver에 의해 1949년에 처음 제시됐다. 그들은 통신을 다음과 같은 세 가지 단계로 구분했다.
「Level A. How accurately can the symbols of communication be transmitted?(Technical problem)
Level B. How precisely do the transmitted symbols convey the desired meaning?(Semantic problem)
Level C. How effectively does the received meaning affect conduct in the desired way?(Effectiveness problem)」
이 분류에 따르면, 정보를 비트 단위로 정량화하고 전송하는 기존의 정보 이론 및 통신 이론은 Level A에 해당한다. 전송하고자 하는 정보의 의미를 고려하는 Level B와 Level C의 통신을 일반적으로 시맨틱 통신이라고 부른다. 기존의 통신 기법(Level A 통신)과 시맨틱 통신 기법(Level B·C 통신)은 그림 2를 통해서 이해할 수 있다. 사용자가 자신의 사진이 나타내고 있는 객체를 판별하고자 한다. 기존의 통신 기법에서는 사진을 정보 부호화 기법으로 압축하고, 이후 통신 과정에서 발생하는 오류를 정정하기 위한 채널 부호화를 적용한 뒤 송신기를 통해 서버로 사진을 전송한다. 서버는 채널에서 발생한 오류를 정정하기 위한 채널 복호화(Channel Decoding)를 적용하고, 정보 복호화(Source Decoding) 과정을 통해 사용자가 전송하고자 한 사진을 복원한다. 이후, 인공지능 알고리즘을 이용한 분류 작업을 수행해 사진의 객체를 판별할 수 있다. 이 과정에서 Level A 통신은 사진의 모든 정보를 비트 단위로 오류 없이 전송하는 것을 목표로 한다.
반면 시맨틱 통신에서는 사진 정보를 모두 전송하는 대신, 분류 작업에 필요한 정보만을 추출해 전송하는 것을 목표로 한다. 분류 작업에 필수적인 정보를 보통 시맨틱 정보(Semantic Information)라고 하는데, 이 시맨틱 정보는 원래의 사진 정보에 비하면 훨씬 적은 비트로 표현할 수 있다. 시맨틱 정보만을 전송하는 경우, 서버는 원래의 사진을 복원할 수는 없지만, 애초에 목표로 했던 분류 작업을 분류 정확도의 저하 없이 고속으로 수행할 수 있다. 분류 작업 이외의 다양한 응용 상황에서, 시맨틱 통신 기법을 적용해 통신의 효율성을 높이기 위한 연구가 활발히 이루어지고 있다.
시맨틱 통신의 개념이 제시된 것은 1949년이지만, 시맨틱 통신에 관한 연구는 최근에서야 본격화됐고, 미래 통신 기술의 핵심 기술로 고려되고 있다. 주요 연구 주제로서는 우선 시맨틱 정보를 정량화하는 시맨틱 정보 이론의 정립 연구를 생각해 볼 수 있다. 몇 가지 제한적인 상황에서의 시맨틱 엔트로피(Semantic Entropy)에 대한 개념은 제안됐지만, Shannon의 엔트로피와 같이 일반적으로 받아들여지는 시맨틱 엔트로피는 아직 정립되지 않았다. 또한 효율적인 시맨틱 송수신(Transceiver) 기법 및 알고리즘 연구도 매우 중요한 연구 주제이다. 최근 심층 신경망(Deep Neural Networks)을 활용해 기존의 송수신 알고리즘을 개선하거나 대체하는 연구가 활발히 이루어지고 있다. 마지막으로 시맨틱 정보를 고려한 통신 자원 최적화 연구도 매우 중요하다. 특히 필자의 우리대학 정보 및 지능 연구실에서는 분산 추론(Distributed Inference) 상황에서, 학습된 시맨틱 정보를 활용해 통신 자원을 최적화하는 선도적인 연구를 수행했다.
Juang은 ‘Quantification and Transmission of Information and Intelligence-History and Outlook’이라는 2011년 논문을 통해 정보 이론 및 통신 기술의 발전 역사를 회고하고, 미래에는 정보의 전송을 넘어서 지능(Intelligence)의 전송이 중요한 연구 주제가 되리라 전망했다. 그가 정의한 지능은 조직화된 정보(Organized Information)를 의미하기 때문에, 시맨틱 정보와 동등한 개념이라고 생각할 수 있다. Juang의 전망처럼, 기존의 정보 이론 패러다임을 넘어선 시맨틱 통신 연구가 6G 및 그 이후의 미래 통신 기술에 중추적인 역할을 할 것으로 기대된다.