우리대학 컴퓨터 비전 분야, 새로운 기록을 쓰다

오는 19일부터 24일까지 미국 루이지애나 뉴올리언스에서 진행되는 2022 CVPR(Computer Vision and Pattern Recognition, 국제 컴퓨터비전·패턴인식 학술대회)에서 우리대학 컴퓨터공학과 △곽수하 △박재식 △조민수 교수가 이끄는 컴퓨터비전 연구실이 국내 최다 논문을 발표할 예정이다. CVPR은 인공지능 분야에서 가장 영향력이 큰 국제학술대회로, 이공학 전 분야에서도 4위에 해당하는 막대한 영향력을 갖는 컴퓨터비전 분야 학술대회 중 하나이다. 한 연구실에서 이처럼 다수 논문이 채택되는 것은 세계적으로도 이례적이며, 교수 개인당 논문 편수로도 국내 최다에 해당하는 성과이다. 본지는 세 교수를 만나 연구 내용과 함께 소감을 들어봤다.

논문 발표를 앞둔 소감은

곽: 연구실 학생들과 좋은 실적을 이뤄 이번 발표가 학생들의 미래에 도움이 될 것이라는 점에서 기쁘다. 한편으로는 논문 개수보다 영향력 있는 연구를 하는 것이 중요하기 때문에 발표 논문 개수에 너무 일희일비할 필요는 없을 것 같다.

박: 한 연구실에서 논문을 10편 이상 쓰기도 쉽지 않은데 이렇게 많이 쓸 수 있어 뿌듯하다. 저는 3편만 썼기에 두 교수님이 대단하다고 생각한다.

조: 논문 개수가 이렇게 많아지게 된 것은 운이 좋았던 것도 있지만, 세 분의 교수님 모두 그동안 꾸준히 연구를 잘 해왔다는 점에서 가능했던 것이 아닐까 생각한다. 점점 좋은 논문이 많아지고 연구실 학생들도 성장하고 있는 것 같은데, 앞으로도 지속할 수 있도록 큰 책임감을 느낀다. 이번에 학회에서 발표도 많이 하고, 자랑도 많이 하면서 앞으로 더 연구를 잘해야겠다고 생각하고 있다.

연구 분야를 간단히 소개한다면

곽: 사람 수준의 시각 인지가 가능한 모델을 만드는 연구를 하고 있다. 영상인식·AI 모델이 사람의 도움을 덜 받으면서 스스로 학습하고, 보지 못하는 환경에서도 잘 적응하고, 게임을 통해 세계를 배운 모델이 실제 세상에서도 잘 학습하며, 비, 눈이 오거나 깜깜한 환경 등 영상인식이 어려운 상황에서도 이를 잘하도록 하는 것이 목표다.

박: 컴퓨터비전 분야 중 3D 비전 분야를 연구하고 있다. 요즘 사람들은 카메라로 사진, 영상을 찍는데, 최근 3D 센서가 개발되고 저렴해지면서 많이 사용되고 있다. 초반에는 초점이나 대략적인 거리를 알기 위해 3D 센서를 사용했지만, 최근 성능이 굉장히 좋아지며 2차원 공간에서 직접 3차원을 찍을 수 있는 카메라를 개발 중이다. 현재는 자율주행 자동차, 로봇 등의 기술에 어떤 인공지능을 사용하면 3D 공간으로의 적용이 가능할지를 연구하고 있다. 이전에는 3D 공간 복원을 연구했고, 우리대학에서는 3D 공간 인식 및 분석 연구를 진행하고 있다.

조: 한 영상의 특정 지점이 반대편 영상의 어느 지점에 해당하는지와 같은 대응 관계를 인식하는 것을 영상정합이라고 한다. 매칭 문제의 해법으로 헝가리안 알고리즘 등이 있듯, 정합 문제는 컴퓨터비전 연구 이전부터 연구돼온 고전적인 분야다. 그중에서도 시각 정보 분야에서 고차원적인 정합 문제를 푸는 연구를 주로 하고 있다.

CVPR에서 발표할 논문 내용을 간단히 소개한다면

곽: 이번에 진행한 연구는 사람이 자연어로 표현한 물체를 이미지에서 찾고 세분화하는 모델을 개발하는 연구 다. 영상인식이라고 하면 사전에 정의된 물체들을 찾고 그 경계를 그리는 것부터 시작한다. 예전에는 이미 지에서 찾으려는 물체가 한정적이었는데, 인공지능 모델들이 다양한 환경에서 사용되며 검출하고자 하는 물체들이 다양해졌고 이에 특화된 모델이 필요해졌다. 이런 요구를 충족하고자 연구를 수행했으며, 현재 해 당 기술을 이미지에서 비디오로 확장하는 연구를 진행 중이다.

박: 3차원 공간 이해 기법과 메타버스 공간의 인공지능 색칠기법에 대해 발표할 예정이다. 3차원 공간 이해 기 법은 현재 사진에서 대략적인 위치만 알 수 있는 인공지능의 한계를 극복해 인공지능도 사람처럼 사진의 3 차원 공간을 인식할 수 있는 기법과 3차원 데이터가 주어졌을 때 물체의 종류를 인식하는 기법이다. 또한, 메타버스 공간의 인공지능 색칠기법은 인공지능 개발자들이 무한대의 공간을 생성하고 싶을 때 자동으로 색칠할 수 있는 방법을 만든 것이라고 할 수 있다.

조: 영상을 정합하는 것이 곧 ‘대칭’을 찾는 것이라고 할 수 있고, 대칭이 깨지는 부분이 깊이를 만드는 정보가 된다. 영상에 보이지 않는 이면의 구조를 파악하려면 매칭을 통해 대칭을 찾음으로써 분석해야 한다. 등변 성신경망이라는 특수한 구조를 쓰면 기존에 잘 감지하지 못했던 특징들을 정확히 감지할 수 있기에 대칭 분석 문제에 적용하는 연구를 하고 있다. 또한, 시맨틱 정합 기법에 있어서는 굉장히 다른 물체들 사이에서 대응점을 찾는 연구를 하고 있고, 이를 통해 훨씬 고차원적인 시각 추론을 할 수 있다고 확신하고 있다.

세 교수의 연구 분야가 서로 다름에도 협력 및 공동연구를 통해 큰 성과를 낼 수 있는 핵심 비결은 무엇인지

곽: 전공 분야를 연구하더라도 여러 교수님들을 모셔 조언을 듣다 보면 연구의 질이 굉장히 높아진다. 연구실 교수가 세 명이라는 특징이 학생들에게 여러 교수님과 상호작용할 수 있는 자유를 제공하는 것 같다. 이를 통해 협력할 수 있는 분위기가 조성되면서 연구의 질이 높아졌다고 생각한다.

박: 세 교수 모두 컴퓨터 비전을 기반으로 하고 있기에 학문적 기반이 아예 다르다고는 할 수 없다. 특별한 비결이 있다기보다는 학생 수가 많음에도 연구실 분위기가 좋은 것이 크게 작용한 것 같다. 연구실 규모가 큰 것은 단점이 될 수도 있지만, 서로 돕고 다 함께 다양한 문제를 고민하고 풀어나감으로써 연구가 잘 진행된 것 같다.

조: 저희끼리는 함께 연구했던 경험도 있고, 학회에서 종종 만나는 등 예전부터 알고 지내던 사이였다가 함께 랩을 꾸리게 됐다. 셋의 학문적 배경이 크게 다르다고 할 순 없지만 관심 분야나 연구 스타일은 조금씩 다른 편이다. 그런 점이 보완적인 역할을 해 좋은 시너지 효과를 주는 것 같다. 학생들도 여러 교수님과 대화를 나누면서 자유롭게 문제에 대해 고민하고 토론할 수 있다는 점이 저희 연구실의 강점이라고 생각한다.

컴퓨터공학과 및 컴퓨터비전 분야에 관심 있는 학부생들에게 전하고 싶은 말이 있다면

곽: 본인이 정말 컴퓨터비전 분야에 관심이 있는지, 큰 흥미를 느끼고 있는지 확인하기 위해 연구 참여를 한번 해보기를 추천한다. 연구 참여를 통해 컴퓨터비전 분야에 대한 좀 더 깊이 있는 경험을 해볼 수도 있을 것이다.

박: 좋은 성과를 내는 저희 연구실에 많은 관심을 가져주셔서 감사하다. 다만 컴퓨터공학과에는 다른 훌륭한 연구실들도 많기에 연구 참여를 해보면 좋을 것 같다. 진정으로 컴퓨터비전에 관심이 있으시다면 언제든 환영이다.

조: 컴퓨터비전 분야가 정말 인기 없을 때 이 분야의 전공을 시작했다. 개인적으로는 인기와 상관없이 정말 흥미로운 분야라고 생각한다. 인공지능이라고 하면 대부분 기계학습 같은 것을 떠올리지만, 사실은 컴퓨터비전도 거의 핵심에 있다고 생각한다. 너무 재미있는 분야라서 한 번쯤은 연구 참여도 해보고, 적성에 맞는다면 저희 랩에 지원해 보시면 좋겠다.

박준우, 이태훈, 장유진 기자 다른기사 보기