Focus

영상을 이해하는 인공지능 설계

2022-10-05 교육

컴퓨터공학부 박성배 교수 연구실 김봉민 학생(컴퓨터공학과 석사 4기)이 인공지능 분야 국제학회에서 대학원생 분야 최우수 논문상을 수상했다. 그는 인공지능 활용 질의 난이도 측정 관련 연구를 진행했다.

컴퓨터공학과 김봉민 학생, 국제 인공지능 학회 대학원생 최우수 논문상 수상
멀티모달 인공지능을 활용해 질의 난이도 측정하는 연구 진행

컴퓨터공학부 박성배 교수 연구실 김봉민 학생(컴퓨터공학과 석사 4기)이 인공지능 분야 국제학회인 ‘IEA/AIE 2022’에서 대학원생 분야 최우수 논문상을 받았다. IEA/AIE는 과학, 산업, 자동화 및 로봇 공학, 비즈니스 및 금융을 포함한 모든 영역에서 실생활 질의를 해결하기 위해 인공지능 시스템 적용을 강조하는 학술대회다. 단순히 이론뿐만 아니라 응용 기술까지 아울러 매년 세계 각국에서 저명한 연사와 청중이 참여한다. 일본 후쿠오카에서 진행된 IEA/AIE 2022에 논문 80여 편이 통과됐고, 김봉민 학생의 논문이 최우수 논문상 중 하나로 선정됐다.

김봉민 학생은 “박성배 교수님의 지도로 연구 방향성을 잡을 수 있었고, 중요한 부분을 어떻게 강조할지 배울 수 있었다”며 지도교수에 감사 인사를 전했다. 그는 “컴퓨팅 자원을 많이 요구하는 연구 주제임에도 연구실이 보유한 훌륭한 자원 덕분에 큰 어려움 없이 연구할 수 있었다”며 수상 소감을 남겼다.

“기존 범위 넘어 새로운 범위까지 확장 시켜”
인공지능 활용 질의 난이도 측정은 시험과 연관돼 발전이 이뤄졌다. 인공지능에 시험 질의를 딥러닝 학습시켜 제시된 문제의 질의 난이도를 분석해 점수를 차등 배분한다. 어려운 질의를 맞히면 높은 점수를, 쉬운 질의는 낮은 점수를 매긴다. 김봉민 학생은 “기존 질의 난이도 분석은 자연어 데이터만을 활용해 딥러닝 학습을 시켰다면 이번에는 자연어를 넘어 이미지, 영상 및 데이터 간 융합까지 범위를 확장했다”며 연구 의의를 설명했다.

영상 데이터를 추가해 시행한 난이도 분석은 처음이었지만 유의미한 결과를 확보했다. 김봉민 학생은 “영상 및 자연어 멀티모달 데이터로 딥러닝 모델을 학습시킨 결과 난이도 분석 정확도가 기존 대비 11% 이상 향상된 결과를 얻을 수 있었다”고 말했다. 단순히 각 데이터를 학습에 활용하는 것을 넘어 데이터를 의미 있게 융합하려는 시도도 있었다. 그는 “기존에는 데이터 각각의 벡터값을 더하거나 곱하는 것과 같이 간단한 방법으로 데이터 융합을 시도했다. 하지만 이 방법은 질의 난이도를 분석할 때 데이터가 미치는 영향을 파악하기 어렵다”고 설명했다. 김봉민 학생은 영상 데이터와 자연어 데이터 사이의 연관성을 학습할 수 있도록 ‘어텐션’ 기법을 적용해 학습 모델을 설계했다. 그는 “새로운 데이터 퓨전 네트워크를 설계해 추가적인 성능 개선을 이뤄냈다”고 말했다.

“인공지능과 사람을 구분하지 못하게 만드는 것이 목표”
이번 연구는 정보통신기획평가원의 지원을 받아 수행한 과제인 ’WiseKB : 빅데이터 이해 기반 자가 학습형 지식베이스 및 추론 기술 개발‘의 한 부분으로 수행됐다. 과제는 기계가 인공지능을 갖췄는지를 판별하는 튜링 테스트의 일종이었다. 제시된 영상에 대한 질의를 듣고 인공지능이 사람처럼 대답하게 만드는 것이 목표였다. 박성배 교수 연구팀은 영상과 자막 그리고 질의 사이의 연관성을 분석해 인공지능이 주어진 질의의 난이도를 측정하는 연구를 맡았다. 김봉민 학생은 “인공지능이 질의에 답하기 위해 기억할 영상의 길이가 짧고, 논리적 정보 처리가 적게 필요한 질의에는 간단한 답변을 생성할 수 있도록, 기억할 영상의 길이가 길고, 정보 처리량이 많으면 구체적인 답변을 출력하는 방식”이라고 덧붙였다.

김봉민 학생은 “해외 학회에 논문을 처음 투고했다. 익숙하지 않은 영어로 논문을 작성해 특히 어려웠다”고 웃음 지었다. 이어 “자연어 처리 연구, 비디오 처리도 어려웠지만, 교수님의 지도 덕분에 연구를 무사히 마무리할 수 있었고 해외 학회를 체험하며 많은 경험을 쌓을 수 있었다”고 말했다.

졸업을 앞둔 시점 졸업 연구 계획도 공유했다. 김봉민 학생은 “‘시리’, ‘빅스비’와 같이 사람과 인공지능이 상호작용하도록 만드는 대화 생성 모델을 연구할 계획”이라고 말했다. 구체적으로 사용자 발화가 입력되면 이와 관련된 정보를 검색해 기기의 답변 생성에 도움 주는 모델을 연구한다. 그는 “연구를 무사히 마치고, 해외 학술지에 논문을 투고하고 싶다”는 바람을 남겼다.

글 김율립 yulrip@khu.ac.kr
사진 정병성 pr@khu.ac.kr

ⓒ 경희대학교 커뮤니케이션센터 communication@khu.ac.kr

  • 많이 본 기사

  • 멀티미디어

    • 개강 맞은 캠퍼스

      개강 맞은 캠퍼스

      2024-03-19

      More
    • 2024학년도 입학식

      2024학년도 입학식

      2024-03-05

      More
  • 신간

    • 처음 만나는 정신과 의사

      처음 만나는 정신과 의사

      2024-03-27

      More

      아픈 마음과 이별하고 나와 소중한 이를 살리는 법 처음 만나는 정신과 의...

    • 한류를 읽는 안과 밖의 시선

      한류를 읽는 안과 밖의 시선

      2024-02-28

      More

      2024 K-콘텐츠 한류를 읽는 안과 밖의 시선 “지금 ...