Focus
“꾸준히 노력해 사회에 기여하는 데이터사이언티스트 되겠다”
2020-09-18 교육
공과대학 인연준 학생(14학번), 캐글(Kaggle) M5 대회 1등
머신러닝 모델 활용해 수요 예측 대회, 5회 대회 중 학부생 우승 최초
창업보육센터 프로그램에서 만난 ‘빅리더’ 활동이 큰 도움 돼
‘캐글(Kaggle)’은 데이터사이언스와 머신러닝 분야에서는 이미 널리 알려진 빅데이터 솔루션 대회 플랫폼 회사이다. 다양한 기업이나 학회가 관련 과제를 공지하고, 가장 훌륭한 결과물을 제출한 사람에게는 상금도 준다. ‘타이타닉 생존자를 예측해라!’는 아직도 입에 오르내리는 유명한 과제다. 기업의 의사결정 분야 학자인 스피로스 마크리다키스(Spyros Makridakis) 인시아드 경영대학원 교수가 운영하는 학회인 MOFC(The Makridakis Open Forecasting Center)도 The M Competition이라는 이름으로 캐글에서 대회를 개최한다. 주로 기업과 관련된 수요예측 과제를 출제하는데, 올해로 5회를 맞이했다. 이 대회에서 공과대학 인연준 학생(14학번)이 1등을 차지했다. 학부생 우승은 대회 사상 최초이다. ‘인공지능과 데이터사이언스로 사회에 기여하는 사람이 되고 싶다’는 인연준 학생을 만나 수상과 관련한 이야기를 들어봤다.
미래혁신원 프로그램 통해 데이터사이언스에 빠져
Q. 캐글의 The M Competition에 참가한 계기는 무엇인가?
원래 환경에 관심이 많아, 환경학 및 환경공학과에 입학했다. 하지만 전공이 나에게 잘 맞지 않는다는 생각이 들던 와중 입대했다. 입대 후 행정병으로 근무하며 컴퓨터와 엑셀을 많이 쓰게 됐다. 그간 관심이 없던 분야였는데, 컴퓨터를 계속 다루게 되면서 자연스럽게 익숙해지고 친해졌다. 그러던 와중 코딩을 공부하고 있다는 같은 학과 친구를 통해 코딩과 데이터사이언스를 접하게 됐다. 이후에는 사이버지식정보방에서 관련 강의를 보면서 혼자 공부했다.
2017년 전역 이후에는 창업보육센터에서 하는 머신러닝 데이터사이언스 관련 교육을 이수했다. 수료 이후에 교육에서 만난 사람들과 함께 스터디 그룹도 만들었다. 이후에 관련 전공이 필요하다는 생각이 들어 산업경영공학과를 복수전공으로 선택하게 됐다. 미래혁신원의 프로그램 중에 전종식 교수님이 운영하는 ‘빅리더’ 2기로 합류하게 됐다. 여기서 공부도 열심히 하고 공모전에도 참여하게 됐다. 이때의 활동이 데이터사이언티스트라는 미래의 꿈을 품게 했다.
이번 캐글 The M Competition 참가도 이런 공부의 연장선이었다. 캐글은 데이터사이언스와 인공지능을 공부할 수 있는 가장 좋은 온라인 교육 공간이다. 전 세계에 있는 사람들이 과제에 도전하면서 자기가 사용한 해법을 공유해 함께 공부하는 효과도 있다. 캐글과 함께 ‘데이콘(DACON)’이라는 플랫폼도 함께 사용하고 있다. 한국판 캐글이라고 생각하면 쉽다. 데이콘에서 4개 정도의 대회에 참가했던 경험을 통해서 이번 대회를 준비했다. 캐글과 데이콘은 공부도 할 수 있고, 좋은 이력을 쌓는 기회의 장이다.
꾸준한 공부와 대회 참여로 이론과 경험 쌓아
Q. 이번 대회는 어떤 대회였고, 어떻게 1등을 차지하게 됐는지?
이번 대회는 MOFC라는 학회에서 개최하는 대회였다. 올해는 미국의 유통 업체 월마트의 2011년부터 2016년까지의 3만 개 제품의 미래 수요를 인공지능을 통해 예측하는 과제가 출제됐다. 가장 정확하게 예측한 사람 5명을 뽑았다. ‘파이썬(Python)’이라는 프로그래밍 언어를 활용했는데 데이터사이언티스트들이 가장 많이 쓰는 언어 중 하나이다. 거기에서 Light GBM(Gradient Boosting Model)이라는 머신러닝 기법을 활용해 예측했다.
캐글에서는 실시간으로 순위표를 보여준다. 참가자가 자신의 해법을 올리면 결과와 비교해 등수가 나타난다. 그걸 보며 향후에 나아갈 방향을 결정한다. 이번 대회는 2016년의 5월 판매량과 비교한 결과가 실시간으로 제공됐다. 최종 결과는 2020년 6월의 판매량을 기준으로 했다. 매월의 판매량 분포가 일정하지 않아, 5월 판매량을 정확하게 예측해도 6월 판매량 예측이 잘된다는 보장을 할 수 없었다. 정확한 결과를 모르기 때문에 답답하고 걱정되기도 했다.
작업은 주로 집에서 했다. 원래 집돌이라 불편한 점은 없었다.(웃음) 노트북과 모니터만 보면서 계속 작업했던 것만 기억난다. 작업하다 지쳐서 최종 결과물을 업로드하고는 기절한 것처럼 잠들었다. 캐글은 9시에 대회가 끝나면 9시 30분에 바로 최종 결과가 나온다. 정말 하나도 기대를 안해서 자느라 결과를 확인하지 못하고 있다가 가장 친구가 결과를 확인하고 연락을 줘서 알게 됐다.
결과를 확인하고 나서는 잠이 확 깰 정도로 기뻤다. 빅리더 활동을 같이한 선후배들과 단톡방이 있는데 거기에 가장 먼저 알렸다. 사실 빅리더 중에서 나는 성과가 좋은 편이 아니다. 수상도 거의 없고 실적도 적어서 조급해하고 있었다. 그래도 ‘인생 길게 보고 꾸준히 열심히 하자’는 생각으로 해왔는데 좋은 결과가 나와서 좋다. 운이 많이 따른 결과라고 생각하고, 같이 공부했던 빅리더 팀원과 전종식 교수님께 진심으로 감사하다.
Q. 앞으로의 목표와 과제는 무엇인가?
일단 이번 대회 1등으로 관련 논문을 써야 한다. 그동안 The M Competition은 대회 종료 이후 그해 12월에 미국에서 콘퍼런스를 개최하고 1등 수상자가 논문을 발표해왔다. 올해는 코로나19로 어떻게 진행할지 아직 정해지진 않았다고 한다. 논문 작성을 위해서 공과대학 정재윤 교수님께 도움을 받고 있다. 논문 작성은 처음이라 낯선 부분이 있다. 정재윤 교수님이 인공지능을 연구하는 교수님이시다 보니 놓치고 있던 방법론적 부분이나 세부적인 사항들에 대한 인사이트를 주고 있다.
이번 2학기에는 학업과 연구를 병행하면서 진로를 정하고 싶다. 아직 정확한 진로를 못 정했다. 학계로 갈지 산업계로 갈지 고민 중이다. 대회에서 1등을 하고 나서 관련 기업에서 취업 제의가 오기도 했다. 세부적인 사항이 맞지 않아서 가질 못했다. 하지만 앞으로도 큰 맥락에서 인공지능과 데이터사이언스 분야로 나아가고 싶고, 이를 통해 사회에 도움 되는 일을 하고 싶다. 환경에 더 좋은 가치를 부여하는 것도 좋고, 사소한 것이라도 애플리케이션을 만들어 인간의 삶을 편리하게 만드는 것도 좋다.
그리고 오랫동안 꾸준한 사람이 되고 싶다. 내 좌우명이 ‘꾸준히 Keep Going 하면 언젠가 꼭 해낼 수 있다’는 것이다. 무엇이라도 계속해서 열심히 하는 사람이 되겠다.
글 정민재 ddubi17@khu.ac.kr
사진 정병성 pr@khu.ac.kr
ⓒ 경희대학교 커뮤니케이션센터 communication@khu.ac.kr
-
많이 본 기사
-
멀티미디어
-
-
신간
-
아픈 마음과 이별하고 나와 소중한 이를 살리는 법 처음 만나는 정신과 의...
-
2024 K-콘텐츠 한류를 읽는 안과 밖의 시선 “지금 ...
-