내가 일하고 있는 분야에서는 인공지능을 얼마나 활용하고 있을까? (1)

글쓴이 Inforience 날짜

클릭 >> Hello, world !! (from ShadowEgo)

들어가며…

인공지능 분야의 연구결과들은 컴퓨터로 풀 수 있는 문제들에 대한 새로운 해결법을 제시하는 경우가 많기 때문에, 다양한 분야의 문제들에 대해 새로운 해결 방향을 제시할 수 있다. 인공지능 분야의 연구를 크게 나누어 보면, 새로운 인공지능 모델이나 알고리즘을 개발하는 부류와, 문제의 해결 과정에 인공지능 모델이나 알고리즘을 활용, 적용하는 부류로 나누어 볼 수 있는 것도 같은 맥락이다.

그렇다면, 최근 들어 폭발적으로 발전하고 있는 인공지능 관련 기술들이 다른 분야의 연구들에 얼마나 영향을 끼치고 있을까 궁금해진다. 다시 말해서, 다른 분야의 연구들이 얼마나 “인공지능화” 되어가고 있을지 호기심이 생긴다. 이 호기심은 인공지능 기술의 산업별 파급력에 대한 기초적인 질문일 수도 있다.

본 포스트에서는 인공지능 연구의 파급력을 분석해 보는 첫번째 시도로서, 40여 개의 computer science(CS) 의 세부 연구분야들이 얼마나 인공지능 기술과 관련을 맺어 가고 있는가에 대하여 정량적으로 분석한 결과를 제시해 보기로 한다.

데이터 출처 및 분석 방법

이번 분석은 첫번째 시도이니, 너무 크게 욕심내지 않기로 하고, 연구자들이 자신의 연구 논문을 공개하는 오픈 사이트인 Arxiv(https://arxiv.org/)에 업로드된 CS분야의 논문들에 대한 메타 정보(각 논문들에 태깅되어 있는 category 정보)를 일단 활용해 보기로 한다. 최근에는 많은 연구자들이 (특히 CS 분야의 연구자들이) 자신의 논문을 Arxiv에 공개할 뿐만 아니라, Arxiv에서 다른 연구 결과들에 대한 정보를 수집하는 추세이므로, CS 연구의 전체적인 동향을 분석하는 데에 손색이 없을 것이다. Arxiv를 통해서는 1990년대의 논문부터 최근의 논문까지 검색, 활용할 수 있으나, 이번 분석 과정에는 2010년 1월부터 최근까지 업로드된 논문들에 대한 정보를 활용하기로 한다. 논문의 컨텐츠를 포함한 분석은 현재 진행 중이며, 다음 기회에 소개하기로 한다.

그림 1. CS 세부 분야 리스트

그림 1은 Arxiv에서 분류한 CS 세부 분야를 나타내고 있는데, 총 40여개의 세부 분야들로 분류되어 있다. 이번 분석은 Artificial Intelligence (AI) 이외의 분야에 해당하는 논문들이 AI와 얼마나 관련되어 있는가를 측정하는 것이다.

결과

그림 2. AI와 관련된 전체 논문 수의 시간에 따른 변화 패턴

가장 먼저, AI 분야의 전체 논문의 수가 어떻게 변화하고 있는지 확인해 보자. 위의 그림 2는 2010년 1월부터 2019년 9월 사이에 업로드된 AI 분야의 논문들의 총 개수를 30일 간격으로 측정한 결과를 나타낸다. (이후의 모든 수치는 Min-Max normalization 과정을 거친 결과이다.) 모두가 예상한 바와 같이, 전체 논문의 개수는 명백한 증가 패턴을 보이고 있다. Arxiv에 업로드되는 AI 분야의 논문의 수가 이렇게 증가하고 있다면, 모든 CS 세부 분야 내의 AI관련 논문의 수도 당연히 비슷한 추세로 증가하고 있지 않을까?

그림 3-(A) Robotics 분야의 전체 논문 수의 시간에 따른 변화 패턴
그림 3-(B). Robotics 분야의 논문들 중 AI와 관련된 논문 수의 시간에 따른 변화 패턴

위의 그림 3-(A)는 시간에 따른 Robotics 분야의 전체 논문 수의 변화 패턴을 나타낸다. 위의 그림 3-(B)는 Robotics 분야의 논문들 중에서 AI와 관련된 논문 수의 추세를 나타낸다. Robotics 분야의 전체 논문 수는 시간에 따라 증가하고 있으며, Robotics 분야의 AI 관련 논문의 양도 역시 시간이 흐를 수록 많아지는 패턴이 명백하게 나타나고 있다. 이 정도면, 다른 CS 세부 분야들도 모두 이와 비슷한 패턴을 보일 거라는 생각을 하게 된다.

그림 4-(A). Computational Complexity 분야의 전체 논문 수의 시간에 따른 변화 패턴
그림 4-(B). Computational Complexity 분야의 논문들 중 AI와 관련된 논문 수의 시간에 따른 변화 패턴

위의 그림 4-(A)는 Computational Complexity 분야의 전체 논문의 수가 시간에 따라 증가하는 패턴을 보이고 있음을 나타낸다. 그러나, 그림 4-(B)에서 볼 수 있는 것과 같이, Computational Complexity 분야의 논문들 중 AI와 관련된 논문의 수는 뚜렷한 증가 추세를 보이지 않는다. Arxiv에 업로드되는 논문의 수가 계속 증가하고 있고, AI 논문의 수도 크게 증가하고 있는데, AI와 관련된 논문의 수가 증가하지 않는 CS 세부 분야가 있다는 점이 상당히 흥미롭다.

Correlation 분석 결과

그림 5. AI 전체 논문 수의 변화 추세와 각 세부분야의 AI 관련 논문 수의 변화 추세 사이의 correlation
표 1. Correlation 값을 기준으로 평가한 상위 7개 분야와 하위 7개 분야

그림 5는 AI 전체 논문 수의 변화 추세와 각 세부분야의 AI 관련 논문 수의 변화 추세 사이의 correlation을 각 세부 분야 별로 측정하고, correlation 값이 큰 것부터 나열한 것이다. Correlation 값이 크다면, 해당 세부 분야의 AI 관련 논문 수의 증가 패턴이 AI 전체 논문 수의 증가 패턴과 유사하다고 볼 수 있다. 즉, 해당 분야는 AI 분야의 발전에 의해 영향을 받고 있다는 해석을 할 수 있을 것이다. 물론, 값이 작으면, 영향을 덜 받고 있다고 볼 수 있다. 표 1은 correlation 값을 기준으로 평가한 상위 7개 분야와 하위 7개 분야를 정리한 것이다.

Trend distance 분석 결과

그림 6. AI 전체 논문 수의 변화 추세와 각 세부분야의 AI 관련 논문 수의 변화 추세 사이의 distance
표 2. Distance 값을 기준으로 평가한 상위 7개 분야와 하위 7개 분야

그림 6은 AI 전체 논문 수의 변화 추세와 각 세부분야의 AI 관련 논문 수의 변화 추세 사이의 distance를 각 세부 분야 별로 DTW(Dynamic Time Warping)를 써서 측정하고, distance값이 작은 것부터 나열한 것이다. Distance 값이 작다면, 유사도가 높은 것이므로, 해당 세부 분야의 AI 관련 논문의 증가 패턴이 AI 전체 논문의 증가 패턴과 유사하다고 볼 수 있다. 물론, 값이 크면, 두 패턴 사이의 유사도가 낮다고 볼 수 있다. DTW는 비교 대상이 되는 시계열들에 나타나는 유의미한 변화 포인트 사이에 시간적인 차이가 나타날 경우에도 이를 보정하면서 distance를 계산하므로, 좀 더 융통성 있게 비교할 수 있다. 표 2는 DTW distance 값을 기준으로 평가한 상위 7개 분야와 하위 7개 분야를 정리한 것이다.

잠정적인 결론 및 future works

그림 5와 그림 6, 그리고 표 1과 표 2에 나타난 결과를 보면, correlation 값을 활용한 결과와 DTW distance 값을 활용한 결과가 유사함을 알 수 있다. 상위 7개 분야들은 학습과 비전, 패턴인식, 언어 처리, 로봇, 보안 등의 분야들로 구성되어 있고, 하위 7개 분야들은 시스템 관련 분야 또는 전통적인 수학적 알고리즘을 연구하는 분야들로 구성되어 있다. 상위에 랭크된 분야들의 구성을 보면, 최근 AI 분야의 발전 추세를 고려할 때, 본 포스트의 분석 결과가 꽤 타당해 보인다.

이번 분석 결과는 꽤 재미있지만, 논문의 컨텐츠를 분석하지 않고 이미 잘 정리되어 있는 메타 정보만을 활용했다는 한계가 있다. 논문의 컨텐츠를 기반으로 AI 관련성을 측정할 수 있다면, 더욱 정교한 추세와 패턴을 얻을 수 있을 것이다. 또한 컨텐츠를 활용한 분석을 하게 되면, Arxiv에서 제공하는 공통된 category 메타 정보를 활용할 수 없는 다른 공학, 자연과학, 사회과학 분야의 논문들도 분석 대상에 포함시킬 수 있을 것이다. 인포리언스는 현재 이와 관련된 작업을 진행하고 있다.

너무 계산적으로 들릴 수도 있겠지만, 자신이 몸담고 있는 분야의 AI 관련성이 높지 않다면, AI 기술을 자신의 활동 분야의 주요 문제에 먼저 적용해 보면 어떨까? 어쩌면 다른 사람들보다 먼저 새로운 문제 해결법을 제시할 수도 있지 않을까? 이러한 생각은, 과거에는 없었던 것을 창조해야만 새로운 것을 시작할 수 있는 것이 아니라, 다른 분야에서 쓰이고 있는 방법론이나 도구를 새로운 분야에 적용, 활용해 보는 것으로도 새로운 창조과정을 시작할 수 있다는 믿음에서 비롯된다.


1개의 댓글

인포리언스의 2019 여름나기 – 인포리언스 · 2019-10-30 2:19 오후

[…] [2] 내가 일하고 있는 분야에서는 인공지능을 얼마나 활용하고 있을까? (1) : https://inforience.net/2019/10/04/ai-category-influence1/ […]

댓글이 닫혔습니다.