데이터 분석하던 노인

글쓴이 Inforience 날짜

클릭 >> Hello, world !! (from ShadowEgo)

벌써 5년 전이다. 내가 창업한 지 얼마 안되어서 서울과 대전을 수없이 해매고 다닐 때다. 서울 왔다 가는 길에, 대전으로 가기 위해 서울역에서 KTX를 타야 했다. 서울역 근처 커피숍에 앉아서 MacBook으로 Numbers와 Jupyter notebook 을 띄워 그래프와 코드를 들여다보면서 데이터를 분석하고 있는 노인이 있었다. 마침 우리 서비스도 스마트하게 만들어볼까 하여 우리 서비스의 로그 데이터가 담긴 USB 메모리를 들이밀며 분석해달라고 부탁했다. 값을 굉장히 비싸게 부르는 것 같았다.
“좀 싸게 해 줄 수 없습니까?” 했더니,
“이 정도 데이터 가지고 에누리 하겠소? 비싸거든 다른 데 가서 하시우.”
대단히 무뚝뚝한 노인이었다. 값을 흥정하지도 못하고 잘 분석해 달라고만 부탁했다.

그는 잠자코 열심히 분석하고 있었다. 처음에는 빨리 분석하는 것 같더니, 몇 시간이 지나도록 이리 돌려 보고 저리 돌려 보고 굼뜨기 시작하더니, 마냥 늑장이다. 내가 보기에는 그만하면 다 됐을 것 같은데, 자꾸만 코드를 수정하고 그래프도 더 띄워보고 있었다. 나에게 우리 서비스의 내용과 현황에 대해 이것저것 캐묻기도 했다. 심지어 R Studio 까지 띄우고, 여기저기에 전화를 걸어 정체를 알 수 없는 사람들과 이야기를 하기도 했다. 인제 다 됐으니 그냥 지금까지 한 결과만 달라고 해도 통 못 들은 척 대꾸가 없다. 차 시간이 빠듯해 왔다. 갑갑하고 지루하고 초조할 지경이었다.

“더 분석하지 않아도 좋으니 그만 정리해서 주십시오.” 라고 했더니, 화를 버럭 내며,
“끓을 만큼 끓어야 밥이 되지, 생쌀이 재촉한다고 밥이 되나.” 한다. 나도 기가 막혀서,
“해 달라는 사람이 좋다는데 무얼 더 한다는 말이오? 노인장, 외고집이시구먼. 차 시간이 없다니까요.”
노인은 퉁명스럽게,
“다른 데 가서 하시우. 난 결과 안 주고 돈도 안 받겠소.”
하고 USB 메모리를 MacBook에서 확 뽑는다. 지금까지 기다리고 있다가 그냥 갈 수도 없고, 차 시간은 어차피 틀린 것 같고 해서, 될 대로 되라고 체념할 수밖에 없었다.

“그럼, 마음대로 해 보시오.”
“글쎄, 재촉을 하면 점점 거칠고 늦어진다니까. 분석 결과란 제대로 만들어야지, 분석하다가 중간에 그만두면 되나.”
좀 누그러진 말씨다. 노인은 USB 메모리를 다시 MacBook에 꽂는다. 이번에는 분석하던 것을 아예 멈추고 태연스럽게 커피를 마시며 구글링을 하지 않는가. 게다가 깨알같은 폰트로 된 논문까지 들여다보는 것 같아 나도 그만 지쳐 버려 구경꾼이 되고 말았다. 내가 커피에 녹차에 아이스크림까지 먹고 스마트폰으로 영화도 한 편 다 보고 나서도 한참이 지난 후에야 문서 하나를 띄우고 이리저리 스크롤해 보더니 다 됐다고 내 준다. 사실 다 되기는 아까부터 다 돼 있던 분석결과다. 차를 놓치고 다음 차로 가야 하는 나는 불쾌하기 짝이 없었다.

“그 따위로 장사를 해 가지고 장사가 될 턱이 없다. 손님 본위가 아니고 제 본위다. 그래 가지고 값만 되게 부른다. 상도덕(商道德)도 모르고 불친절하고 무뚝뚝한 노인이다.”
생각할수록 짜증이 났다. 그러다가 뒤를 돌아다보니 노인은 태연히 허리를 펴고 밖을 내다보며 커피를 마시고 있었다. 그 때, 옆 모습이 어딘지 모르게 노인다워 보였다. 부드러운 눈매와 흰 수염에 내 마음은 약간 누그러졌다. 노인에 대한 멸시와 증오도 감쇄(減殺)된 셈이다.

다음날, 회사에 와서 분석결과를 내놨더니 직원들이 치밀하고 야무지게 분석했다고 야단이다. 유명한 회사에 맡긴 결과보다 참 좋다는 것이다. 그러나 나는 전의 것이나 별로 다른 것 같지가 않았다. 그런데 직원들의 설명을 들어 보니, 데이터 전처리를 잘 하지 않으면 결과를 믿기 어렵고, 데이터가 생성되는 과정이나 환경에 대한 배경지식은 아예 반영하지도 않으면서 인기있는 알고리즘에 통째로 넣고 돌리기만 하는 경우가 많단다. 그런 경우에는 결과도 잘 나오지 않을 뿐 아니라, 잘 나온다고 해도 결과를 제대로 해석하는게 불가능하고 믿기도 어렵단다. 요렇게 꼭 알맞은 해석까지 달아주는 데다가 API 에 바로 적용할 수 있게 만들어주기까지 하는 결과는 좀체로 만나기가 어렵다는 것이다. 나는 비로소 마음이 확 풀렸다. 그리고 그 노인에 대한 내 태도를 뉘우쳤다. 참으로 미안했다.

옛날부터 데이터마이닝의 대가들은 데이터 분석의 프로세스를 중요하게 생각했다. 그렇게 차근차근 프로세스를 제대로 밟아서 분석한 결과는 데이터의 활용도를 높일 수 있다. 그러나 요즘에는 분석 소프트웨어들이 많이 나와서 적절한 포맷으로 데이터를 입력하기만 하면 분석결과를 얻을 수 있다. 예전에는 데이터가 생성되는 과정을 살펴보고, 데이터에 대한 배경지식을 수집한 뒤에 전처리 과정과 탐험 과정을 두루 거쳤다. 잘 안되면 처음 단계로 돌아가서 다시 시작하기도 했다. 물론 이렇게 하면 날짜가 걸린다. 그러나 요새는 분석 소프트웨어를 써서 한두번 돌려본다. 금방 결과가 나온다. 그러나 믿을 수가 없다. 그렇지만 요새 남이 보지도 않는 것을 여러 단계를 거치며 탐험하고 진지하게 분석할 사람이 있을 것 같지 않다. 어느 누가 남이 보지도 않는데 차근차근 탐험하고 분석하고 해석을 해서 결과를 만들고, 또 그것을 믿고 두 배씩 값을 주겠는가. 옛날 사람들은 흥정은 흥정이요 생계는 생계지만, 물건을 만드는 그 순간만은 오직 아름다운 물건을 만든다는 그것에만 열중했다. 그리고 스스로 보람을 느꼈다. 그렇게 순수하게 심혈을 기울여 공예 미술품을 만들어 냈다. 이 분석결과도 그런 심정에서 만들었을 것이다.

나는 그 노인에 대해서 죄를 지은 것 같은 괴로움을 느꼈다. “그 따위로 해서 무슨 장사를 해 먹는담.” 하던 말은 “그런 노인이 나 같은 젊은이에게 멸시와 증오를 받는 세상에서, 어떻게 아름다운 결과가 탄생할 수 있담.” 하는 말로 바뀌어졌다. 나는 그 노인을 찾아가서 육회에 소주라도 대접하며 진심으로 사과해야겠다고 생각했다. 그래서 그 다음 일요일에 서울 가는 길로 그 노인을 찾았다. 그러나 그 노인이 앉았던 커피숍에 노인은 있지 아니했다. 커피숍 직원도 늘 오시던 분인데 갑자기 며칠 전부터 안보인다고 했다. 나는 그 노인이 앉았던 자리에 멍하니 서 있었다. 허전하고 서운했다. 내 마음은 사과드릴 길이 없어 안타까웠다. 서울역 주변을 스치는 사람들을 바라보았다. 여행을 다녀오는 듯한 사람들의 미소가 보였다. 아, 그 때 그 노인이 저 사람들을 보고 있었구나. 열심히 데이터를 분석하다가 유연히 사람들의 미소를 바라보던 노인의 거룩한 모습이 떠올랐다. 내 입에서는 무심히 “채국동리하(採菊東籬下) 유연견남산(悠然見南山)!” 도연명(陶淵明)의 싯구가 새어 나왔다.

*윤오영, “방망이 깎던 노인” (1974) 의 패러디.


1개의 댓글

댓글이 닫혔습니다.