우리들이 품은 bias, 그리고 새로운 bias의 출현

글쓴이 Inforience 날짜

클릭 >> Hello, world !! (from ShadowEgo)

Bias?

편향, 즉 bias는 무엇이고, 왜 중요할까? Bias는 “tendency of favoring one thing or opinion over another” [1] 라고 정의된다. 간단히 말하면, 특정 무엇인가를 (다른 것들에 비해) 선호하게 되는 경향 또는 현상이라고 할 수 있다. 예를 들어, 특정 과목, 특정 연예인, 특정 미디어 채널을 좋아하는 현상 등이 해당된다. 사실 Bias는 늘 존재해 왔고, 지금도 존재하며, 어쩌면 피할 수 없는 것이기도 하다. 뇌의 구조와 작동방식에 의해, 우리가 받은 교육을 통해, 우리가 만나는 사람들과의 상호작용을 통해, 우리가 보고 즐기는 모든 것을 통해 알지 못하는 사이에 생성되어 있는 것이다. 믿을만 하다고 생각되는 매체나 사람에 의해 만들어진 컨텐츠, 자신의 신념과 일치하는 컨텐츠는 내용의 진위를 제대로 확인하지도 않은 상태에서 소셜 미디어를 통해 공유하기도 하고, 전문가라는 사람이 말한 내용이나 유명 연구자가 발표한 연구 결과는 별 고민없이 진리처럼 받아들이기도 한다.

그렇다면, 왜 우리는 bias에 대해 심각한 고찰을 해봐야 할까? 과거에는 부족한 정보로 인해 bias가 생겼을 테지만, 지금 우리는 과거와 달리 엄청나게 다양한 정보를 접할 수 있는 정보화 사회 속에서 살고 있는데 bias가 그렇게 심각할까? 결론부터 말하자면, bias는 너무 많은 정보를 접하게 되었기 때문에 오히려 더 심각할 수 있다. 그리고 bias를 의도적으로 발생시키려는 움직임도 많으며, 더구나 이제는 인공지능이 bias를 만들어 내어 우리에게 큰 영향을 미칠 수 있는 시대가 오고 있다는 점을 생각해야 한다.

이번 포스트에서는 우리가 컴퓨터나 스마트폰을 통해 웹 정보를 접하는 과정에서 왜 bias가 발생하게 되는지 간략하게 살펴보기로 한다.

컨텐츠를 만들어 내는 사용자가 소수에 불과하다.

웹을 활용하는 사람들은 아주 많지만, 웹 상에 업로드되는 컨텐츠들은 일부 사용자들 또는 매체들에 의해서만 만들어진다. 특히 소셜 미디어의 경우 그런 현상이 두드러진다. [2,3,4] 즉, 소수의 사용자가 만든 컨텐츠에 의해 다수의 사용자가 영향을 받는 현상이 나타나고 있다.

일부 컨텐츠들만 사용자들에게 지속적으로 노출된다.

웹 컨텐츠들은 링크를 통해 서로 연결되는데, 현재의 페이지를 어떤 페이지와 연결할 것인지를 결정하는 것은 컨텐츠 생성자이다. 따라서, 사용자가 클릭하게 될 컨텐츠는 컨텐츠 생성자 및 웹 사이트 설계자의 의도와 성향에 의해 크게 영향을 받게 된다. 물론, 검색엔진을 활용하여 능동적으로 새로운 컨텐츠를 찾아볼 수 있지만, 검색엔진이 웹 공간 내의 모든 컨텐츠를 빠짐없이 다 찾아낼 수는 없으며, 새로운 컨텐츠가 검색엔진에 의해 발견, 인덱싱되는 데에는 시간이 필요하다. 또한 검색엔진 마저도 검색엔진 설계자가 고안한 랭킹 알고리즘을 통해 웹 페이지들을 필터링하며, 사용자들은 검색결과 리스트에서 상위에 랭크된 페이지들을 우선적으로 보게 된다. 결국 컨텐츠 생성자 또는 검색엔진의 선택을 받지 못한 컨텐츠들은 사용자들에게 노출될 가능성이 낮아지며, 이와 반대로 사용자들에게 노출될 기회를 얻은 컨텐츠들은 계속적으로 인기를 얻게 된다. [5, 6]

가짜 정보, 중복된 정보가 생성, 유통된다.

웹 공간에는 누구나 컨텐츠를 만들어 업로드할 수 있으므로, 실제와는 다른, 잘못된 정보를 담은 컨텐츠들이 포함될 수 있다. [7] 또한 이러한 컨텐츠들이 중복 생성되어 유통되면 많은 사용자들에게 퍼질 수 있다. 이러한 컨텐츠에 지속적으로 노출되면 잘못된 정보를 진실이라고 믿거나, 대부분의 사람들이 이 컨텐츠의 내용을 좋아하거나 해당 내용에 동의한다는 잘못된 생각을 하게 될 수 있다.

추천, 개인화 및 랭킹 알고리즘들에 의해 컨텐츠 선택의 폭이 제한된다.

사용자들이 웹을 활용하는 동안, 다양한 수준과 종류의 추천 알고리즘이나 개인화 알고리즘이 동작한다. 이러한 알고리즘들은 사용자의 성향과 기호를 분석하고, 이를 바탕으로 효율적으로 컨텐츠를 선택하도록 고안되었으나, 한편으로는 사용자의 선택의 폭을 제한한다. 또한 이러한 알고리즘들은 사용자로 하여금 특정 컨텐츠나 아이템을 선택하도록 유도하는 역할도 수행할 수 있다. 따라서 사용자들은 보이지 않는 어떤 힘에 의해 드넓은 웹 공간을 충분히 누리지 못하고 자신도 모르는 사이에 특정 컨텐츠 그룹에서 빠져 나오기 힘들어지게 될 수 있다.

UI 구조의 영향을 받는다.

당연한 이야기겠지만, 우리는 위에서 아래로, 왼쪽에서 오른쪽으로 글을 읽는다. (물론, 반대로 읽는 문화권도 있지만.) 따라서, 우리가 웹 컨텐츠를 읽을 때에는 일정한 패턴이 나타나게 되고 [8] 웹 사이트나 페이지를 디자인하는 사람들은 이러한 패턴을 적절히 활용하여 컨텐츠를 배치한다. 오른쪽보다는 왼쪽에, 그리고 스크롤하지 않고도 볼 수 있도록 상부에 배치된 컨텐츠가 사용자에게 노출될 가능성이 높다. 또한 자극적인 제목을 쓰거나 그림 가까이에 배치된 컨텐츠들은 다른 것들에 비해 더 많은 클릭 수를 기록하게 된다. [9] 이런 식으로 교묘하게 디자인된 UI에 의해, 특정 컨텐츠가 다른 컨텐츠들에 비해 더 눈길을 끌게 된다.

Social bias 가 존재한다.

발생원인과 정도의 차이는 천차만별이겠지만, 우리는 성별에 대해, 문화에 대해, 종교에 대해, 인종에 대해 나름대로의 bias를 가지고 있다. 그리고 그러한 bias는 우리도 모르게 웹 컨텐츠에 반영된다. [10] 이러한 bias가 반영된 컨텐츠들은 우리의 내적 bias를 더욱 단단하게 고정시킨다. 또한 많은 수의 사람들이 언급하거나 좋다고 하는 것들에 대해서는 더 호의적인 시각을 가지게 되는 경향도 있다. [11]

인공지능에 의해 생기는 bias?

현재에도 신문기사나 블로그의 내용, 챗봇 대화 등이 인공지능에 의해 생성되고 있으며, 이러한 기술의 적용범위는 더욱 넓어질 것이다. 물론 현재에도, 우리는 이미 다양한 형태의 bias의 영향에서 자유롭지 못하지만, 인공지능에 의해 만들어진 컨텐츠의 비율이 높아지게 된다면, 사람들의 사고방식과 행동양식은 인공지능이 컨텐츠를 생산하는 방식에 의해서도 크게 영향을 받게 될 것이다. 즉, 과거에는 존재하지 않았던, 새로운 타입의 bias가 인공지능 기술에 의해 발생하게 되는 것이다.

문제를 해결하는 첫번째 단계는 문제의 속성과 범위, 정도를 정확하게 파악하는 것이다. 즉, 이미 우리에게 영향을 주고 있는 bias에 대한 치밀한 분석과 연구가 필요하다. 그리고 컨텐츠를 생성해 내는 데 적용되는 인공지능 관련 기술들에 의해 새롭게 생길 지도 모르는 bias에 대해서도 심각하게 고찰해 볼 필요가 있다. 이 과정은 컨텐츠 생성과 관련된 인공지능 기술에 대한 깊은 이해를 요구할 뿐만 아니라, 여러 요소가 복합적으로 얽힌 형태로 발생하게 되는 bias, 그리고 무엇보다 정보 활용의 주체가 되는 사람 및 사람의 집단에 대한 다양한 관점에서의 연구를 필요로 할 것이다.

Further Reading

References