도서 소개
뉴미디어와 네트워크 기술, 기계학습을 둘러싼 비판적 통찰로 북미 디지털 미디어 연구를 이끌어 온 웬디 희경 전의 국내 첫 번역서다. 상관관계, 동종선호, 진정성, 인식 등 빅 데이터와 소셜 네트워크의 핵심 개념이 어디에서 비롯했고 무엇을 낳았는지 추적하며, 기술이 약속한 민주주의와 평등이 어떻게 차별과 불평등으로 전환되었는지를 짚는다.
차별의 증거를 폭로하는 데 그치지 않고, 알고리듬과 기계학습의 절차와 논리, 예측의 수준에 내재된 편견을 해부한다. 상관관계와 동종선호의 역사적 뿌리를 통해 분리와 반향실이 목표가 되는 구조를 설명하고, 기술과 문화에 깊이 관여함으로써 차별적 데이터의 악순환에 맞설 실천적 지침을 제시한다.
출판사 리뷰
『차별하는 데이터: 상관관계, 이웃, 새로운 인식의 정치』는 뉴미디어와 네트워크 기술, 기계학습 등을 둘러싼 기술적·인식론적 통찰을 바탕으로 북미 비판적 디지털 미디어 연구를 주도해 온 웬디 희경 전의 국내 첫 번역서다. 상관관계, 동종선호, 진정성, 인식 등 21세기 빅 데이터와 소셜 네트워크의 근간을 이루는 개념들이 어디에서 비롯했으며, 어디로 이끄는지 이해함으로써 우리가 기술과 문화에 깊이 관여할 수 있음을 촉구하는, 연구서이자 지침서다.
“미안해요. 우리는 사생활을 파괴할 의도는 없었어요. 민주주의도요.”
20세기 후반 등장한 인터넷, 소위 ‘사이버공간’은 전 지구적 민주주의, 평등, 번영의 시대를 열 것을 약속했다. 기술은 우리 삶을 윤택하게 하고, 인공지능은 머지않은 미래에 상위 1퍼센트가 누리는 혜택을 나머지 90퍼센트에게 나눠줄 유순한 기계 하인이 될 운영이었다. 그곳에 차별이란 없었다. 사이버공간에서 성별, 나이, 피부색, 학력, 재산은 중요하지도, 보이지도 않을 것이었기 때문이다.
그로부터 4반세기가 지난 지금, 인터넷은 악몽이 되었다. 그것은 전 세계적 감시 네크워크의 근간을 이루며, 거짓과 음모론을 퍼뜨리고 사회를 분열시키는 소셜 미디어 알고리듬과 인류의 미래를 위협하는 인공지능 프로그램을 낳았다. 2010년까지만 해도 중동의 민주화 항쟁을 이끈 “해방의 기술”로 칭송받았던 닷컴(dot-com)은 닷폭탄(dot-bomb)으로 변했고, 정부와 기업들은 사과문을 발표하기에 바빴다. 매해 사건사고가 넘쳐나기 시작했다. 2018년 한 해에만 마크 저커버그는 페이스북 사용자 8,700만 명의 개인 프로필이 ‘유출’된 데 공개적으로 사과했으며, 미국 이민세관단속국이 항상 구금을 권고하도록 위험 평가 소프트웨어를 ‘업그레이드’했다는 폭로부터, 여성을 차별한다는 이유로 아마존이 AI 채용 소프트웨어를 폐기했다는 소식, IBM의 슈퍼컴퓨터 왓슨이 잘못된 암 치료법을 추천했다는 보도까지, 뉴스는 끊이지 않았다. 급기야 『뉴욕』지는 귀여운 고양이 사진과 함께 「인터넷이 사과한다...」는 기사를 내보냈다. “미안해요. 우리는 사생활을 파괴할 의도는 없었습니다. 그리고 민주주의도요. 우리가 나빴어요.” 기술 기업들은 일이 벌어질 때마다 사과와 함께 기술적 해결책을 약속했다. 그런데 혹시, 이런 재난들이 용서를 구할 실수가 아닌 정해진 목표라면 어떨까. 점점 더 강력한 힘을 발휘하는 빅 데이터와 기계학습, 추천 알고리듬, 네트워크 과학이 실은 과거의 불평등을 영속화하려는 열망에서 태어난 19세기 말 우생학의 사생아라면, 우리는 어떻게 해야 할까.
『차별하는 데이터: 상관관계, 이웃, 새로운 인식의 정치』는 현재 기술의 이름으로 벌어지는 차별과 억압, 불평등에 대응하기 위해 차별의 증거를 폭로하고 분석하는 것만으로는 충분하지 않다고 주장한다. 아마존의 채용 소프트웨어가 사용한 데이터, 즉 인종의 대리체를 탓하는 것은 인종차별이 눈에 보이는 차이에서 비롯된다는, 즉 인종만 추적하지 않으면 사라질 것이라는 순진한 가정을 불러온다. 이는 기술이 ‘맹목적’이며 따라서 공정하다는 근본적인 믿음에서 비롯된다. 그러나 지금껏 많은 연구와 현실에서 밝혀진 것처럼, 인종을 무시한다고 인종주의가 사라지지는 않으며, 오히려 인종과 차이를 지우려는 욕망은 차별과 불평등을 영속화할 뿐이다. 우리에게 필요한 것은 더 근본적인 지점, 즉 현재의 기계학습과 알고리듬에 인간의 편견과 차별이 어떻게 내재되어 있는지, 즉 단순히 데이터의 수준에서뿐만이 아니라 절차와 예측, 태생과 논리의 수준에서도 얼마나 깊게 결합되어 있는지를 이해하는 일이다.
증오를 ‘사랑’으로 세탁하기
이를 위해 이 책에서 핵심으로 다루는 개념은 ‘상관관계’와 ‘동종선호’다. 기본적으로 상관관계는 두 개 이상의 변수들의 관계를 설명한다. 간단히 말해, 두 변수가 서로 보조를 맞춰 증가하면 양의 상관관계가 있고, 서로 반대 방향으로 변화하면 음의 상관관계가 있다. 겉으로 보기에 무해해 보이는 이 개념은 그러나, 20세기 초 가장 빈곤한 공동체에 대한 감시와 생체 측정에서 탄생한 우생학자들의 작품이다. 100여 년 전, 우생학자인 프랜시스 골턴과 칼 피어슨의 연구에 기반을 둔 상관관계는 현재 빅 데이터의 근간을 이루며 전통적인 인과관계를 대체하기에 이르렀으며, 급기야 현실을 상관관계에 따라 다시 빚어내기 시작했다. 예컨대 2016년 데이터 분석에 따른 선거 유세와 광고 기술 등을 통해 유권자에게 영향을 미쳐 미국 대선과 영국 브렉시트 투표 결과에 개입했다는 의혹을 받은 케임브리지 애널리티카의 사례는 더 나은 ‘인간 작물’을 재배하려는 우생학자들의 열망과 그리 멀지 않은 곳에 존재한다.
21세기 소셜 미디어와 추천 알고리듬의 기본 공리가 된 ‘동종선호’(homophily) 역시 얼핏 문제가 없어 보인다. ‘자신과 비슷한 사람들과 어울리고 유대감을 느낀다’는 이 자연스럽게 들리는 개념이 실은 1950년대 미국의 흑백 주거지 분리를 전제로 한 폴 라자스펠드와 로버트 K. 머튼 등의 연구에서 (그것도 주로 백인들의 설문 응답에 중점을 둔 분석에서) 비롯한 것임을 알기 전까지는 말이다. 저자는 이 개념에 숨겨진 역사적 층위를 밝히기 위해 널리 인용되지만 거의 읽히지 않는 이들의 1954년 연구 「사회적 과정으로서의 교우관계」와 동종선호 개념의 핵심 데이터가 실려 있지만 끝내 발표되지 않은 「사회생활의 패턴」이라는 미발표 보고서를 파헤친다. 그리고 그들이 동종선호와 반대되는 이들의 목소리를 역사에서 지워버렸음을 밝혀낸다.
각각 20세기 초와 중반, 사회공학이 분리와 차별 위에 옹립한 두 개념인 ‘상관관계’와 ‘동종선호’는 오늘날 겉으로 보기에 개방적이고 무한해 보이는 소셜 네트워크가 소위 분열된 ‘빗장 공동체’(gated community)로 와해되는 현상을 설명하는 데 핵심이다. 일찍이 페이스북 사용자의 ‘좋아요’ 데이터를 기반으로 사람들의 성별, 민족, 정치적 견해는 물론 성적 성향, 지능, 행복감 같은 잠재적 속성을 예측하는 것이 얼마나 쉬운지 보여준 미할 코신스키 등의 2013년 연구는, 사람들을 상관관계과 동종선호에 따라 인위적으로 무리짓는 것 역시 얼마나 쉬운지 보여준다. 한때 우생학자들의 목표가 열등한 사람들을 분리함으로써 ‘적합한’ 사람들을 재생산하는 것이었다면, 현대의 상관관계는 네트워크상의 분리된 이웃들의 ‘무리짓기’를 위한 데이터 분석의 초석이 된다. 즉, 고도로 선별적이고 차별적인 과거를 미래에 반복하려 한다는 점에서 같은 목표를 지닌다. 이곳에서 분리와 반향실 효과는 우연이 아닌 목표다. 결정적으로 동종선호는 증오를 ‘사랑’으로 세탁한다. 당신은 당신의 사랑을 어떻게 증명할 것인가? 다른 사람이 나타나면 도망치는 것이다.
차별적인 데이터의 악순환에 맞서 이 세계에 함께 거주하기 위한 지침서
이 책은 뉴미디어, 네트워크 기술, 빅 데이터 등을 둘러싼 기술적·인식론적 통찰을 바탕으로 북미 비판적 디지털 미디어 연구를 주도해 온 웬디 희경 전의 첫 국내 번역서다. 1세대 이민자로서 겪은 차별과 정치가 우리가 당연시하는 많은 것 속에 내재되어 있음을 깨달은 그녀는 지난 25년간 공학, 문학, 비판이론, 복잡계 이론 등을 아우르며 기술과 문화에 대한 깊은 관여를 촉구해 왔다. 이는 그녀가 “기술 결정론자거나 문화 결정론자이기 때문이 아니라, 기술과 문화 모두에 강렬하게 관여함으로써 우리가 이 두 극단에서 벗어나게 된다고 믿기 때문이다. 핵심은 문화와 기술이 어떻게 교차하고 충돌하는지 보는 것이다. 즉 어떤 기술을 깊이 파고들면 심원한 사회·문화적 가정들이 드러나고, 그 반대도 마찬가지임을 보는 것이다. 차별과 부당함은 외부에서 오는 것이 아니다. 그들은 ‘그 안에’ 있다. 왜냐하면 기술적 디폴트는 문화적·사회적 편견에 내재되어 있기 때문이다.”
이 책의 긍극적인 목표는 우리를 둘러싼 도구를 신중하고 창의적으로 사용함으로써 죄어오는 듯한 선제적 미래의 굴레에서 우리가 벗어날 수 있도록 돕는 것이다. “나는 이러한 도구를 본질적으로 우생학적이라 비난하기보다는 그 도구의 논리에 참여하여 그 도구의 한계와 가능성을 이해하고자 한다.” 상관관계에 대한 우생학적 뿌리가 미래를 완전히 봉쇄하기 전에. 동종선호가 분노한 무리들로 굳어지기 전에. 진정성과 인식이 일탈을 조장하는 데 그치지 않기 위해. 차별을 회피하는 대신 직면함으로써 우리 사이의 공간에 주목하기 위해. ‘빅 데이터’라고 불리는 드라마 속에서 우리가 수동적인 마리오네트가 아닌 캐릭터이자 배우가 되기 위해.
추신. 잘 알려지지 않은 사실이지만 라자스펠드와 머튼은 ‘동종선호’와 함께 ‘이종선호’(heterophily, 자신과 다른 사람에게 끌리는 경향)라는 용어도 고안해 냈다. 동종선호와 달리 기이하게 역사에서 사라지다시피 했던 이종선호는, 최근 추천 시스템과 알고리듬이 자신의 한계를 극복하고 추천을 다양화하기 위해 주목하는 용어다.
빅 데이터와 우생학은 모두 영원히 불변한다고 추정되는 생물학적 속성을 통해 과거와 미래의 결부를, 즉 상관관계와 예측의 연결을 시도한다. 한 세기나 차이가 있지만, 둘 다 (가장 빈곤한 공동체에 대한 감시를 통해 가장 노골적으로) 세계를 실험실로 설정하고, '비규범적' 특성을 전파하여 다수를 추구하며, '가장 친절한' 해결책으로서 (인종차별을 위한 훈련 프로그램으로서의) 분리를 촉진한다.
가장 직설적으로 말하자면, 모든 의미의 공통성을 파괴하기 위해 분열과 적대감에 기반한 '공동체들'이 계획되고 구축되고 있다. 이러한 소셜 네트워크는 탈-인종, 탈-정체성 시대를 여는 대신 '기본' 변수와 공리를 통해 분노한 미시정체성(microidentity)을 영속화한다.
20세기 우생학자들에게 동종선호는 열망이었다. 그들은 비슷한(like) 사람이 비슷한 사람으로 자동적으로 재생산되는 세계를 만들고자 했다. 데이터 분석에서 동종선호는 기정사실이자 공리다. 분리된 '탈출'의 꿈과 지구 파괴의 악몽은 임박한 인종적 파멸의 서사를 대체했다. 그렇다면 우리는 어떻게 여기까지 왔으며, 상관관계란 대관절 무엇인가?
작가 소개
지은이 : 웬디 희경 전
사이먼 프레이저 대학교 커뮤니케이션 학부 교수이자 캐나다 건국 150주년 뉴미디어 부문 연구 의장, 디지털 민주주의 연구소 소장이다. 디지털과 네트워크 기술, 빅 데이터, AI 등을 둘러싼 기술적·인식론적 통찰을 바탕으로 북미 비판적 디지털 미디어 연구를 주도해 왔으며, 『통제와 자유: 광통신 시대의 권력과 편집증』(2005), 『프로그래밍된 시각: 소프트웨어와 기억』(2011), 『동일성 유지를 위한 업데이트: 습관적 뉴미디어』(2016), 『차별하는 데이터: 상관관계, 이웃, 새로운 인식의 정치』(2021) 등의 저서를 집필했다. 캐나다 왕립학회와 영국 아카데미 국제 펠로이며, 구겐하임 재단, ACLS, 베를린 미국 아카데미, 프린스턴 고등연구소, 하버드 래드클리프 고등연구소에서 펠로십을 받았다.
목차
머리말
서론: 한 번에 하나의 해결책으로 세상을 파괴하는 방법
빨간 알약의 독성, 또는 해방 선망
1장. 우생학의 상관관계
위반적 가설
2장. 동종선호, 또는 분리된 이웃의 무리짓기
대리체, 또는 미지의 것을 재구성하기
3장. 알고리듬 진정성
이데올로기의 상관관계, 또는 표면에 있는 것
4장. 인식을 인식하기
우리 사이의 공간
맺음말: 다름 안에서 살기
감사의 글
수학 삽화 참고 문헌
옮긴이 해제
찾아보기