Blog Archive

레이블이 박태웅인 게시물을 표시합니다. 모든 게시물 표시
레이블이 박태웅인 게시물을 표시합니다. 모든 게시물 표시

2024-03-22

『박태웅의 AI 강의』를 읽어보았습니다.

『눈 떠보니 선진국』을 읽고 나서 같은 작가가 쓴 『박태웅의 AI 강의』도 꼭 읽어보고 싶었습니다. 생성형 AI가 모든 것을 집어삼키고 있습니다. 이럴 줄 알았으면, 대학원에서 신경망 배울 때 좀 더 관심을 가지고 팠어야 하는 생각이 듭니다. 그 때는 소위 인공지능의 겨울이었던 시기여서, 인공지능이 이렇게 느닷없이 성능이 좋아지고, 능력을 갖추게 되리라고 예상을 하는 사람이 별로 없었습니다.


박태웅의 AI 강의. 박태웅 지음. 한빛비즈.
박태웅의 AI 강의



서점에 가보아도, 챗GPT에 대한 책들이 넘쳐납니다. 많은 책들이 이것을 어떻게 잘 활용하여, 나의 업무 생산성을 극적으로 높일 것인가에 초점이 맞추어져 있습니다. 좀 더 부정적으로 표현하면, 그럴듯한 콘텐츠를 빠르게 만들어서 인터넷 세상을 오염시키는 방법에 대한 글과 영상들은 이미 넘쳐납니다. 

그런 와중에 생성형 인공지능(Generative AI), 더 나아가 인공일반지능(AGI)이 우리 사회에 미치는 거시적인 영향과 파급 효과에 대해 진지하게 성찰해보고, 이면에 숨어있는 위험을 인류는 어떻게 대처해야 하는지에 대해 고민해보는 책은 생각보다 많지 않은 것 같습니다. 그런 면에서 『박태웅의 AI 강의』는 이해하기 쉽게 쓰여져 있지만, 진지하게 생각할 거리를 던져줍니다.

전체 다섯 개의 장(1강~5강)으로 구성되어 있는데, 가장 핵심적인 것은 저는 3강, 열려버린 판도라의 상자였다고 느꼈습니다. 오픈AI의 샘 알트먼은 "인공일반지능이 만약에 고장나면 무엇인가 다른 조치가 필요할 수도 있습니다. 이 때문에 특정 회사가 이런 AI를 소유해서는 안 됩니다."라고 말했지만, 정작 요즘 오픈AI의 행보는 갈수록 "클로즈드" AI로 향하고 있습니다. 왜 그런 결과가 나오는지 설명할 수 없는 요즘의 AI는 원하지 않는 결과(편향되었거나, 차별적이거나, 허위이거나, 개인 정보를 침해하거나 등)가 나왔을 때, 그것을 고치는 방법도 근본적으로는 알 수가 없습니다.

극단적으로 영화 터미네이터에서 스카이넷이 인간을 공격하게 되는 상황까지는 상상하지 않더라도, 현재의 생성형 인공지능으로 인해 판도라의 상자가 이미 열렸고, 이것에 대해 전사회적으로 대응책을 마련하지 않으면, 어떤 미래가 올 지 알 수가 없습니다. 

소셜 미디어(인스타그램)를 사용하는 정도와 미국 소녀들의 자살률 증가가 높은 상관 관계가 있다는 사실을 메타의 과학자들은 알고 있었다고 합니다. 페이스북의 알고리즘에 의해 우리는 필터 버블(filter bubble)과 에코 체임버(echo chamber)에 빠져 있을 뿐 아니라, 전세계적으로 정치적인 극단주의가 더욱 심화되고 있습니다. 이렇게 거대 기업에 의해 움직이는 소셜 미디어의 부작용에도 우리는 효과적으로 대응하지 못했습니다. 그런데, 생성형 인공지능의 부작용에 대해 지금부터 고민하고 대처하지 않으면, 어떻게 될까요?

2020년 구글에서 인공지능 윤리를 연구하다 해고당한 팀닛 게브루(Timnit Gebru)가 쓴 논문, <확률적 앵무새의 위험에 대하여: 언어 모델은 너무 커져도 좋을까?>에서 지적한 네 가지 위험성이 있습니다. 심리학자 개리 마커스도 비슷한 위험성을 경고하고 있습니다. 

첫째, 거대 언어 모델을 운영하기 위해 천문학적인 재정적 비용과, 매우 많은 양의 전기, 탄소, 물이 소비됩니다. 그리고 지구상에서 가난하고 소외된 지역에 가장 크게 타격을 줍니다.

둘째, 이 언어 모델 안에 어떤 편견과 왜곡이 들어있는지 알 수가 없습니다. 이 모델에는 인터넷에서 영향력이 작은 국가와 민족의 내용은 누락되고, 부유한 국가의 관행은 더 많이 반영되어 모델이 생성한 답이 동질화될 수 있습니다. 

셋째, 연구의 기회 비용입니다. 그럴 듯한 답을 내놓는 거대 언어 모델에 대부분의 연구비가 집중되어, 더 필수적이고 중요한 과제에 자원과 예산이 배분되지 않고 있다는 것입니다. 

네 번째는 잘 알려진 환각(hallucination)의 문제입니다. 인공지능이 생성하는 허위 정보, 가짜 뉴스, 딥 페이크를 구분하고, 방지하기 위한 장치가 뚜렷이 보이지 않고 있습니다. 

다섯 번째, 책에서는 오리지널의 실종을 경고하고 있습니다. 텍스트를 기반으로 그럴듯하게 생성된 이미지들이 인터넷 세상을 도배하고, 인공지능이 생성한 그럴듯한 글들이 꽉차게 되면, 이제 인공지능은 더 이상 학습할 오리지널 데이터가 부족해지게 됩니다. 그렇게 했을 때, 인공지능의 성능은 점점 더 나빠진다고 합니다. 인터넷 세상은 새로운 아이디어와 콘텐츠가 넘쳐나는 열린 세상이 아니라, 유사한 이미지와 자가 복사된 글들로 채워지는 닫힌 세계, 근친 교배로 다양성이 상실되는 세계가 될지도 모릅니다. 

여섯 번째, 차별의 재생산입니다. 논란이 되어 폐기되었던 아마존의 인공지능 채용 시스템, 골드만 삭스의 인공지능 신용평가 시스템, 컴퓨터 비전의 발전에 혁혁한 기여를 하고 있는 이미지넷 등이 예로 언급되었습니다. 이런 시스템에 내재한 성차별, 인종차별, 기타 정치적으로 올바르지 않은 차별적 패턴을 인공지능이 학습하여 차별은 확산되고 재생산될 가능성이 높습니다. 

유럽 연합은 2019년 「신뢰할 수 있는 인공지능 가이드라인」을 만들었고, 미국은 「알고리듬 책무법안 2022」, 우리 나라는 「AI(인공지능)산업 육성 및 신뢰 기반 조성에 관한 법률」 제정을 추진하고 있다고 합니다. 신뢰할 수 있고, 위험하지 않은 인공지능을 위해 여러 분야의 전문가들이 지혜를 모아서 사회적인 합의와 대책을 잘 만들어갔으면 좋겠습니다.

2024-01-23

눈 떠보니 선진국? 후진국?

예전에 LG전자와 현대자동차에 다닐 때에 해외 현지채용인 대상 교육 업무를 많이 하였습니다. 그래서 여러 나라를 돌아다니기도 하고, 또는 여러 나라 사람들이 본사가 있는 우리 나라로 오기도 하면서 많은 나라의 사람들을 만나보았습니다. 특수한 경우였습니다. 대한민국에 뿌리를 둔 회사, 즉 우리 나라에 본사가 있으니, 현지채용인들은 본사를 특수하게 바라봅니다. 즉, 본사의 방침, 정책, 비즈니스 프랙티스가 기준이 되며, 해외에도 이를 적용하려고 하게 됩니다. 그 때마다 몇 가지 의문이 들었습니다. 

  • 본사가 있는 우리 나라에서 만든 정책과 규칙이 글로벌 스탠다드라고 할 수 있는가?
  • 우리 나라의 비즈니스 프랙티스는 다른 나라가 부러워하고, 참고할만한 것인가?

우리 나라의 비즈니스 방식을 매우 존경스럽게(?) 바라보며 어떻게든 배우려고 애를 쓰던 나라로 중국과 인도가 떠오릅니다. 어떤 문제에 대해 본사에서는 이렇게 해결했다는 사례가 마치 최고의 솔루션인 것처럼, 중국과 인도 직원들은 열심히 필기하며, 고개를 끄덕였습니다. 반면에 소위 말하는 서양(북미와 유럽)의 직원들은 대체적으로 본사의 교육을 바라보는 시선이 사뭇 달랐습니다. 저는 본사의 프리미엄을 가지고 사람들을 만났지만, 대한민국이라는 개발도상국에서 전 세계에 통하는 스토리를 어떻게 만들어낼지 항상 고민이었습니다. 


눈 떠보니 선진국. 앞으로 나아갈 대한민국을 위한 제언. 박태웅 지음.
눈 떠보니 선진국. 앞으로 나아갈 대한민국을 위한 제언. 박태웅 지음.

2021년 유엔무역개발회의(UNCTAD)에서 대한민국을 List A(개도국)에서 List B(선진국)로 지위를 변경했습니다. 유엔무역개발회의가 설립된 이래 최초로 지위 변경이 된 나라가 대한민국이라고 합니다. 그 밖의 여러 가지 지표로 보아도, 대한민국을 선진국이라고 분류해도 무리가 없는 것 같습니다. 그렇게 우리는 눈 떠보니 어느덧 선진국의 반열에 들어가 있었습니다.

박태웅 한빛미디어 이사회 의장의 『눈 떠보니 선진국』은 이렇게 급격하게 선진국의 대열에 합류한 대한민국이 건너뛴 근대화의 몇 가지 요소들을 짚어주고 있습니다. 압축 성장하며 급격하게 선진국의 요소들을 갖추게 된 우리 나라가 이제는 건너뛴 근대화 과정에서 무엇이 부족했는지 성찰하고 있습니다. 

2021년 8월, 즉 문재인 정부 말기에 책이 출간되었으나, 2024년 1월 현재 보면 더 뼈아픈 지적들이 많이 있습니다. 책에서 언급한 것 중에 두 가지만 적어봅니다. 

신뢰 자본

선진국이라고 우리가 부러워했던 유럽 국가들에 가보면 의외로 소매치기가 많습니다. 그리고, 차량 안에 귀중품을 그냥 놔두면, 쉽게 차량을 파손하고 귀중품을 가져가는 범죄가 생각보다 많이 일어난다고 합니다. 우리 나라에서는 카페에 노트북을 펼쳐놓은 채로, 화장실도 가고, 자리를 비우는 사람들을 가끔 보게 됩니다. 어딘가에 지갑을 놓고 왔는데, 시간이 꽤 지나서 찾으러 가도 안전하게 지갑이 남아있었던 경험도 가끔 하게 됩니다. 기차를 타기 위해 기차표를 검사하는 사람도 없고, 검표하는 게이트도 없이 바로 차에 오를 수 있게 되었습니다. 

사회에 축적된 신뢰가 있기 때문에 이런 일이 가능하게 되었습니다. 이런 신뢰는 정말 자랑스러워할 만한 자산입니다. 신뢰가 없었다면 모든 사람을 잠재적인 범죄자로 보고, 범죄를 예방하기 위해 많은 비용을 들여야 합니다. 신뢰를 저버린 범죄에 대해서는 단호한 제재가 있어야 합니다. 그런데, 이상하게도 큰 금액의 횡령을 저지른 재벌 총수나, 큰 금액의 뇌물을 받은 정치인이나, 큰 규모로 주가 조작을 저지른 사람들이 집행유예를 받거나, 금방 사면을 받는 것을 많이 보게 됩니다. 뭇사람들이 쌓아놓은 일상의 신뢰가 커다란 권력형 범죄와 송방망이 처벌에 의해 무너집니다. 『권력의 심리학』에서도 말합니다. 권력자가 다른 모든 사람을 범죄자로 간주하고 바라보는 판옵티콘을 사회에 적용할 게 아니고, 부패의 가능성이 높은 권력을 향해 뭇사람들이 감시의 눈을 거두지 않아야 합니다. 


데이터 공개

우리 나라는 경제협력개발기구(OECD) 공공 데이터 지수에서 2015년, 2017년, 2019년에 1위를 차지했다고 합니다. 디지털 전환, 나아가 인공지능의 시대에 데이터는 산업화 시대의 석유와 같다고 합니다. 그래서 전국 규모의 데이터를 가장 많이 보유하고, 생산하는 주체라고 할 수 있는 국가, 정부에서의 데이터 공개는 매우 중요한 의미를 갖습니다. 그런데, 아직도 정부 기관에서 공개하는 데이터는 한/글(아래아한글) 형식으로 된 것들이 많습니다. 또, 숫자가 가득한 예산표, 비용 집행표가 그냥 PDF로 공개되기도 합니다. 이런 것들을 사람이 보는 데에는 큰 문제가 없을 수도 있습니다. 그러나 데이터는 기계가 읽을 수 있어야, 기계가 처리를 하고, 가공을 하여 새로운 데이터나, 의미있는 인사이트를 도출할 수 있습니다. 미국은 '데이터법 정보 모델 스키마(DATA Act Information Model Schema: DAIMS)가 있어, 예산 보고서를 기계가 처리할 수 있도록 공개된, 표준 포맷을 지정해놓았다고 합니다. 우리도 데이터가 분석 가능한 형식으로 공개가 되면, 정책의 기획, 실행, 평가 단계에서 데이터 기반의 의사 결정을 할 수 있을 뿐만 아니라, 많은 민간 연구소나 기업들이 데이터를 분석하여 새로운 비즈니스, 가치를 창출할 수 있을 것입니다. 

이 책에는 그 밖에도 우리가 급하게 건너 뛰면서 놓쳐버린 선진국의 요소들을 잘 간파하고, 일부는 대안을 제시하고 있습니다. 견제와 균형이 없는 권력(검찰 권력, 판사 조직, 일부 공무원 조직 등)에 대한 문제점, 문제를 정의하지 않고 해결하려는 시도들, 정부 재정 정책에 대한 제언, 인공지능 시대에 필요한 교육 등 다양한 이슈들이 나옵니다. IT 현자라고 불리우는 저자의 문제 정의 능력이 돋보이는 책이며, 새로운 정권이 들어서고, 생성형 AI가 세상을 뒤바꿔버린 2024년 현재 시점에서 보아도 매우 유용합니다. 정부 정책을 만들고, 집행하는 사람들이 많이 보았으면 좋겠습니다.