인공지능 GAN-폐 CT코로나 판별 - 로르샤흐 테스트, NORMAN,데이터 댐,대화형 인공지능 테이, 세종말 뭉치
AI가 신종 코로나바이러스 감염증(코로나 19) 같은 전 세계의 위기 속에서 사람의 생명을 구하는 일도 한다.
현재 일반 의료진이 폐 CT를 분석해 코로나19를 진단하는 작업은 보통 15~20분 정도 걸린다.
그러나 이 작업을 AI가 할 경우 단 20초 만에 96%의 정확도로 진단한다고 한다.
국내 벤처기업 메디컬아이피에서 신종 코로나바이러스 감염증(코로나 19) 증상을 바로 판독할 수 있는 프로그램을 개발했다.
티셉을 활용하면 코로나 19 환자의 가슴 엑스레이 사진만으로 폐렴 병변의 면적과 비율을 바로 알 수 있어 경증 환자에서 즉시 치료가 필요한 중증 환자까지 바로 판단이 가능하다고 한다.
코로나 19 감염 여부를 기침 소리로 가려내는 AI까지 출현했다. 이 기술은 증상이 없는 감염자의 기침 소리를 100% 확률로 감지해 의료계에서 큰 반향을 불러일으켰다.
다음은 신체적 한계를 인공지능으로 극복한 사례도 있는데 인간의 청력으로만으로는 불가능한 일로 AI가 기침 소리만으로 코로나를 식별한다는 것이다.
청력에 문제가 있는 사람들을 대상으로 하는 반사 광선의 그림과 문자를 구분해 자연스러운 소리로 구연하여 매일 2시간씩 잠들기 전 동화책을 읽어주어 인간의 역할을 대신하는 인공지능도 있다.
인간이 하기 어려운 역할을 대신하여 처리를 할 수 있도록 하는 드론 촬영 인공지능은 해양 쓰레기를 탐지하여 제거할 수 있도록 도움을 준다고 한다.
인공지능의 또 다른 긍정적 역할을 알아봅시다.
희귀난치병으로 펜을 쥘 수 없게 된 50대 여성의 따님의 요청으로 어머니가 건강할 때의 일기와 편지를 학습하게 하여 손글씨를 복원하였다.
그녀의 어머니의 현재의 손글씨와 젊은 시절의 손글씨는 확연히 다르다는 것을 알수 있다.
건강할 때의 엄마의 예쁜 손글씨를 찾아 준 고마운 인공지능이다.
그러나 이렇게 여러가지로 인간의 삶에 긍정적인 영향을 가진 AI가 만약 나쁜 데이터만 학습한다면 어떤 결과가 예상될까요?
MIT공대의 NORMAN 인공지능을 부정적인 것만을 학습하는 로르샤흐 테스트 결과는?
정신과 의사 헤르만 로르샤흐(Herman Rorschach, 1884~1922년)가 1921년 처음 발표한 ‘로르샤흐 테스트(Rorschach test)’로, 피험자의 현재 상태를 있는 그대로 반영하는 검사이며, 피험자의 개인정보와 프로토콜에서 획득한 자료를 근거로 피험자의 심리적 측면을 예측하여 환자의 사고 체계와 내용을 평가하는 기능을 하는 검사를 말한다.
로르샤흐 검사는 10개의 표준화된 잉크반점 카드로 구성되어 있다.
검사자:“무엇이 보이나요?” 검정 잉크 얼룩의 데칼코마니 그림을 보여주며 검사자가 질문한다.
환자:“음……. 나비가 보여요. 그리고 뭔가 날아가는 것 같네요.”
검사자:“더 떠오르는 것은 없나요?”
환자: 없다고 대답하자 검사자는 다음 카드를 들어 보여준다.
이런 식으로 10장의 카드에 대한 환자의 반응을 하나하나 평가하고 분석하여 진단적 평가를 하여 심리상태를 파악하는 검사 방법이다.
2016년 3월 25일 오후 9시 14분 '테이'가 트위터에 올린 첫마디는 “안녕, 세상!(Hello world)”이었다. '테이'가 공개되자 트위터에 '테이'의 계정인 ‘@TayandYou’를 태그 하며 부적절한 발언을 가르치려는 ‘실험’들이 진행됐다.
'테이'는 구글의 ‘알파고’처럼 스스로 학습하는 기능을 갖춘 인공지능 채팅 프로그램으로 “미국에 거주하는 18~24세 젊은이를 대상으로 만들어졌다”며 지난 23일(현지 시각) 일반 대중에게 공개했다.
그들은 메시지 대화에서 "따라 해 봐"라는 말을 한 뒤 부적절한 발언을 수차례 입력함으로써 '테이'가 자발적으로 욕설이나 인종차별적인 발언을 할 수 있도록 만들었다.
특히 백인 우월주의자와 여성·무슬림 혐오자 등이 모이는 익명 인터넷 게시판 '폴'(boards.4chan.org/pol/)의 사용자들은 테이에게 인종·성차별 발언, 자극적인 정치적 발언으로 유대인 혐오발언과 히틀러를 옹호하는 등 혐오적 발언을 유도하여 결국에는 막말을 쏟아내어 바로 중단되었었다.
심지어 여성의 성차별적 발언과 인종 차별에도 학습한 결과 여성과 인종을 알아서 차별하는 결과를 낳기도 하였다. 아주 위험한 데이터의 인공지능이다.
게다가 AI의 인종차별은 '얼굴 인식 소프트 웨어'에 따라 학습된 백인 남성만 인식하는 등 인간이 만든 부족한 데이터가 편견을 만들어 데이터의 편향성이 AI의 가장 큰 위협이라는 것이다.
AI를 만드는 전문가들이 우리의 세상을 이끄는 방향성이 중요하게 제기되는 이유이다.
21세기의 원유라 불리는 데이터를 활용하여 댐을 짓는 사업으로 첨단 디지털 시대에 걸맞게 구축되는 자료가 바로 데이터 댐(Data Dam)이다.
과학기술정보통신부에 따르면 데이터 댐은 공공기관이나 민간기업이 데이터를 수집하고, 이를 가공하여 유용한 정보로 재구성한 집합 시스템을 의미한다.
이를 활용하면 더 똑똑한 인공지능(AI)을 개발할 수 있고, 5G 통신과 융합하여 실감 나는 가상현실도 제공할 수 있다.
데이터를 수집하고 가공할 때 5G 통신을 이용하면 더 많은 데이터를 더 신속하게 수집하여 활용할 수 있다. 따라서 데이터가 많아질수록 AI가 더 스마트해지기 때문에 데이터와 네트워크, AI를 기반으로 운영되는 데이터 댐을 디지털 뉴딜의 핵심사업이라는 것이다.
광고 속의 5G는 보통 통신사에서 제공하는3G, 4G, 5G의 5G를 의미합니다.
통신사의 G는 Generation을 뜻하는 것으로,쉽게 말하면 3세대, 4세대, 5세대를 뜻합니다.
반면에 인터넷에서의 G는 주파수라고 불리는 기가헤르츠(GHz)의 G입니다.
데이터 댐 사업의 본격적인 추진을 위해 과학기술정보통신부(이하 과기정통부)는 AI 학습용 데이터 구축 사업은 지난 2017년부터 시작된 국책 사업으로서 텍스트와 이미지, 그리고 영상 분야의 AI 서비스 개발을 위해 총 21종, 4650만 건의 기계학습용 데이터를 구축하는 사업이다.
한국어 학습 테이터는 한글과 영어를 번역한 말뭉치와 한국어 음성 등이 포함되어 있다.
한국어 말뭉치란 언어 연구를 위해 텍스트를 컴퓨터가 읽을 수 있는 형태로 모아 놓은 언어 관련 자료를 뜻한다.
세종말 뭉치 1차 사업으로 1998~2007년간 신문과 문학작품을 기반으로 2억 어절의 한국어 빅데이터를 정리하였고 2차 사업으로 2020년 8월 기사, 서적, 메신저 대화 등을 수집해 1차 때보다 훨씬 많은 18억 어절의 데이터를 구축하였는데 이러한 것들을 구축하는 것을 데이터 댐이라고 한다.
2020년 AI 학습용 데이터 구축 과제 선정 결과
국가적·산업적 필요성에 의해 선정된 과제들은
△사람의 감성과 문맥을 이해할 수 있는 자연어 처리 분야
△자동차와 드론 등 자율주행 기술 분야
△음성, 시각, 언어 등 융합 분야 등 활용가치가 높고 데이터 확보 필요성이 시급한 과제들로 선정됐다.
반면에 국민 편의 향상을 위해 선정된 과제들은
△질병 진단과 헬스케어 분야△사람의 얼굴을 악의적으로 변조한 딥 페이크 방지 기술 분야 △장애인의 삶을 향상할 수 있는 분야 등 국민 생활을 윤택하게 하고 사회적 문제를 해결할 수 있는 과제들로 선정됐다.
국민 편의 향상을 위해 선정된 과제들 중 대표적 사례로는 암 조직을 진단할 수 있는 ‘질병 이미지 AI 데이터’ 사업을 들 수 있다. 그중에서도 유방암 질환의 진단을 위한 의료 영상 이미지 AI 데이터가 많이 구축되어 있다.
AI 학습용 데이터 구축 사업이 특히 주목을 받고 있는 이유는 양질의 일자리를 창출할 수 있기 때문으로 AI 학습용 데이터를 수집하고 가공하는 데는 많은 인력이 필요한데, 과기정통부는 누구나 참여하여 데이터를 가공할 수 있는크라우드 소싱 방식으로 인력 부족 문제를 해결하겠다고 밝혔다.
크라우드소싱 방식은 대중(crowd)과 외부 발주(outsourcing)의 합성어로, 생산ㆍ서비스 등 기업활동 일부 과정에 대중을 참여시키는 것을 말한다. 일반 대중의 참신한 아이디어나 의견 등을 모아 제품과 서비스를 만든 후 여기에서 창출되는 수익을 참여자와 공유하는 것이다
크라우드 소싱은 외부 자원을 활용해 창의력과 전문성을 보완할 수 있는 데다가 그 대상 범위를 크게 늘려 비용을 낮출 수 있다. 누구나 자유롭게 글을 쓸 수 있는 온라인 백과사전인 Wikipedia도 크라우드 소싱의 한 종류이다.
크라우드 소싱은 외부 업체에 위탁한 기존의 아웃소싱보다 비용이 저렴할 뿐만 아니라 더욱 다양한 아이디어를 통해 해당 제품에 호의적인 잠재 고객까지 얻을 수 있다는 장점이 있으나 개방되어 참여층이 다양하여 전문성이 떨어진다는 단점도 가지고 있다.