생성형 의료 AI의 등장…기술력 뛰어나도 무분별한 도입은 ‘NO’
생성형 의료 AI의 등장…기술력 뛰어나도 무분별한 도입은 ‘NO’
  • 이원국 기자 (21guk@k-health.com)
  • 승인 2023.08.03 17:47
  • 댓글 0
이 기사를 공유합니다

과거 AI는 ‘라이브러리 서치 엔진’을 사용했지만 최근에는 초거대 언어 모델(LLM)을 기반으로 데이터를 스스로 생성하는 생성형 AI가 개발되고 있다(사진=클립아트코리아).
과거 AI는 라이브러리 서치 엔진을 사용했지만 최근에는 초거대 언어 모델(LLM)을 기반으로 데이터를 스스로 생성하는 생성형 AI가 개발되고 있다(사진=클립아트코리아).

챗GPT의 등장으로 생성형 인공지능(이하 AI)에 전 세계의 이목이 집중됐다. 생성형 AI는 이용자의 특정 요구에 따라 결과를 능동적으로 생성해내는 AI기술이다.

생성형 AI는 대량의 데이터를 학습, 인간의 영역이라고 할 수 있는 창작의 영역까지 확대되고 있다. 또 최근에는 AI와 의료가 결합하며 신약개발, 헬스케어, 진단솔루션 등으로 활용되고 있다.

글로벌 리서치 전문기관 스태티스타에 따르면 의료 AI 시장의 규모는 2021년 110억달러에서 연평균 37%의 성장률을 기록하며 2030년에는 약 1880억달러에 달할 것으로 예측됐다. 하지만 전문가들은 각종 연구결과를 통해 인간을 대체하기에는 아직 한계가 있다고 지적한다. 

■생성형 AI의료기기 시장선점 위해 개발 경쟁 치열 

AI 의료기기의 시조는 IBM의 ‘왓슨’이라고 할 수 있다. 왓슨은 암환자의 데이터를 입력하면 치료법을 제시하는 의료 보조 AI서비스다. 하지만 폐암의 경우 18%의 정확도에 그치고 국내 상급종합병원 의료진과 의견 일치율 또한 50%에 불과했다. 결국 가천대 길병원, 부산대병원, 계명대동산병원 등 왓슨을 도입했던 상급종합병원은 재계약을 포기했다.

영국이 국가 의료비용 절감을 위해 개발한 AI 챗봇 서비스 ‘바빌론’도 실패 사례다. 바빌론은 AI가 치료가 필요한 환자를 구별한다. 하지만 같은 증상을 두고 성별에 따라 안내가 다르다는 점, 잘못된 정보를 환자에게 전달해 치료가 지연되는 사례가 발생했다.

하지만 최근에는 ‘초거대 언어 모델(LLM)’을 기반으로 데이터를 스스로 생성하는 생성형 AI가 주목받고 있는 만큼 거대 공룡 테크 회사들이 시장 선점을 서두르고 있다. 실제로 아직 초기 단계지만 마이크로소프트, 구글, 아마존 등이 여러 기술을 개발 중이다.

특히 마이크로소프트는 생성형 AI 기술에서 가장 앞서 있다는 평가를 받고 있다. 마이크로소프트는 3월 진료 기록 앱인 ‘닥스 익스프레스’(Dax Express)‘를 출시했다. 구글은 1월 의료전문가와 환자의 질문에 유용한 답변을 생성하도록 설계한 ‘메드팜’을 출시했다. 아마존은 생성형 AI와 음성인식을 사용, 환자 진료기록을 자동으로 작성해주는 서비스 ‘AWS 헬스 스크라이브’를 출시했다. AWS 헬스 스크라이브는 의사나 간호사가 환자의 대화 내용을 인식, 진료기록을 실시간 직접 작성하며 의료 종사자들은 이를 토대로 진료기록을 완성할 수 있다.

이밖에도 휴마, 인실리코 메디신, 앱사 등 스타트업들은 AI 신약개발을 위한 생성 모델을 개발하고 있다.

연세의대 의생명시스템정보학교실 김휘영 교수는 ”기존의 AI모델은 하나의 구체적인 문제를 풀기 위해 하나의 인공지능 모델에 해당하는 데이터로 학습시켰지만 여러 문제를 가르치니 기존의 모델보다 더 뛰어난 모델이 탄생했다“고 설명했다.

단 그는 ”AI는 환자에게 새로운 기회를 제공하지만 혁신은 의료에서 항상 양날의 검인 만큼 적절한 규제가 필요하다“고 지적했다.

■기술 필요성 인정하지만 무분별한 도입은 X

실제로 일각에서는 AI의 미래가치성은 인정하지만 인간만이 지닌 능력에는 아직 못 미치는 만큼 맹신은 금물이라고 지적한다. 구글 소속 카란 싱갈, 세쿠페 아지지, 타오 투 등 연구진이 차세대 거대언어모델인 ‘팜2(PaLM2)’를 적용한 의료용 AI ‘메드-팜2(Med-PalM2)'의 성능을 테스트한 결과를 학술지 네이처에 발표한 것. 

메드-팜2는 챗봇 형태의 AI로 환자가 자신의 상태를 챗봇에 입력하면 입력된 문장을 분석해 병명을 진단하고 의학적 소견을 내놓는다. 연구결과 메드-팜2은 지난해 구글이 개발한 1세대 모델 AI에 비해 17% 더 높은 정답률을 보였다. 하지만 장문형 답을 쓰는 능력은 부족한 것으로 판단됐다. AI의 정답률은 인간 임상의보다 전체적으로 낮았다.

그런데도 우리나라 정부는 미래 시장성을 고려해  2월 14일 국회 과학기술정보방송통신위원회 법안심사소위에서 ‘인공지능산업 육성 및 신뢰 기반 조성 등에 관한 법률안’을 통과시켰다. 이 제정안은 인공지능기술 발전을 위해 ‘우선허용·사후규제 원칙’이 골자다.

하지만 무분별한 개발과 도입은 시기상조라는 것이 전문가들의 지적이다. 7월 20일 국회 과학기술정보방송통신위원회 소속 장경태·황운하 의원(더불어민주당), 장혜영 의원(정의당) 등이 주최한 'EU와 미국은 왜 인공지능을 규제하려는가?' 국회토론회에서도 이같은 내용이 다뤄졌다.

보건의료단체연합 전진한 정책국장은 토론회를 통해 검증되지 않은 AI는 ▲부정확한 진단과 치료로 개인의 건강을 위협 ▲의료불평등 및 차별 강화 ▲의료비 증가 및 상업화 추세 가속화 ▲의사결정의 책임소재 문제 ▲의료현장의 혼란 유발 등의 문제를 일으킬 것이라고 주장했다.

전진한 정책국장은 “AI기술을 선진입-후평가 하는 것은 말도 안 되는 것이고 그 결과는 엄청난 재앙일 수 있다”며 “왓슨, 바빌론 등 이미 실패한 사례가 있는 만큼 기존기술보다 안전성과 효과 검증에 대한 더 엄격한 기준이 필요하다”고 피력했다.


댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글 0
댓글쓰기
계정을 선택하시면 로그인·계정인증을 통해
댓글을 남기실 수 있습니다.