인공지능이 임상시험을 변화시키고 있지만 과제는 여전히 막대하다

“`html

인공지능이 임상시험을 변화시키고 있지만 과제는 여전히 막대하다

인공지능은 의료 연구를 가속화하고 비용을 절감하며 치료 효율성을 높일 것을 약속하며 점차 임상시험 분야에서 그 위상을 확고히 하고 있다. 그러나 그 통합은 단순한 기술적 약속을 넘어서는 복잡한 질문들을 제기하고 있다.

프로토콜 설계에서 인공지능은 이제 연구자들이 제공한 간단한 요약으로부터 복잡한 문서를 자동으로 생성할 수 있게 해준다. 이는 상세한 프로토콜을 작성하는 데 필요한 시간을 크게 줄여주며, 이전에는 오랜 시간과 노력이 필요한 작업이었다. 그러나 이 같은 속도는 민감한 정보, 예를 들어 약물이나 혁신적인 디자인에 대한 정보가 외부 시스템에 입력될 때 유출될 위험을 동반한다. 예측 모델은 과거 데이터베이스를 분석하여 주요 운영 결과, 예를 들어 모집 목표 달성 능력이나 최적의 포함 기준 식별을 예측한다. 이러한 도구들은 비용이 큰 실패를 피하는 데 도움이 되지만, 그 효율성은 사용되는 데이터의 질과 대표성에 크게 의존한다.

환자 모집은 종종 임상시험에서 지연의 원인이 되는데, 인공지능의 도입으로 이 또한 개선되고 있다. 고도화된 시스템은 짧은 시간 내에 수백만 개의 의료 문서를 분석하여 적격 후보자를 식별한다. 예를 들어, 한 플랫폼은 2주도 채 되지 않아 8300만 건이 넘는 문서를 처리하며, 표준화된 의료 용어 수십억 개를 생성했다. 이러한 기술은 수동 스크리닝 시간을 절반으로 줄여 의료 팀의 시간을 절약해준다. 또한, 많은 적격 기준들이 치료 결과에 영향을 미치지 않으면서 불필요하게 환자들을 배제하고 있음을 드러낸다. 이러한 규칙을 완화한다면, 안전성을 유지하면서도 참여자 수를 두 배로 늘릴 수 있다.

그러나 이러한 시스템들의 성능은 다양하다. 일부는 높은 재현률을 보이며 대부분의 적격 환자들을 식별하지만, 정밀도가 낮아 비적격 후보자들도 포함시키기도 한다. 반대로, 매우 정밀한 시스템은 인간의 검토자들에게 부담을 줄이지만, 유효한 환자들을 배제할 위험이 있다. 최근 발전으로, 데이터 검색과 생성 모델을 결합한 시스템들은 97%가 넘는 정확도를 보이며, 일부 작업에서는 인간의 조율자들을 능가하는 결과를 보여주고 있다.

데이터 분석은 인공지능이 두각을 나타내고 있는 또 다른 분야이다. 연결된 장치나 의료 영상에서 나오는 복잡한 데이터 집합을 처리하여 전례 없는 정보의 풍부함을 제공한다. 그럼에도 불구하고 전통적인 통계 방법과 현대적인 모델 사이에 논쟁이 계속되고 있다. 고전적인 접근 방식, 예를 들어 로지스틱 회귀는 각 변수의 영향을 명확히 이해할 수 있는 투명성을 제공한다. 인공지능 모델들은 종종 더 정확하지만, 블랙박스와 같이 작동하여 내부의 추론을 이해하기 어렵다. 이러한 불투명성은 임상 채택에 있어 큰 도전으로, 특히 의사들은 이해하지 못하는 권장 사항을 따르기 주저하며, 특히 중요한 상황에서 더 그렇다.

알고리즘 편향은 또 다른 큰 장애물이다. 훈련 데이터가 역사적인 불평등을 반영한다면, 시스템은 기존의 불평등을 영속시키거나 심지어 악화시킬 수 있다. 예를 들어, 미국에서 광범위하게 사용된 한 알고리즘은 집중 치료 필요성을 평가할 때, 과거 의료 비용을 미래 필요성의 지표로 사용함으로써 백인 환자들을 흑인 환자들보다 우대했다. 이는 구조적인 불평등으로 인해 편향된 기준이었다. 또한, 주로 남성 데이터로 훈련된 심혈관 진단 도구들은 여성들에게서 정밀도가 떨어지는데, 이는 여성들의 증상이 종종 다르기 때문이다. 이러한 편향들은 공정한 결과를 보장하기 위해 개발 팀과 데이터 집합의 다양성을 강조한다.

모델의 투명성 또한 중요한 쟁점이다. 임상의사들과 환자들은 결정이 내려진 방식을 이해할 수 있어야 하며, 특히 그 결정이 생명에 직접적인 영향을 미칠 때 더 그렇다. LIME이나 SHAP와 같은 사후 설명 방법들은 특정 예측에 가장 큰 영향을 미치는 요소를 식별하여 모델을 더 이해하기 쉽게 만들려고 한다. 그러나 이러한 설명들은 근사치에 불과하며 그 자체로 오도할 수 있다. 결정 트리와 같이 본질적으로 해석 가능한 모델들은 대안이 될 수 있지만, 그 정밀도는 복잡한 모델들보다 떨어질 수 있다.

과제들은 기술적 측면에만 국한되지 않는다. 임상시험에 인공지능을 통합하는 것은 해결되지 않은 윤리적, 법적 질문들을 제기한다. 인공지능 시스템이 관여된 의료 오류가 발생할 경우, 누가 책임을 져야 하는가? 개발자, 의료 기관, 임상의사, 아니면 환자? 이 같은 책임의 분산은 “다수의 손 문제”로 불리며, 과실의 귀속을 복잡하게 만들고 환자들에게 명확한 구제 수단을 제공하지 못할 수 있다. 일부는 모든 관련자들이 책임을 공유하는 집단 책임 모델을 제안하지만, 이 접근법은 아직 개발 중이다.

데이터 소유권과 환자의 동의 또한 문제이다. 전통적인 임상시험에서 환자는 자신의 데이터가 특정 목적과 한정된 기간 동안 사용되는 것에 동의한다. 인공지능의 경우, 데이터는 종종 모델을 훈련하고 개선하기 위해 무기한 재사용된다. 이는 데이터의 소유권과 통제에 대한 질문을 제기한다. 환자들이 자신의 정보에 대해 세밀한 통제를 유지할 수 있는 데이터 주권 모델이 가능한 해결책으로 부상하고 있지만, 대규모 구현은 여전히 복잡하다.

분산 시스템인 연맹 학습과 블록체인은 개인정보 보호 및 데이터 접근과 관련된 장애물을 극복할 수 있는 방법으로 주목받고 있다. 연맹 학습은 여러 기관에 분산된 데이터에서 모델을 훈련시킬 수 있으며, 민감한 정보를 중앙 집중화하지 않는다. 그러나 이 접근법은 사이트 간 데이터의 이질성으로 인해 전역 모델의 성능이 저하될 수 있는 실무적 과제에 직면해 있다. 블록체인은 데이터의 무결성과 추적 가능성을 보장할 수 있지만, 확장성, 에너지 소비, 그리고 데이터 보호 규정(예: 삭제 권리)과의 호환성 문제로 인해 채택이 어려워지고 있다.

인공지능이 홍보하는 비용 절감과 효율성 향상은 종종 강조된다. 한 연구에 따르면, 온라인 모집은 환자당 비용을 199달러에서 72달러로 줄이고 프로세스를 크게 가속화한다. 다른 보고서들은 파일럿 임상시험에서 등록 시간을 10~15% 줄였다고 밝힌다. 그러나 이러한 숫자들은 종종 산업체에서 자금 지원받은 연구나 내부 보고서에서 나온 것들이며, 편향되거나 독립적인 검증이 부족할 수 있다. 엄격한 경제 분석은 여전히 드물며, 사용 가능한 결과들은 중요한 방법론적 결함을 보여준다.

마지막으로, 인공지능이 임상의사들의 업무 부담과 환자의 경험에 미치는 영향은 양면적이다. 일부 도구들은 번거로운 행정 작업을 자동화하여 직접적인 치료에 더 많은 시간을 할애할 수 있게 해준다. 반면에, 일부 도구들은 생성된 결과들의 지속적인 검증이 필요하여 오히려 부담을 가중시킬 수 있다. 환자들은 더 정확한 진단과 맞춤형 치료에 대한 희망과 개인정보 유출이나 인간 상호작용의 감소에 대한 우려 사이에서 오가고 있다. 최근 설문조사에 따르면, 미국인들의 60%가 의료 제공자가 인공지능에 의존하여 의료 결정을 내린다면 불편할 것이라고 답했다.

“`


Documentation et sources

Document de référence

DOI : https://doi.org/10.1007/s10791-026-10205-x

Titre : The transformative and turbulent integration of artificial intelligence in clinical trials: a critical review

Revue : Discover Computing

Éditeur : Springer Science and Business Media LLC

Auteurs : Ying Xuan Lim; Long Chiau Ming; Nancy Choon-Si Ng; Serena Leow; Rahul G. Ingle

Speed Reader

Ready
500