US FDA, 비무작위 임상시험(nonrandomized clinical trials)에 기반한 의약품 및 의료기기의 승인

이상수의 health policy insight

[Health Policy Insight 205회]

US FDA, 비무작위 임상시험(nonrandomized clinical trials)에 기반한 의약품 및 의료기기의 승인

**▲ 이 상 수**
Medtronic North Asia
(Korea and Japan)
대외협력부 전무

잘 설계된 무작위 임상시험(randomized clinical trial, RCT)은 임상 중재(clinical interventions)의 유효성을 평가하거나 의료기기의 가능한 편익(probable benefit)을 평가하는데 가장 신뢰할 수 있는 접근방법으로 널리 알려져 있다. 그러나 RCT는 종종 환자를 모집하는데 어려움이 있거나 다른 로지스틱(logistical) 또는 타당성(feasibility) 이슈와 같은 현실적인 한계에 직면한다. 그 결과, 비무작위 관찰연구(nonrandomized, observational studies)에서 의료 중재효과(health interventions’ effects) 평가와 같은 치료평가를 위한 대체방법이 점차 더 고려되고 있다.

이러한 평가는 종종 RCTs와 유사한 결과를 제공하지만 예외사항 또한 드물지 않다. 비RCTs(non-RCTs)에 대한 주요 우려사항은 RCTs 결과가 관측연구 결과와 일치할 때 신뢰도를 가지고 예측하는 것이 어렵다는 점이다. 그러한 불일치의 결과는 때때로 재앙적이다. 관찰연구는 충분히 신뢰할 만한 것으로 고려될 때 추구하는 것이 필수적이다.

US FDA와 유럽 의약청(European Medicines Agency, EMA)과 같은 규제기관은 대규모 치료효과(large treatment effects)가 때때로 RCTs의 필요성을 없앨 수 있음을 인정했다. 그들은 non-RCTs가 신뢰할 만한 근거 출처로 간주될 수 있음을 인정했다. 즉, 편향과 무작위 오차(random errors)의 결합된 효과를 배제하는 것으로 생각되는 충분히 크거나 극적인 효과를 생성할 때, 편향 위험이 낮은 결과를 생성한다. 따라서, 관찰연구의 결과가 충분히 극적인 치료효과로 인해 신뢰할 만한 것으로 간주될 때 평가하는 접근방법은 의약품 허가기관의 승인 결정을 분석하는 것이다.

이론과 시뮬레이션 연구를 바탕으로, 5 이상 또는 10 이상의 상대위험비(relative risks, RRs) 또는 12 이상의 오즈비(odds ratios, ORs)를 나타내는 치료로서 극적인 효과를 분류하기 위한 몇 가지 정의가 제안되었다. 이러한 정의를 이용하여 EMA가 non-RCTs를 기반으로 한 치료의 7%를 승인했다; 승인의 2~4%에서 극적인 효과가 나타났다. EMA 우선검토 의약품(Priority Medicines) 및 맞춤형 경로(Adaptive Pathways) 프로그램과 마찬가지로, FDA는 혁신치료지정(Breakthrough Therapy Designation, BTD) 프로그램이 있으며 기존 치료법 대비 현저한(즉, 극적인) 개선을 보여주는 의약품 승인을 지원하고 추가 RCTs에서 추가 시험을 요구하지 않도록 고안되었다.

본 연구에서 치료효과의 규모와 BTD 프로그램 내의 의약품의 non-RCTs와 인도적 의료기기 면제(Humanitarian Device Exemption, HDE) 프로그램 내의 의료기기를 기반으로 FDA 승인과의 연관성을 평가했다. FDA는 의료기기에 대해 RCTs에서 시험하는 것을 거의 요구하지 않기 때문에 RCTs에서 의료기기의 추가시험이 불필요하다는 것을 암시적으로 판단한 것으로 보인다. 그러나 FDA는 획기적 의료기기 프로그램(Breakthrough Devices Program)의 맥락에서 의료기기를 평가할 때 효과 강도(magnitude of effect)의 중요성을 인정했다. 추가적인 무작위 근거에 대한 요청없이 승인된 중재(interventions)의 효과크기와 그러한 요청이 이루어진 중재를 비교했다.

RCTs 시스템은 표준 치료법 보다 우수한 새로운 치료법의 50% 이상의 개발로 귀결되는 치료법의 발전을 위한 가장 신뢰할 수 있는 수단으로 널리 알려져 있다. 역설적으로 무작위배정(randomization)은 더욱 효율적인 의약품 개발에 대한 장애물로 점차 더 여겨지고 있다. 따라서, 의약품 개발 및 진료에서 관찰적(observational) 실세계 데이터(real-world data)를 사용해야 한다는 요구가 증가하고 있다.

그러나 의약품 개발 및 사용에 대한 RCTs와 관찰연구(observational studies) 이용의 신뢰성을 비교하는 과거 연구에서 관찰연구 결과가 종종 실험연구(experimental studies) 결과와 유사하다는 것이 밝혀졌지만, 결과는 종종 그 정도가 다를 수 있어 관찰연구에서 편향의 양과 방향을 신뢰성 있게 예측하는 것은 불가능하다고 결론을 내렸다. 무작위배정을 대체하고 새로운 치료법이 기존 치료법보다 나은지 확실하게 평가할 수 있는 유일한 방법은 매우 큰(즉, 극적인) 효과를 나타내는 의약품을 개발하는 것이다. 순전한 치료 차이가 무작위배정이 효과적으로 통제하는 배정 편향(allocation bias)과 무작위 오류(random error)를 무시하기에 충분한 것으로 간주되기 때문에 이러한 극적인 효과는 신뢰할 수 있는 것으로 여겨진다.

결과적으로, 의약품 개발은 극적인 효과를 갖는 치료법을 찾는 것으로 점점 더 특징 화되고 있다. 합리적 의약품 디자인의 적용과 정밀의학 및 표적치료법 개발을 위한 omics 기반 기술의 활용은 RCT 시스템을 대체할 수 있다고 생각된다; 따라서 관찰연구 (즉, non-RCTs)에서의 시험으로 충분할 수 있다. 그러나 RCTs에서의 추가시험이 필요하지 않은 정도는 얼마나 커야 하며, 효과는 언제 충분히 극적이라고 고려되어야 하는가? 환자를 대상으로 시험할 때 극적인 효과를 미칠 치료법이 개발될 확률은 얼마인가? 그러한 경험적 기준(benchmark)을 갖는 것은 의약품 발견 프로세스를 가속화시킨다.

이러한 질문에 답하는 한가지 방법은 FDA와 같은 규제기관이 RCTs에서 시험하지 않고도 임상용 의약품을 승인하는 빈도와 치료효과 규모를 평가하는 것이다. 현실적인 한계로 인해 RCTs에서 환자등록(enrollment)이 어려운 경우, 강력한 추정된 효과가 이러한 시험이 불필요하다고 규제기관을 설득하는데 충분할 수 있다. 실제로 FDA와 EMA는 non-RCTs 시험을 기반으로 기존 치료법 대비 상당한 개선을 입증하는 의약물 승인을 지원하기 위한 규제 메커니즘을 도입했다. 그러나, 제안된 중재가 관찰적 근거에 기반한 경우, 새로운 의학적 치료를 승인하기에 충분한 추정된 치료효과 크기에 관한 경험적 근거는 제한적이다. 이전 연구에서 EMA는 비무작위 연구 데이터만을 기반으로 의약품의 7%를 승인한 것으로 밝혀졌다. 이 가운데 비무작위 데이터에 기반한 EMA 승인의 2~4%는 소위 극적인 효과를 나타냈다; 비무작위 연구에서 더 큰 효과크기는 더 높은 EMA 허가승인 비율과 관련이 있었다.

EMA 연구에서, 관찰적 데이터에 기반한 극적인 효과의 추정치는 10 이상의 상대위험비 기준을 사용한 중재의 32%, 그리고 5 이상의 상대위험비 기준을 사용한 중재의 40%에서 관찰되었다. 현행 연구에서, FDA는 관찰연구에 기초하여 10.0%(68/677)의 의약품 또는 의료기기를 승인했다. 이 비율은 의약품을 고려할 때 EMA 비율과 매우 유사하지만, FDA 연구에서 의료기기의 경우 훨씬 더 높았다. 정의에 따라, FDA 승인의 1.3%(9/677)~1.7%(12/677)에서 극적인 효과가 관찰되었다. 의약품이 RCTs에서 평가될 경우 이는 50% 성공률과 비교된다. EMA 연구에서 규제기관이 RCTs에서 추가 시험을 요구하지 않는 평균 오즈비는 12였다; 그러나 FDA 데이터는 각각의 오즈비는 상당히 적었다(6.3). 본 연구는 EMA 승인을 평가한 관찰을 확인시켜주었는데, non-RCTs에서 더 큰 효과크기가 있을 때 규제기관이 후속적 확증적 RCTs(confirmatory RCTs)를 요구할 가능성이 적었다. 그러나, FDA가 추정된 효과 강도에 기반하여 의약품이나 의료기기를 승인하는 역치(threshold)에 대한 명확한 근거를 발견하지 못했다. Non-RCT 연구에 기반한 승인과 관련하여 FDA 의사결정에서 다른 요소가 중요한 역할을 할 수 있음을 의미한다.

시사점

·치료효과 크기는 RCTs로 추가 시험을 필요로 한 치료 대비 non-RCTs를 기반으로 승인된 치료에서 약 2.5배 높았음. Non-RCTs에 기반하여 FDA 승인을 받은 의약품의 약 1~2% 만이 소위 극적인 효과를 보임

·치료효과 크기는 non-RCTs를 기반으로 한 치료의 FDA 승인에 중요함. 추정된 치료효과의 강도가 더 큰 치료의 경우 FDA는 후속 RCTs를 요청하지 않지만 FDA와 EMA가 이러한 추정치를 추정하고 승인 결정을 내리는 데이터의 질은 매우 낮음

·치료효과에 대한 추론은 항상 비교(직접적이거나 반사실적)에 의존하기 때문에, 관찰 데이터를 기반으로 한 의약품과 의료기기 승인에 대한 의사결정이 적절하다는 확신을 심어 주기 위해서는 (역사적) 비교대상(historical comparators)을 선택하는 근거에 대한 더 큰 투명성이 필요함

출처: US Food and Drug Administration Approvals of Drugs and Devices Based on Nonrandomized Clinical Trials: A Systematic Review and Meta-analysis

Razavi M. et al. JAMA Network Open. 2019;2(9):e1911111. doi:10.1001/jamanetworkopen.2019.11111
https://jamanetwork.com/journals/jamanetworkopen/fullarticle/2749563

의료기기뉴스라인 webmaster@kmdia.or.kr

다른기사 보기

상단영역

본문영역