『PHARM STAGE』2021年2月号に当社社員執筆の記事「AI/MLによる安全性情報の評価の進化」が掲載されました

当社社員執筆の記事が『PHARM STAGE』2021年2月号に掲載されました。

 

AI/MLによる安全性情報の評価の進化

髙木 毅
株式会社CACクロア デジタルトランスフォーメーション推進室

1 はじめに

 1980年に副作用が疑われる個別症例の企業報告が義務化されて以来、PMDAへの報告症例数は年々増加し続けている。PMDAが公開している医薬品副作用データベースであるJADERでは、2009年度の報告数はおよそ3万例であったが、2019年度は6万例を超えており、ここ10年間で報告数は倍増している。JADERは安全性情報の中で「重篤な副作用」と評価された自発報告症例を主として集積したものであることから、ファーマコビジランス(以下PV)業務で評価されている症例数はさらに増大していると思われる。


 収集される症例数が増えることは、PV業務の主目的である薬害防止の観点では好ましいことではあるが、これまでの安全性情報の評価方法は人手頼りで、大量の症例を処理するには限界がある。その上、現在のPV業務は、品質を保ちつつ、増大する情報量をこれまでと同等か、より少ないコストで処理することも要請されている。


 そこで近年、様々な産業で活用され、発展が目覚ましいAI/MLを、 PV業務で活用しようと検討している。大量の情報とAI/MLの活用は業務の効率化だけでなく、新たな価値の創出も期待される。その中でいくつかの例を紹介したい。

2 現状の個別症例報告業務

 製薬会社には、販売している医薬品で発現した有害事象の症例情報を収集することが義務付けられている。市販後では、最短で情報入手日から15日以内の報告を求められており1)、評価の品質(正確性)だけでなく迅速性との両立が求められる。


 症例ごとに、重篤性や新規性によって当局への報告期限が決定するため、新たな症例情報を入手するたびに、評価すべき症例、優先度が変化する。しかも、重篤性や新規性は症例評価を始めないとわからないこともあるため、頻繁に作業の優先度が変わるといった状況になる。個別症例報告業務の現場では、本日分の作業量を知りたいのだが、そのためにはまず作業を始めなければならないというジレンマがあり、業務をする上での負担となっている。

 

3 AI/MLによる個別症例報告業務の支援

 症例情報の情報源は、医師や薬剤師からの自発報告、製造販売後調査、文献などがあるが、いずれも症例情報の内容は自然言語で記載されている。自然言語は、人がお互いにコミュニケーションを行うための言語であるが、近年では、その自然言語をコンピューターに処理させる技術である自然言語処理が、AI/MLの一分野として発展している。自然言語処理技術の応用例としては、機械翻訳、かな文字変換予測、スマートスピーカーとの対話などが挙げられる。


 ここで、個別症例報告業務での自然言語処理技術の応用例として、MedDRA推論を紹介する。症例情報の中に有害事象の情報があるが、個別症例報告をするためには、有害事象の記載語をMedDRA辞書の用語にコーディングする必要がある。これは、「熱がある」「熱が高い」「熱っぽい」といった揺らぎのある表現を「発熱」というMedDRA用語にまとめることで、有害事象の発現状況を解析しやすくするためである。MedDRAコーディングは、「熱がある」という記載語と同じ意味のMedDRA用語を探し出す作業であるが、MedDRA推論は、この作業をAI/MLで支援する取り組みである。


 図1は、AI/MLに有害事象の記載語からMedDRA用語を推論させた結果の例である。平易な表現の意味をとらえることや漢字とひらがなの表記の揺れ、「しょぼしょぼ」といったオノマトペにも対応することができる。また、ある程度の誤字や脱字があっても正しく推論することが可能である。

 

MedDRA推論の例

図1 MedDRA推論の例

 

 

 このMedDRA推論の仕組みはAI/MLを利用しているが、AI/MLはデータをもとにルールを学習し、そのルールを使って推論をする。当然、MedDRA推論の精度は、もととなるデータの量や質に依存することになる。MedDRA推論をするためには、記載語と、それに対して正しくコーディングされたMedDRA用語で組み合わされたデータが大量に必要になる。そのため、人がコーディングした結果を蓄積する仕組みの構築、運用が不可欠になる。


 MedDRA推論は、1つの記載語に対して1つの推論結果だけでなく、正解の可能性が高い順に複数の推論結果を出すことも可能である。例えば、推論結果が1つではなく5つあれば、推論結果に正解のMedDRA用語が含まれる確率は高くなり、たいていの場合、MedDRA辞書を引く代わりに、MedDRA推論モデルが提示した5択の問題に答えることでコーディング作業ができるようになる(たまに正解が含まれずMedDRA辞書を引く必要性は残る)。実際の個別症例報告業務のデータを利用してMedDRA推論の精度を測定してみたが、推論結果が1つの場合の精度は49.4%、5つの場合の精度は81.0%であった。


 MedDRA用語はLLT(下層語:Lowest Level Term)レベルでおよそ8万用語あるが、そのうち個別症例報告で使用される用語はおよそ1万語と想定される。最初からすべての記載語、MedDRA用語のデータを準備するのは難しいが、蓄積したデータを用いて定期的にAI/MLに学習させることによって、推論精度は高まってくる。


 MedDRA推論によって、MedDRAコーディングが自動的にできると、重篤性や予測性の自動判定も可能になる。入手した症例情報中の記載語や文章からMedDRA用語を推論し、重篤性判定の用語リストと突き合わせて重篤性を判定し(図2)、さらに、医薬品ごとの予測性判定用のリストと突き合わせれば予測性も判定できるようになる(図3)。

 

前章で、当局への症例報告期限は重篤性や新規性で決定することはすでに述べたが、症例を入手した時点でのトリアージに、上述した自動判定の仕組みを活用することができれば、当局への報告期限を早い段階で判断できるようになる。

 

 

記載語、文からの重篤性判定

図2 記載語、文からの重篤性判定

 

 

記載語からの予測性判定

図3 記載語からの予測性判定

 

4 シグナル検出と評価

 PVは医薬品のリスク管理である。有害事象を特定、評価し、必要に応じてリスク最小化策を講じることで、医薬品のリスクとベネフィットのバランスを維持する、このプロセスの始まりに位置づけられるのがシグナルである1)。伝統的には、特定の有害事象の報告数、報告割合といった定量的アプローチや個別症例の医学的レビューといった質的アプローチがとられてきたが、1990年代以降はPRR(Proportional Reporting Ratio)やROR(Reporting Odds Ratio)などの統計的シグナルの検出方法が開発され、取り入れられてきた。日本では、2013年に安全性定期報告に定期的ベネフィット・リスク評価報告(PBRER)が導入され1)、製薬企業はシグナルの評価をすることが求められるようになり、現在では多くの製薬企業で統計的シグナル検出、評価を実施している。

5 より能動的な安全対策に向けて

 

 ここで、統計的シグナル検出の課題を考えてみたい。統計的シグナル検出のもととなるデータは、自発報告等のデータベースにある医薬品と有害事象の組み合わせであり、注目する医薬品の注目する有害事象が、データベース全体と比較して高頻度に認められるか否かを検討している。つまり、特定の医薬品の有害事象特性が、全医薬品のそれと比較して有意に差があるものを拾い出している。

 

 筆者は、医薬品の安全対策の究極的な目標は副作用の発現をゼロにすることだと捉えているが、統計的シグナル検出の手法は、ある程度の有害事象が発現して、ほかの医薬品の特性と有意に差が出るまではシグナルの検出ができず、この点において改善の余地があると考える。そこで、シグナルを検出するのではなく、AI/MLを使ってシグナルを推論することはできないかと試行した例を紹介する。

 

 有害事象データベースとしてPMDAが公開しているJADER(2020年3月公開データ)、化合物DBとしてKEGG DRUG2)を利用し、シグナル推論モデルを作成した(図4)。JADERの有害事象情報(A)、JADERの医薬品情報をマッピングした化合物構造式(C)、JADERを利用した統計シグナル計算結果(Y)を入力情報として学習したモデルで、任意の化合物構造式と有害事象を与えると、その組み合わせの統計シグナル計算結果を推論することができる。医薬品情報の入力を化合物構造式としたのは、構造が似ている化合物は同じような有害事象を引き起こすと考えたためである。

 

 

シグナル推論モデル

図4 シグナル推論モデル

 

 

 まず、JADER全医薬品と有害事象の組み合わせにおいて、統計シグナル計算手法のひとつであるPRRを使って計算した結果(prr)と作成したシグナル推論モデルでのJADER全医薬品と有害事象の組み合わせのPRR推論値(pred_prr)を比較した。図5は、横軸をPRR値、縦軸を医薬品と有害事象の組み合わせ数の割合としたヒストグラムであるが、prrとpred_prrの分布はおおむね重なっている結果であった。

 

JADERでのPRR計算値とPRR推論値のヒストグラム(カーネル密度)

図5 JADERでのPRR計算値とPRR推論値のヒストグラム(カーネル密度)

 

 次に、糖尿病薬であるビルダグリプチンに注目し、PRR計算結果と推論値を比較した。図6は横軸を有害事象、縦軸をPRR値として、PRR計算結果(prr)とPRR推論値(pred_prr)をプロットしたものである(prrは信頼区間の上下限も示している)。有害事象の「多尿」についてはprrがプロットされていないが、これはJADERにビルダグリプチンを投与して多尿を発現したデータがなかったためである。シグナル推論モデルの特徴として、実際に発現していない医薬品、有害事象の組み合わせであっても、統計シグナルの値を推論できることが挙げられる。推論値の精度については現在検証中である。

 

ビルダグリプチンのPRR計算値と推論値(カーネル密度)

図6 ビルダグリプチンのPRR計算値と推論値

 

6 おわりに

 近年、医薬品のリスク・ベネフィット評価にリアルワールドデータが活用されるようになってきた。これまでの安全性評価の主な情報源は医療従事者からの自発報告であったが、これからはICT技術の発展に伴い、SNSを含むインターネット上の情報など、幅広く大量の情報が収集されることが予想される。


 これまでに蓄積された情報を有効活用し、AI/MLを適切にPV業務で利用することで、増え続ける安全性情報を適切に評価することができ、より能動的な安全対策が可能になるのではないか。これまで以上に患者さんの安全に寄与するPVの実現に期待したい。

 

 

参考文献

1) 一般財団法人医薬品医療機器レギュラトリーサイエンス財団、『安全管理・調査担当者必携 PVの概要とノウハウ 国内対応からグローバル対応へ』、株式会社じほう、2015

2)KEGG DRUG Database, https://www.genome.jp/kegg/drug/drug_ja.html(参照 2020-04-27)

 

関連サービス


TOP