2020年10月26日月曜日

Journal Club:コンピテンシーが現場での評価項目に翻訳される際に,何が起こるのか


この記事は研究室内で私が発表したJournal Clubの内容を基にしています.


Tavares W, et al. Translating outcome frameworks to assessment programmes: Implications for validity. Med Teach. Med Educ. 2020 Jul 2. (online ahead of print) (PMID: 32614480)

〇背景
コンピテンシー基盤型医学教育(CBME)では,教育者が臨床能力の評価を構造化する方法が鍵となります.そりゃそうですよね.現場で行われる評価をどれだけ妥当性の高いものにするかが重要となるわけです.

なので,コンピテンシーのリストをアセスメントプランに「翻訳」する必要があります.ここで,どのような枠組みに従って「翻訳」するのがを明らかにしないと,評価の妥当性が損なわれる可能性があります.

このように,すでにある何かの実践を,アセスメントプランの策定など何か別のものに翻訳する過程を説明する理論として,Callonの翻訳理論があります.
「翻訳は単なる認知行為ではなく,社会的,政治的,実体的行為である」という考え方です.具体的には以下の4ステップからなります.

1.問題化problematization:現状の問題を投げかける
2.関心づけinteressment:問題を解決する意義を説く
3.取り込みenrolment:行動するよう促す
4.動員mobilization:別の部門へ応用する

ところで,CBMEや職場での評価(WBA)は,現場の状況や関心などの影響を受けます.
そこで,翻訳プロセスを理解し、説明できれば、効果的なCBMEと妥当な評価プログラムが前進するかもしれません.
この論文では,カナダの卒後教育において,アウトカムの枠組みが形成的/総括的評価計画に翻訳される際,その翻訳が何により構成されるかを調べています.理論的枠組として,Callonの翻訳論理とKaneの妥当性フレームワークを用いています.

〇方法
CBMEの実施が義務付けられた3大学の卒後教育関係者にIn-depth semi-structured interviewを行って,下の3つについて明らかにしようとしています.
1.評価プログラムの発展の描写と文脈化
(EPAがどのように使われているか,EPA以外はどうか)
2.翻訳プロセスの説明
(決定はどのようになされたか,計画や実装の過程でどのような変化が起こったのか)
3.評価計画の質と妥当性を保証するプログラム評価の説明

分析は,CallonとKaneの概念的枠組みに沿った直接内容分析で行われています.直接内容分析とは,理論や関連した研究知見に則って分析を開始する方法で,以下の仮定に基づいた分析が行われています.
「情報提供者は,形成的評価を行う目的で評価を構造化しているが、生成されたデータは総括的評価に関する決定においても使用される.この際には,データの生成と解釈の両方において,ある程度の妥当性がある証拠が義務付けられる」

参加者の登録→データ収集→分析→チームミーティング
という循環的かつ反復的なプロセスを継続し,その都度,サンプリングとインタビューを修正しています.これを(いわゆる)理論的飽和に達するまで継続しています.

〇結果
3つのテーマが得られました.

①「アウトカムの枠組みは,良質な評価のために必要だと位置づけられている一方で,構造が不完全ともみなされている」

・アウトカムがほぼ翻訳なしで評価として使われています
・評価者は評価プランを無批判に受け入れています
・アウトカムの枠組みが,妥当性に関係する「意図された構造」を持っていません.
・EPAだけではなく,従来の評価法(筆記試験,OSCE,360°評価)を放棄することに消極的です.

→要するに,「現場で評価する際のフレームワークは,必要だし大事だとは思っているけど,これじゃあいまいちだよね」とも思っている,ということです.

②「評価計画に対する影響と競合しながら交渉する」

・関係者は,意識的にも無意識的にも,自分のポジションを強くし他者のポジションを弱めるように動きます.
・CBMEを実装する際の意思決定は,妥当性と衝突を起こします.
・現場は圧力を感じています.
・技術的側面により評価計画が制限を受けます.

→要するに,「CBMEは聞こえは立派だけど,実際そうはいかないよね,だけど上からやれって言われているし仕方ないか,でも現場ではこちらのやり方でやらせてもらうからね」ということです.

③「妥当性を,がけっぷちであり,不明瞭で,偽りのものだと 位置づけている」

・翻訳過程と評価計画の策定のどちらにおいても妥当性が脅かされています.
 「いわれたことをしている」「参考になる先行事例がない」との発言が見られました.
・妥当性の議論より優先されるものが多いと考えられています.
・サロゲートに基づく評価がなされています
 「委員会の人たちが何度も確認していた(から大丈夫)」との発言がみられました.

→要するに,「自分の評価が妥当かって?,ふん,そんなのお偉いさんが妥当って言っているんだから妥当でしょう?そもそもこんなのやったことないし,どうしていいかわからないんだから言われたとおりにしているだけなんですけど!」ということです.

〇議論
CBMEでは,定められたコンピテンシーを評価する際に,現場で当初予測されていなかった評価基準となってしまうことがあります.
①アウトカムのフレームワークは優れた評価のために必要だが,構造が不完全です.
②いざ評価する際に,社会的,実用的な文脈による影響を受けます.
③妥当性はまじめに評価されません.また,妥当性評価の優先度が低いです.

〇limitation
カナダの3大学での調査であり,この論文の内容は環境に依存します.
また,CBMEが導入された初期の時点での研究である点にも注意です.

〇批判的吟味
研究参加者はプログラムディレクター~評価委員会のメンバーですが,もっと多様な参加者をリクルートすべきなのではと思いました(評価を受ける学習者や多職種など).
また,それ自体批判されるものではないのですが,もともとの枠組みから逸脱するような発見が書かれていない点はちょっと物足りないです.

〇感想
この論文は私にとって非常に難解で,読み解くのに時間がかかりました.まだまだ学習が足りていません.






2020年10月19日月曜日

尿酸降下はtreat to targetが良いのか



いままで,高尿酸血症に対する治療は
Lancetの2016年のseminarの記載に基づいて行っていました.
西伊豆病院のカンファレンスに,日本語での解説があります.)
つまり,尿酸降下薬の適応があれば,アロプリノールを順次増量して尿酸値を6以下にする,というものです.

6以下にする,という記述の根拠は,2012年のAmerican College of Rheumatologyの診療ガイドラインです.
そこで引用されているのが,2012年のRCTです.

ただし,このRCTは,フェブキソスタット40mg,フェブキソスタット80mg,アロプリノール300mg(腎障害あれば200mg)の3群を比べて,尿酸値を6以下にできた割合がフェブキソスタット80mgで最も多く,有害事象に差はなかった,というものなので,これですなわち「尿酸値は6以下にせよ」が導き出せるわけではなさそうです.

ところで,2020年9月のCanadian Family Physicianに,Targeting uric acid levels in treating goutという記事が載っていて,
そこでは尿酸値6以下を達成するまでアロプリノールを増量するTreat to targetは利益がないというRCTが紹介されていました.

2017年に行われたRCTなので,Lancetのセミナーの後ですね.把握していませんでした.

たしかに,このRCTを読むと,確かにアロプリノールの用量を増やした群(尿酸値6以下を達成した割合が多い)でも通常用量群とくらべ痛風発作の回数も有害事象の割合もおおよそ同じです.

各種診療ガイドラインでは,やはり6以下にしなさいと主張するもの(ACR 2020年版)もあれば,treat to targetをしないことを推奨しているもの(ACP2017年版)もあります.

余談ですが,これでACRの痛風の診療ガイドラインが2020になっているところに気づきました.読み直すと,推奨がいろいろ変わっていたので,それはそれで勉強になりました.

2012年だと,尿酸降下薬の適応は①痛風結節がある②年2回以上の発作③CKD stage 2以上④腎結石の既往となっています.

これが2020年だと,
①痛風結節②痛風によるX線上の変化③年2回以上の発作で開始を強く推奨,
④年1回以上の発作⑤発作歴が1回でもあり,かつ(CKD stage3以上 or 尿酸値9以上 or 腎結石既往)で場合によって推奨としたうえで,
発作が1回あっただけor無症候性の高尿酸血症は薬剤治療を推奨しないと明記されています.

じゃあ,どうするんだ,という話ですが,
CFPの記事には,そもそも尿酸降下療法はアドヒアランスが1年後で50-87%と慢性疾患の中では最悪の部類なので,health care supportをしっかりしましょうねと書いてあります.
たしかに,その通りだと思います.

というわけで,アロプリノールを通常量使ってもなお痛風発作が出る場合には,まず生活指導や服薬アドヒアランスの向上を図ったうえで,それでも発作が出るようなら相談の上増量や他の薬剤の併用に進む,という流れでよさそうです.

結局,この議論を通じて私の診療が大きく変化することはありませんでしたが
4年前の知識はすでに古くなっているという現実を見る機会になりました.


2020年10月12日月曜日

two feet-one hand syndrome


初めて知って,とても面白かったので,簡単に紹介です.

手の白癬で最も多い病型だそうです.
話は簡単で,足白癬を手で掻く→手に白癬がうつる→もう片方の足にもうつる,ということで,両足と片手の白癬ができることを,このように呼んでいます.

手の白癬を見たら足を見る.
また,両足の白癬を見たら,手も見る.

このように意識づけておくと拾いあげられるかもしれません.

主な鑑別は接触性皮膚炎です.
この症例報告の様に,抗真菌薬の外用薬で起こると,非常に紛らわしくなります.



2020年10月5日月曜日

Journal Club:医学教育におけるRCT.ロールモデル教育の効果測定


この記事は研究室内で私が発表したJournal Clubの内容を基にしています.


Mohammadi E, et al. Enhancement of role modelling in clinical educators: A randomized controlled trial. Med Teach. 2020 Apr;42(4):436-443. (PMID 31769342)

・論文のPICOは以下の通り.

P:テヘラン医科大学の主要な関連病院2つに所属する臨床経験5年未満の臨床医で,レジデント,インターン,クラークシップ学生のいずれかを監督する任に当たっている者
I: ロールモデルについての教育の目的で開発された3か月の縦断型プログラムを受ける
C: プログラムを受けない
O: 学習アウトカム(反応,学習された内容,行動の変化)

・学習プログラムの内容について
Positive Doctor Role Modellingフレームワークに基づいて内容を決定
 -このフレームワークには2つのphase(exposure phaseとevolution phase)があるが,このうちexposure phaseに絞った内容である.

さらに,先行文献に基づいてプログラムをデザイン
 ーBanduraの社会的学習理論に基づくロールモデル教育の7つの戦略
 ーロールモデルのイニシアチブをデザインする15の原則

・介入についての注意
対照群のコンタミを最小限にするため,プログラムの内容は他言禁止とした.

・Outcomeの測定
Kirkpatrick’s modelに基づいて評価項目を定めた
 -アウトカムのレベル:参加者の反応,学習,行動,プログラムの結果

①参加者の反応:12項目の質問紙で評価(1-5点のリッカート尺度)

②参加者の学習:7項目の質問紙で評価(1点-5点のリッカート尺度)
 ー既知の質問紙を使用した.


 -妥当性が評価されていなかったので今回評価した.
   Cronbachのα係数 0.73 
   項目全体相関:サブセット1と2のPearson相関係数は0.87と0.85
          サブセット間の相関は0.49

 -Cronbachのα係数は,尺度の均一性を評価するものであり,尺度を構成する各質問項目が,同じ特性の異なる側面についての質問となっているかを測る.

 -項目全体相関は,ある項目のスコアと,その項目以外の質問項目のスコアの合計との関連を示すものである.その項目が仲間外れでないことを確認する・

③参加者の行動:参加者(指導者)の下にいる学習者が,盲検化された状態で,行動をRole Model Apperception Toolで評価.
 -Toolの特性 α係数:0.7(開発者),0.96(パイロット研究)
        Test-retestの級間相関係数:0.82

・結果
①反応
介入群のプログラム全体に対する満足度の平均:4.7/5(SD 0.5)
質問紙の最後のフィードバック記載欄でも,満足度の高さが分かった.

②学習
介入群 3.3(SD 0.38)→4.3(SD 0.39)
対照群 3.5(SD 0.47)→3.6(SD 0.50)
介入群の介入前後で有意差あり 介入後の介入群-対照群で有意差あり

③行動
介入群 4.1(SD 0.34)→4.2(SD 0.70)
対照群 4.3(SD 0.32)→4.3(SD 0.30)
全体で有意差なし.かつ,どの評価項目においても有意差なし.

・Limitation
長期間のフォローアップができていない.
 -永続的な効果を評価していない
 -行動の変化を見るには長期間のフォローが必要

1つの大学のみでの実施
 -得られた結果の一般化可能性に制限があるかもしれない

・批判的吟味
Result②学習について,プログラム受講により3.3→4.3に変化したとある.
しかし,評価ツールの元論文では,点数の平均値はサブセット1で介入前3.9→介入直後4.6→1か月後4.3,サブセット2で介入前3.0→介入直後4.4→1か月後4.0と変化している.
今回測定された点数の変化は,このプログラムに特異的なものなのか?

Result③行動について,変化に有意差が出なかった.
統計解析の対象者が,当初のサンプルサイズに至っていないため,検出力不足の可能性がある,
また,尺度のα係数が,パイロット試験で0.96と高すぎる.
ここから,今回の研究の対象集団において,対象者の特性の違いを区別することが十分にできない可能性がある.

・感想
教育効果の測定には,プログラム開発にあたっての理論的基盤の記載や,何をどう測定するかについてなどの細部に気を配る必要がある.
自分もプログラム開発+評価をしてみたいので,とても参考になった.
正直,介入効果としてはイマイチだし,プログラムも小さくて対象者数も少ないけど,しっかりデザインすればLeading Journalに載るのですね.