文章概要:作者山腳下的螞蟻,描述了方案偏離資料統計分析的樣例,再到相關資料的收集流程、最後到統計分析對資料的要求等
開篇宣告:1:以下內容非原創,轉自微信公眾號山腳下的螞蟻《6 方案偏離資料收集流程和常見資料問題》,如有侵權,可聯絡刪除
2. 以下觀點,僅代表作者個人觀點,請帶著質疑的態度去閱讀,如有問題,歡迎評論區留言或直接聯絡作者
方案偏離資料收集流程和常見資料問題
前言
今天看到了一篇不同角度的關於PD的文章https://mp.weixin.qq.com/s/qJrb6vBgkoVNBhALGUsm8g,寫得很好很詳細,大家可以一起學習下。
—————————————————
最近有一點忙,好久沒寫了,抱歉。。。寫點什麼呢?寫一下最近的問題和感慨吧。
最近一個專案的方案偏離遇到了很多的資料問題,經過了數輪的郵件溝通依然無效,讓我一度懷疑這個 global CRO 相關人員的資質和經驗。
既往也經常會有一些資深的DM、Programmer、統計師甚至PM問我關於方案偏離的流程,那麼我這裏就藉機會來給大家科普一下我眼裏的方案偏離資料的收集流程以及常見的資料問題。不同的 CRO 或者 Sponsor 的流程可能有所出入,但宗旨基本一致。如有紕漏,歡迎批評指正哈~
正文
以終為始,我們先來說一下方案偏離(Protocol Deviation,下簡稱PD)的最後的資料分析或者呈現。(方案偏離或方案違背(Protocol Violation)從統計分析的角度都是一回事兒,但有些人認為兩者性質不一樣,方案違背更嚴重,有故意或惡意的嫌疑,故使用“方案偏離”字眼比較中性一些)
1. 資料呈現
PD 資料的呈現一般是至少一個列表;如果PD數量較多,可以再提供一個表格。
表格:通常是基於Safety Set,對Major/Important/Severe PDs 或者 all PDs 按照具體的分類和子分類彙總各個治療組的人數和百分比。如果PDs數量較少,一個列表就看清楚問題了,不出表格也是Okay的,比如Phase 1或者BE的一些專案。(當然不管PDs數量多少或者有無,均提供一個表格也是Okay。)

需要注意的是,分析可能需要根據具體的計劃來調整。比如,有的申辦方可能定義:一級分類、二級分類、和三級分類然後是具體的描述以及嚴重程度,那麼這個時候彙總可能也需要調整到三級分類。因為此時僅一級和二級分類無法提供足夠有效的資訊。
列表: 通常是基於Safety Set,至少包括受試者編號、PD分類和子分類(或者1-3級分類)、PD描述、以及嚴重程度等資訊。
2. 方案偏離數據流程
第一步 計劃 (PD Plan)
在臨床啟動前,定義方案偏離的分類、子分類以及嚴重程度等(下簡稱PD Plan)。某CRO是將其包括在Medical Monitior Plan中,由MM來起草;某Sponsor是撰寫了一份獨立檔案PD Plan,由PM來起草。你所在單位是誰來撰寫?歡迎留言交流。
方案偏離的嚴重程度:
-
大多為二分類,比如Major/Minor, or Important/Non-important; -
也有的CRO或者Sponsor用三分類,比如Mild/Moderate/Severe。 -
無法確定的其嚴重程度的條目,在計劃裡嚴重程度定為TBD;有了具體資料後,根據實際情況來考量其嚴重程度。
第二步 臨床實施
方案偏離分類的計劃裡可以提前劃分一下職責,哪些條目是透過Medical Review, CRA Monitor, DM Review or SAS Programming來發現,均可在PD Plan裡進行規定。(對於Phase 1 非腫瘤專案或者BE專案,樣本量小,資料量小,試驗週期短,PDs的收集建議可不用透過SAS程式設計收集。)
依照這個計劃的分類,各個function進行方案偏離的收集和上報。PM/DM可能會對各個function收集上來的PD進行reconcilation和去重,然後找Medical,Statistician進行審閱。
在資料庫鎖定前一般會開資料稽覈會(有的公司是DM lead,有的公司是統計Lead):
-
資料稽覈會上可以對有爭議的PD(主要是針對嚴重程度)和各個function以及PI進行討論,最終定稿PD listing。 -
同時討論方案偏離(主要是重大方案偏離)對分析人群的影響(比如是否納入符合方案分析集PPS),從而將分析人群定稿。
定稿後的PD listing將最終傳輸給統計程式設計進行資料分析。
3. PD資料常見資料問題
-
PD的一級/二級分類、編號等資訊保持和PD plan一致: -
儘量採用下拉選擇的方式來填寫,儘量避免人工手動錄入。 -
PDs間的一致性:相同的PD應該歸屬相同的PD分類和嚴重程度。 -
PD的描述: -
儘量描述受試者相關的客觀事實,儘量不要摻和意見以及處理措施; 針對PD 的意見和處理措施可以描述單獨描述;比如CAPA,CRA/PI針對PD的看法或者action taken, 或者專案組為預防take的action可以和PD的描述分不同的列進行描述。 -
建議PD描述新增訪視資訊或者入組時間等相對時間(方便把故事講清楚)。 -
PD描述不宜過長(比如不超過200個字元),不然將來統計程式設計生成的listing會非常大。 -
PD的嚴重程度: 和PD Plan保持一致。 -
受試者編號:中心層面的PD受試者編號統一為空,或者NA;受試者層面的PD,受試者編號不能為空。 -
刪除線不管用,需要刪除行或用flag 標識。 -
最後定稿的PD listing 嚴重程度列無TBD。 -
避免重複上報相同的PDs。
前文我抱怨的Global CRO提供的PD listing基本出現了上述所有的資料問題,其PD的描述最長能達到3300+個字元。他們的PD資料已經完全脫離了PD Plan的控制,各種不一致。關鍵是數輪的溝通和修訂,始終未得到較好的解決。我真的是無語至極。
4. PD 資料討論
對於資料展示,我們一般都是Safety Set, 也就是用藥的受試者;而PD在收集的時候是分為中心層面和受試者層面的;中心層面的PD(比如藥物儲存超溫)一般受試者編號為空;那麼中心層面的資料是否需要納入SDTM DV 以及分析資料集ADDV呢?
下為個人理解,供參考:
-
中心層面的PDs是無法納入相應表格和列表的,因為分析是基於某個人群來展示的,比如Safety Set。 -
因為分析資料集是為其分析表格和列表準備的,故中心層面的PDs不用納入分析資料集ADDV。 -
中心層面的PDs也無需納入SDTM DV,不然Pinnacle 21 validation會report問題。所有PDs均錄入在相應的資料庫以及source document,將來CDE覈查也是針對這些記錄進行,而非SDTM。綜上,我認為SDTM DV 亦無需包含中心層面的PDs。(如有不同理解,歡迎私信討論哈~)
那麼在CSR撰寫的時候,如何對中心層面的PD進行描述呢?如果需要描述,個人建議Medical Writer關注一下finalized PD listings 中心層面的PD,然後Mannual review and report。(個人見解,可能有失偏頗哈,歡迎私信討論)
結語
對於PD資料的收集,不同的單位有不同的流程,但宗旨大體一致。
大家如何不同的理解和做法,歡迎私信來溝通和討論哈~
如有紕漏,也歡迎批評指正~
最後給大家一句寄語:即便是行業大拿,大多也是摸著石頭過河累積的經驗,極少人是統計理論基礎紮實,說話絕對正確。希望大家帶著質疑的態度,來閱讀和聆聽(包括我的文章),然後根據自己的實際情況內化為自己的知識和技能。
完結
0則評論