開篇宣告:1:以下內容轉自以下內容轉自微信公眾號有臨醫藥《美國FDA就資料遞交新格式(Dataset-JSON)徵求公眾意見或預示臨床試驗資料遞交新紀元》,如有侵權,可聯絡刪除
2. 以下觀點,僅代表作者個人觀點,請帶著質疑的態度去閱讀。如有問題,歡迎評論區留言或直接聯絡作者
美國FDA就資料遞交新格式
(Dataset-JSON)徵求公眾意見
或預示臨床試驗資料遞交新紀元
最新進展:美國FDA
就Dataset-JSON格式徵求意見
2025年4月9日FDA就未來是否接受將Dataset-JSON作為監管申請中電子研究資料交換標準一事徵求公眾意見,意見反饋截止日期為2025年6月9日[1]。徵求意見稿提及FDA正在探索採用臨床資料交換標準協會(CDISC)的Dataset-JSON v1.1作為新的交換標準,未來替代SAS XPORT v5用於向生物製品評價與研究中心(CBER)和藥品評價與研究中心(CDER)提交電子研究資料。該徵求意見稿建議公眾從以下兩方面反饋意見:
行業採用Dataset-JSON作為向FDA提交電子研究資料新標準的風險與收益。
現有工具和系統在整合過程中可能面臨的挑戰。
在此之前,2023年7月至2024年6月,製藥行業使用者軟體交流協會(PHUSE:Pharmaceutical Users Software Exchange)、臨床資料交換標準協會(CDISC)與美國食品藥品監督管理局(FDA)三方攜手,開展了一項具有里程碑意義的“Dataset-JSON作為監管遞交替代傳輸格式”試點專案。這項歷時近一年的研究所釋出的最終報告揭示了一個重要行業趨勢:JSON格式正逐步獲得FDA的官方認可,有望成為未來臨床試驗資料遞交的新標準[2]。
根據FDA最新版《以電子格式提供監管提交—標準化研究資料行業指南》(2021年6月Revision 2)[3],目前FDA仍主要接受SAS XPT(V5傳輸格式)作為標準遞交格式。但值得關注的是,FDA的“資料現代化行動計劃”(Data Modernization Action Plan)已明確將鼓勵使用更現代的資料格式作為戰略重點。此次試點正是這一戰略的重要實踐環節,標誌着FDA向資料標準現代化邁出了實質性一步[4]。
試點專案吸引了來自全球頂尖製藥公司、CRO和技術供應商的廣泛參與,包括強生、默克、羅氏等19家機構提交了詳細的測試反饋。FDA/CDER(藥物評價與研究中心)也親自參與了五個臨床研究和三個非臨床研究的測試遞交,對Dataset-JSON的實際表現進行了全面評估。
01.
JSON格式與CDISC
Dataset-JSON v1.1深度解析
JSON技術優勢
JSON(JavaScript Object Notation)作為一種輕量級的資料交換格式,在現代資訊科技領域已獲得廣泛應用,其核心優勢包括:
人類可讀性:採用純文字格式,數據結構清晰直觀
跨平臺性:幾乎所有現代程式語言都提供原生支援
靈活性:支援複雜的層次化、巢狀數據結構
擴充套件性:可輕鬆新增新欄位而不影響現有解析邏輯
網路友好:是RESTful API的事實標準格式
CDISC Dataset-JSON v1.1創新特性
CDISC Dataset-JSON是專為滿足監管遞交需求而設計的現代化資料集格式,v1.1版本在以下方面實現了重要突破:
效能最佳化:
- 檔案體積比傳統XPT格式平均減小30-50%
- 新增NDJSON(Newline Delimited JSON)支援,可實現大資料集的流式處理
資料型別增強:
- 引入decimal資料型別,解決浮點數精度問題
- 採用ISO 8601標準表示日期時間,避免SAS與R等系統間的日期紀元差異
- 新增Boolean等ODM資料型別支援
結構簡化:
- 扁平化數據結構,將"itemData"改為更直觀的"rows"
- 用"columns"替代原有的"items"命名,提高可讀性
後設資料整合:
- 內建豐富後設資料,減少對外部define.xml的依賴
- 新增targetDataType屬性,明確資料型別轉換規則
國際化支援:
- 預設採用UTF-8編碼,完整支援非ASCII字元
- 解決了傳統XPT格式在非英語字元處理上的侷限性
02.
Dataset-JSON與XPT格式
全方位對比
技術規格對比
對比維度 | Dataset-JSON | XPT (SAS V5傳輸格式) |
格式標準 | 開放標準(MIT許可證) | SAS專有格式 |
數據結構 | 支援複雜層次結構 | 僅限平面表格結構 |
後設資料支援 | 內線豐富後設資料 | 需單獨define.xml檔案 |
字元編碼 | UTF-8(完整Unicode支援) | 僅支援ASCII字符集 |
開發工具 | 幾乎所有程式語言原生支援 | 主要依賴SAS生態系統 |
檔案壓縮率 | 平均減少30%-50% | 體積較大 |
API支援 | 原生適合API傳輸 | 不適合現代API架構 |
資料精度 | 支援decimal精確小數 | 存在浮點數精度問題 |
日期處理 | ISO 8601 標準日期時間 | 依賴SAS日期紀元(1960年基準) |
試點中發現的關鍵差異
數據處理能力:
- Dataset-JSON成功處理了包含非ASCII字元的測試案例,而XPT轉換此類字元會存在一定問題
- 在包含長變數名(超過8個字元)的資料集中,Dataset-JSON表現完美,XPT則出現截斷
工具相容性:
- Dataset-JSON能被所有測試的資料管理工具正確解析
- 但當前主流分析工具(SAS、JMP等)尚未完全適配,需要程式碼調整
後設資料完整性:
- Dataset-JSON轉換回XPT時會丟失部分後設資料
- 試點建議保留兩種格式副本以確保資料追溯性
行業接受度:
- 89%的測試機構使用SAS進行格式轉換
- 但95%的機構成功完成了雙向轉換,證明技術可行性
03.
Dataset-JSON未來展望
短期(1-2年):
- XPT仍是主要遞交格式
- Dataset-JSON在複雜數據結構、ePRO資料等場景試點應用
- 工具廠商(如SAS/JMP)更新軟體支援,適配Dataset-JSON的後設資料載入
- PHUSE/CDISC將繼續制定商業案例和長期發展路線圖
中期(2-3年):
- FDA可能釋出Dataset-JSON採納時間表
- 預計2025-2026年進入FDA資料標準目錄
- 成為某些遞交場景的推薦格式
長期(3-5年):
- 可能成為與XPT並列的標準格式
- 在API資料交換領域佔據主導地位
- 全面釋放CDISC標準的潛力
04.
必備資源指南
核心規範文件:
CDISC Dataset-JSON v1.1標準規範
https://www.cdisc.org/standards/data-exchange/dataset-json/dataset-json-v1-1CDISC Dataset-JSON Specification
https://cdisc-org.github.io/DataExchange-DatasetJson/doc/dataset-json1-1.html監管政策檔案:
FDA《電子遞交指南》2021版
https://www.fda.gov/media/82716/downloadFDA Study Data Technical Conformance Guide - March 2025
https://www.fda.gov/media/153632/download試點研究成果:
PHUSE Dataset-JSON最終報告
COSA Hackathon解決方案集
https://union1.sharepoint.cn/sites/BDM/Shared%20Documents/A02_市場與品牌建設/公眾號文章/2025/2025-04%20臨床試驗資料遞交新紀元/COSA%20Hackathon解決方案集實用工具資源:
COSA Repository Directory
https://cosa.cdisc.org隨著生命科學行業數字化轉型加速,Dataset-JSON代表的資料現代化趨勢已不可逆轉。建議行業同仁把握這一變革機遇,從今天開始佈局準備,共同迎接臨床試驗資料遞交的新紀元。
Tips:定期檢視FDA資料標準目錄,及時獲取Dataset-JSON採納進展的最新資訊!
Tips:可報名參加CDISC中國近期相關直播活動,詳見CDISC中國公眾號。
參考文獻:
[1] FDA Requests Public Comment on CDISC Dataset-JSON Standard
https://www.cdisc.org/public-review/fda-requests-public-comment-cdisc-dataset-json-standard[2] Dataset-JSON as an Alternative Transport Format for Regulatory Submissions: Final Pilot Report
https://phuse.s3.eu-central-1.amazonaws.com/Deliverables/Optimizing+the+Use+of+Data+Standards/WP-88+Dataset-JSON+Report.pdf[3] Providing Regulatory Submissions in Electronic Format — Standardized Study Data Guidance for Industry
[4] FDA Data Modernization Action Plan
https://www.fda.gov/about-fda/reports/data-modernization-action-plan撰寫:李斯友、何志豪
稽覈:章飛燕、張子豹
完結
0則評論