有临医药:美国FDA就数据递交新格式(Dataset-JSON)征求公众意见或预示临床试验数据递交新纪元

有临医药:美国FDA就数据递交新格式(Dataset-JSON)征求公众意见或预示临床试验数据递交新纪元

开篇声明:1:以下内容转自以下内容转自微信公众号有临医药《美国FDA就数据递交新格式(Dataset-JSON)征求公众意见或预示临床试验数据递交新纪元》,如有侵权,可联系删除

                 2. 以下观点,仅代表作者个人观点,请带着质疑的态度去阅读。如有问题,欢迎评论区留言或直接联系作者

美国FDA就数据递交新格式

(Dataset-JSON)征求公众意见

或预示临床试验数据递交新纪元



最新进展:美国FDA

就Dataset-JSON格式征求意见


2025年4月9日FDA就未来是否接受将Dataset-JSON作为监管申请中电子研究数据交换标准一事征求公众意见,意见反馈截止日期为2025年6月9日[1]。征求意见稿提及FDA正在探索采用临床数据交换标准协会(CDISC)的Dataset-JSON v1.1作为新的交换标准,未来替代SAS XPORT v5用于向生物制品评价与研究中心(CBER)和药品评价与研究中心(CDER)提交电子研究数据。该征求意见稿建议公众从以下两方面反馈意见:


  • 行业采用Dataset-JSON作为向FDA提交电子研究数据新标准的风险与收益。

  • 现有工具和系统在整合过程中可能面临的挑战。


在此之前,2023年7月至2024年6月,制药行业用户软件交流协会(PHUSE:Pharmaceutical Users Software Exchange)、临床数据交换标准协会(CDISC)与美国食品药品监督管理局(FDA)三方携手,开展了一项具有里程碑意义的“Dataset-JSON作为监管递交替代传输格式”试点项目。这项历时近一年的研究所发布的最终报告揭示了一个重要行业趋势:JSON格式正逐步获得FDA的官方认可,有望成为未来临床试验数据递交的新标准[2]


根据FDA最新版《以电子格式提供监管提交—标准化研究数据行业指南》(2021年6月Revision 2)[3],目前FDA仍主要接受SAS XPT(V5传输格式)作为标准递交格式。但值得关注的是,FDA的“数据现代化行动计划”(Data Modernization Action Plan)已明确将鼓励使用更现代的数据格式作为战略重点。此次试点正是这一战略的重要实践环节,标志着FDA向数据标准现代化迈出了实质性一步[4]

试点项目吸引了来自全球顶尖制药公司、CRO和技术供应商的广泛参与,包括强生、默克、罗氏等19家机构提交了详细的测试反馈。FDA/CDER(药物评价与研究中心)也亲自参与了五个临床研究和三个非临床研究的测试递交,对Dataset-JSON的实际表现进行了全面评估。








01.





JSON格式与CDISC

Dataset-JSON v1.1深度解析

JSON技术优势

JSON(JavaScript Object Notation)作为一种轻量级的数据交换格式,在现代信息技术领域已获得广泛应用,其核心优势包括:

人类可读性:采用纯文本格式,数据结构清晰直观

跨平台性:几乎所有现代编程语言都提供原生支持

灵活性:支持复杂的层次化、嵌套数据结构

扩展性:可轻松添加新字段而不影响现有解析逻辑

网络友好:是RESTful API的事实标准格式


CDISC Dataset-JSON v1.1创新特性

CDISC Dataset-JSON是专为满足监管递交需求而设计的现代化数据集格式,v1.1版本在以下方面实现了重要突破:

性能优化:

- 文件体积比传统XPT格式平均减小30-50%

- 新增NDJSON(Newline Delimited JSON)支持,可实现大数据集的流式处理

数据类型增强:

- 引入decimal数据类型,解决浮点数精度问题

- 采用ISO 8601标准表示日期时间,避免SAS与R等系统间的日期纪元差异

- 新增Boolean等ODM数据类型支持

结构简化

- 扁平化数据结构,将"itemData"改为更直观的"rows"

- 用"columns"替代原有的"items"命名,提高可读性

元数据整合:

- 内置丰富元数据,减少对外部define.xml的依赖

- 新增targetDataType属性,明确数据类型转换规则

国际化支持:

- 默认采用UTF-8编码,完整支持非ASCII字符

- 解决了传统XPT格式在非英语字符处理上的局限性






02.





Dataset-JSON与XPT格式

全方位对比

技术规格对比


对比维度 Dataset-JSON XPT (SAS V5传输格式)
格式标准 开放标准(MIT许可证) SAS专有格式
数据结构 支持复杂层次结构 仅限平面表格结构
元数据支持 内线丰富元数据 需单独define.xml文件
字符编码 UTF-8(完整Unicode支持) 仅支持ASCII字符集
开发工具 几乎所有编程语言原生支持 主要依赖SAS生态系统
文件压缩率 平均减少30%-50% 体积较大
API支持 原生适合API传输 不适合现代API架构
数据精度 支持decimal精确小数 存在浮点数精度问题
日期处理 ISO 8601 标准日期时间 依赖SAS日期纪元(1960年基准)

有临医药:美国FDA就数据递交新格式(Dataset-JSON)征求公众意见或预示临床试验数据递交新纪元有临医药:美国FDA就数据递交新格式(Dataset-JSON)征求公众意见或预示临床试验数据递交新纪元

试点中发现的关键差异

数据处理能力:

- Dataset-JSON成功处理了包含非ASCII字符的测试案例,而XPT转换此类字符会存在一定问题

- 在包含长变量名(超过8个字符)的数据集中,Dataset-JSON表现完美,XPT则出现截断

工具兼容性:

- Dataset-JSON能被所有测试的数据管理工具正确解析

- 但当前主流分析工具(SAS、JMP等)尚未完全适配,需要代码调整

元数据完整性:

- Dataset-JSON转换回XPT时会丢失部分元数据

- 试点建议保留两种格式副本以确保数据追溯性

行业接受度:

- 89%的测试机构使用SAS进行格式转换

- 但95%的机构成功完成了双向转换,证明技术可行性






03.





Dataset-JSON未来展望

短期(1-2年):

- XPT仍是主要递交格式

- Dataset-JSON在复杂数据结构、ePRO数据等场景试点应用

- 工具厂商(如SAS/JMP)更新软件支持,适配Dataset-JSON的元数据加载

- PHUSE/CDISC将继续制定商业案例和长期发展路线图


中期(2-3年):

- FDA可能发布Dataset-JSON采纳时间表

- 预计2025-2026年进入FDA数据标准目录

- 成为某些递交场景的推荐格式


长期(3-5年):

- 可能成为与XPT并列的标准格式

- 在API数据交换领域占据主导地位

- 全面释放CDISC标准的潜力






04.





必备资源指南

核心规范文档:

CDISC Dataset-JSON v1.1标准规范

https://www.cdisc.org/standards/data-exchange/dataset-json/dataset-json-v1-1

CDISC Dataset-JSON Specification

https://cdisc-org.github.io/DataExchange-DatasetJson/doc/dataset-json1-1.html

监管政策文件:

FDA《电子递交指南》2021版

https://www.fda.gov/media/82716/download

FDA Study Data Technical Conformance Guide - March 2025

https://www.fda.gov/media/153632/download


试点研究成果:

PHUSE Dataset-JSON最终报告

https://phuse.s3.eu-central-1.amazonaws.com/Deliverables/Optimizing+the+Use+of+Data+Standards/WP-88+Dataset-JSON+Report.pdf


COSA Hackathon解决方案集

https://union1.sharepoint.cn/sites/BDM/Shared%20Documents/A02_市场与品牌建设/公众号文章/2025/2025-04%20临床试验数据递交新纪元/COSA%20Hackathon解决方案集

实用工具资源:

COSA Repository Directory

https://cosa.cdisc.org




随着生命科学行业数字化转型加速,Dataset-JSON代表的数据现代化趋势已不可逆转。建议行业同仁把握这一变革机遇,从今天开始布局准备,共同迎接临床试验数据递交的新纪元。


Tips:定期查看FDA数据标准目录,及时获取Dataset-JSON采纳进展的最新信息!


Tips:可报名参加CDISC中国近期相关直播活动,详见CDISC中国公众号。









参考文献:

[1] FDA Requests Public Comment on CDISC Dataset-JSON Standard

https://www.cdisc.org/public-review/fda-requests-public-comment-cdisc-dataset-json-standard

[2] Dataset-JSON as an Alternative Transport Format for Regulatory Submissions: Final Pilot Report

https://phuse.s3.eu-central-1.amazonaws.com/Deliverables/Optimizing+the+Use+of+Data+Standards/WP-88+Dataset-JSON+Report.pdf

[3] Providing Regulatory Submissions in Electronic Format — Standardized Study Data Guidance for Industry

https://www.fda.gov/media/82716/download

[4] FDA Data Modernization Action Plan

https://www.fda.gov/about-fda/reports/data-modernization-action-plan




撰写:李斯友、何志豪

审核:章飞燕、张子豹


完结


原文链接: https://mp.weixin.qq.com/s/ZxonHYBq3spjwgPfhoCzng

0条评论

评论文章

您的电子邮件等信息不会被公开,以下所有项均必填

相关推荐

推荐收藏:网页推荐

推荐收藏:网页推荐

澳宗生物创新药AUKONTALS冲刺FDA上市,N个蔡磊有救了

澳宗生物创新药AUKON...

诺华制药Leqvio(乐可为)在亚洲III期临床中国大陆结果发表

诺华制药Leqvio(乐...