ASCO中国标尺丨梁斐教授:“看穿”数据——统计学视角下的DESTINY-Breast系列研究解读

近年来,DESTINY-Breast(DB)系列研究不断刷新HER2阳性乳腺癌的治疗格局。从DB-03到DB-09,再到DB-05和DB-11,T-DXd在晚期、早期、新辅助等多个治疗场景中均展现出令人瞩目的疗效。然而,临床研究的设计与解读并不仅仅是看一个P值或风险比。作为统计学者,我们更需要关注:研究终点选择的合理性、α分配策略、期中分析的设计与解读、亚组分析的正确方法,以及样本量调整背后的考量。本文邀请到复旦附属中山医院生物统计室统计师梁斐教授,他从统计学角度出发,解析DB-09和DB-11这两项早期新辅助和晚期一线治疗具有里程碑意义的研究,并结合2026年ASCO大会公布的最新DB-09探索性分析结果,与读者共同探讨如何科学地解读这些关键证据。

编者按:近年来,DESTINY-Breast(DB)系列研究不断刷新HER2阳性乳腺癌的治疗格局。从DB-03到DB-09,再到DB-05和DB-11,T-DXd在晚期、早期、新辅助等多个治疗场景中均展现出令人瞩目的疗效。然而,临床研究的设计与解读并不仅仅是看一个P值或风险比。作为统计学者,我们更需要关注:研究终点选择的合理性、α分配策略、期中分析的设计与解读、亚组分析的正确方法,以及样本量调整背后的考量。本文邀请到复旦附属中山医院生物统计室统计师梁斐教授,他从统计学角度出发,解析DB-09和DB-11这两项早期新辅助和晚期一线治疗具有里程碑意义的研究,并结合2026年ASCO大会公布的最新DB-09探索性分析结果,与读者共同探讨如何科学地解读这些关键证据。

DB-09研究

主要终点PFS的“定期考核”

DB-09研究是一项针对HER2阳性晚期或转移性乳腺癌一线治疗的三臂随机对照研究,包含T-DXd单药、T-DXd联合帕妥珠单抗以及THP对照组。任何一个试验组与对照组相比达到统计学显著性,均可宣布研究成功;两个试验组之间没有预设的直接比较,因此不应对T-DXd单药与联合方案进行头对头比较。

DB-09研究T-DXd联合组已达到主要终点,T-DXd联合帕妥珠单抗组对比THP组的PFS显著优于THP组(BICR评估:40.7 vs 26.9个月,HR 0.56,P<0.00001)[4]基于此,该联合方案的相关晚期一线治疗适应症已经于2025年12月获得美国FDA批准[5]

期中分析是DB-09研究设计中的关键环节,主要分为两类。第一类是无效性期中分析,其目的是基于期中数据判断试验是否可能失败,从而提前终止研究,减少受试者不必要的暴露。终止标准通常基于HR或P值以及安全性因素,且需要事先在方案中规定。DB-09研究的第一次期中分析即为无效性分析,计划在研究进行24个月、累计事件数228例时进行。第二类是有效性期中分析,其目的是基于期中数据提前宣布研究成功,加速药物上市。在这种分析中,传统的P=0.05标准不再适用,需基于α消耗函数确定界值。具体到DB-09研究,T-DXd单药组在PFS信息量达到70%时进行一次有效性期中分析,采用Haybittle-Peto停止界值,消耗双侧α为0.000430,最终PFS分析时累计双侧α为2%。T-DXd联合帕妥珠单抗组在相同信息量比例下进行有效性期中分析,同样消耗双侧α为0.000430,最终PFS分析时累计双侧α为3%。这种严格的α消耗策略,确保了期中分析的统计学严谨性,避免因多次检验而膨胀I类错误。

目前,T-DXd联合组已通过无效性期中分析和第一次有效性期中分析,并获得积极结果。T-DXd单药组目前仍在继续随访,表明其已通过第一次无效性测试,相对于对照组有效,期待具体的有效性分析结果公布。

DB-09研究

最佳缓解持续时间和临床结局

总生存期(OS)仍被大多数临床医生认为是检验临床获益的“金标准”。在DB-09研究中,OS作为关键次要终点,当T-DXd单药组和联合组PFS的ITT检验均被拒绝后,才能将全部5%的α传递给后续的OS检验。目前,T-DXd联合帕妥珠单抗组的OS尚未成熟,已显示出PFS2获益(NC vs 36.5个月,HR 0.60,95%CI:0.45-0.79,P=0.00038)[6]

既往报道的DB-01/02/03研究汇总分析[7]显示,达到CR患者的预后大幅优于仅达到部分缓解(PR)或未达到缓解的患者,其2年PFS率达77.8%,3年OS率达88.6%,均较PR患者提高30%以上,表明肿瘤深度缓解可能是生存获益的潜在预测指标。

2026年ASCO大会报道了DB-09研究的一项探索性分析[8],研究人员根据 RECIST V1.1将肿瘤缓解分为四类:完全缓解(CR)、深度 PR(靶病灶总径缩小≥80% 至<100%)、非深度PR(靶病灶总径缩小≥30% 至<80%)、疾病稳定/进展(SD/PD),以分析不同缓解深度与患者预后的相关性。

研究结果显示T-DXd+P组有超过一半(~53%)的患者达到CR或深度PR,其中15.4%达到CR,33.7%达到PR(<80%)、37.4%达到深度PR。

在生存结局方面,CR与深度PR患者的2年PFS率获益相当(分别为 85.1%、80.0%),均显著优于非深度PR(64.3%)及SD/PD(35.5%)患者;其中深度PR患者较非深度PR患者的2年PFS率提升15.7%。

达到CR和深度PR的患者显示了更长的治疗时间和持续缓解。CR、深度PR、PR(<80%)、SD/PD患者的中位治疗时间为28.0、25.4、20.6和4.4个月。24个月时CR、深度PR、PR(<80%)患者仍维持最佳缓解状态的比例分别为85.0%、78.9%、60.4%。

此外,从达到最佳缓解的时间数据可以看出,T-DXd+P组CR /深度PR患者的中位达最佳缓解时间(8.4/9.6 个月)显著长于非深度PR患者(<80%)(1.5 个月),提示实现深度缓解是一个需要足够治疗时间、逐步加深的过程。随着随访时间的进一步延长,DB-09 研究中患者的缓解深度仍有提升空间,未来CR率有望进一步提高。

对照组(THP)其 CR、深度 PR、PR(<80%)、SD/PD 患者的2年PFS率分别为 75.6%、60.7%、48.5% 和 31.7%。值得注意的是,与T-DXd+P组不同的是,无论是 CR 患者还是深度PR患者,THP组的生存获益均显著低于T-DXd+P组:THP组 CR患者的2年PFS 率(75.6%)低于T-DXd+P组CR患者(85.1%),THP组深度PR患者的2年PFS率(60.7%)同样低于T-DXd+P组深度PR患者(80.0%);这提示我们即便在深度部分缓解的这部分人群中,不同治疗方案为患者带来的缓解深度可能还有不同,T-DXd+P带来的深度缓解可能更接近于CR,而THP组带来的可能更接近于80%缩瘤的下限。

在安全性方面,尽管总体上不同缓解者亚组中,药物相关的≥3级不良事件的暴露调整发生率(EAIRs)相似,但CR和深度PR患者也显示了更好的治疗安全性和耐受性,≥3级EAIR仅为0.30和0.28,低于SD/PD患者的0.57;导致治疗终止的不良事件EAIR则分别为0.14、0.10和0.16事件/患者年。此外,CR、深度PR、PR患者均未发生≥3级间质性肺病/非感染性肺炎(ILD/p),SD/PD患者≥3级ILD/p EAIRs发生率为4.1%(2例)。

综合当前报道数据来看,DB-09研究T-DXd联合组不仅展现了良好的PFS2结果,而且显示了非常高的肿瘤缓解疗效,且达到CR与深度PR的患者,PFS 结局显著更优,并且表现了更好的治疗安全性和耐受性。这些结果均预示该治疗方案有望取得积极的OS获益结果。

DB-11研究

主要终点pCR率的“充分考量”

DB-11研究是一项针对HER2阳性早期乳腺癌新辅助治疗的随机对照研究,旨在探讨8周期T-DXd或ddAC→T-DXd对比ddAC→THP用于HER2阳性高危乳腺癌患者新辅助治疗的疗效和安全性。去年ESMO大会报道ddAC→T-DXd组达到了主要终点——其病理完全缓解(pCR)率显著高于ddAC→THP组(67.3% vs 56.3%,△11.2%,P=0.003),尤其HR+亚组的绝对获益达到了16.1%(83.1% vs 67.1%)[1]。基于此,该方案已经获中国NMPA、美国FDA批准相关适应症[2-3]

DB-11研究的主要终点选择了pCR,且阳性结果快速得到药监部门认可,其背后有着充分的统计学与临床考量。

首先,pCR与患者的预后密切相关,大量研究表明,达到pCR的HER2阳性早期乳腺癌患者,其长期生存显著优于未达到pCR者。

其次,监管先例已经存在——作为标准治疗的HER2双靶向联合化疗的新辅助方案正是基于pCR结果获得批准,后续并无确证性III期研究证实其EFS或OS获益,NeoSphere研究即为一个典型案例,该研究以pCR为主要终点,成功支持了THP方案的首次获批。

第三,从可行性来看,若以EFS为主要终点,所需样本量将大幅增加,研究周期显著延长,可能延缓有效药物惠及患者的时间。

在主要终点pCR的α控制策略上,DB-11研究采用了精细化的分配方案。单药组分配α为0.02,联合组分配α为0.03,且α可在两组之间互相传递。但由于单药组提前终止,其分得的α并未重新分配给联合组,联合组仍维持0.03的α水平。这一设计体现了对更高风险、更高预期获益方案的“倾斜”,同时也保证了整体I类错误率控制在0.05以内。

在解读pCR亚组分析结果时,一个常见的误区需要引起警惕:认为某个亚组的95%置信区间上限超过1或pCR差值下限小于0,就代表该亚组“无效”。这是典型的统计功效不足所导致的误解。置信区间的宽度不仅取决于疗效大小,更取决于该亚组的人数和事件数。当某个亚组人数很少时,即使疗效非常突出,其置信区间上限仍可能跨越1。正确的做法是:首先关注HR是否小于1,而非是否达到统计学显著性;其次,需要通过交互检验来判断不同亚组间疗效是否存在差异。在DB-11研究中,各亚组的pCR获益趋势一致,尚未发现显著的交互作用,这意味着T-DXd的疗效在不同亚组间具有较好的一致性。

EFS是该研究的次要终点。值得注意的是,该研究的样本量从最初的624例增加至900例,其目的是为了提升EFS估计的精度(缩窄置信区间),从而更可靠地评估其获益趋势(即提高观察到HR点估计<1的概率)。

结语

理解研究设计的统计学逻辑,是正确解读临床证据的基础;谨慎对待亚组分析和探索性分析,避免因P值的显著性而得出误导性结论;关注暴露校正后的安全性数据,更科学地评估药物的风险-获益比;重视期中分析的α消耗策略,理解“早期成功”背后的统计学严谨性。从DB-09到DB-11,DESTINY-Breast系列研究以其严谨的统计学设计和突破性的研究成果,不断推动着HER2阳性乳腺癌治疗格局的变革。T-DXd已成为HER2阳性乳腺癌治疗的重要武器,而科学的统计学思维,将帮助我们在海量数据中看清真相,为患者做出更精准的临床决策。

参考文献

[1]Harbeck N, et al. Neoadjuvant trastuzumab deruxtecan alone or followed by paclitaxel, trastuzumab, and pertuzumab for high-risk HER2-positive early breast cancer (DESTINY-Breast11): a randomised, open-label, multicentre, phase III trial. Ann Oncol. 2026;37(2):166-179.

[2]优赫得®序贯THP用于HER2阳性乳腺癌新适应症在华获批.第一三共公众号.https://mp.weixin.qq.com/s/AX6MLEDgYwqmTKWRXUb_1A

[3]注射用德曲妥珠单抗在美国获批两项HER2阳性早期乳腺癌新适应症.第一三共公众号.https://mp.weixin.qq.com/s/KfInZvPd3IPKXeZAUTEMnA

[4]Tolaney SM, Jiang Z, Zhang Q, et al. Trastuzumab Deruxtecan plus Pertuzumab for HER2-Positive Metastatic Breast Cancer. N Engl J Med. 2026;394(6):551-562. doi:10.1056/NEJMoa2508668

[5]注射用德曲妥珠单抗联合帕妥珠单抗在美国获FDA批准.第一三共公众号.https://mp.weixin.qq.com/s/miydmqL2p7fyjRAAwBirYQ

[6]Sara M, et al. Trastuzumab deruxtecan (T-DXd) + pertuzumab (P) vs taxane + trastuzumab + pertuzumab (THP) for first-line (1L) treatment of patients (pts) with human epidermal growth factor receptor 2–positive (HER2+) advanced/metastatic breast cancer (a/mBC): Interim results from DESTINY-Breast09. 2025 ASCO LBA1008.

[7] Saura C, Cortés J, Modi S, et al. Pooled analysis by best confirmed response to trastuzumab deruxtecan and related biomarkers in patients with HER2-positive metastatic breast cancer from DESTINY-Breast01, DESTINY-Breast02, and DESTINY-Breast03. Ann Oncol. Published online November 17, 2025. doi:10.1016/j.annonc.2025.11.007

[8]Yeon Hee Park, et al. A DESTINY-Breast09 analysis of treatment duration and clinical outcomes by best response to trastuzumab deruxtecan (T-DXd) + pertuzumab (P). ASCO 2026;Abstract 1021

梁斐 教授

复旦附属中山医院生物统计室统计师

中国初级卫生保健基金会肿瘤临床转化委员会常委

中国老年保健协会肿瘤防治和临床研究委员会常委

中国医师协会外科分会临床研究工作组委员

中国医药教育协会肿瘤药物临床研究评价委员会委员

CSCO青年委员会统计小组成员

上海抗癌协会癌症预防与筛查委员会委员

以第一作者(含共一)或通讯作者在NEJM、Lancet Oncology、JCO、Annals of Oncology、JNCI、 European Journal of Cancer 等杂志发表SCI论著20篇,累计影响因子超过200

Nature Medicine、JNCI、 Clinical Cancer Research杂志统计学审稿人

作为统计师设计/分析的临床研究发表于NEJM、Lancet、JAMA、BMJ、Nature Medicine、Lancet Oncology 、 Lancet Gastroenterology & Hepatology 、Annals of Oncology、 JCO 、 Annals of Surgery等杂志

主要研究方向:临床试验设计及统计,临床研究方法学

评论

评论功能即将开放,敬请期待。