乳腺癌筛查

乳腺癌筛查

发布于2018-02-12 2986

乳腺癌筛查

概述

乳腺X线检查是最常用的乳腺癌筛查手段,研究显示,乳腺X线检查降低了50-69岁女性乳腺癌的死亡率,但是该方法也存在弊端,如发现没有临床意义的对生命没有危害的乳腺癌(过度诊断)。40-49岁女性通过乳腺X线检查获益情况尚不明确。目前没有研究单独分析临床乳腺检查(CBE)的影响,但有研究发现乳房自检不影响乳腺癌的死亡率。已开展对超声、磁共振及乳腺癌分子成像技术筛查效果的研究,以上技术一般用作乳腺X线的辅助手段,不是普通人群首选的筛查方式。

乳腺X线筛查

获益

50年前开始的随机对照试验显示乳腺X线筛查改善了60-69岁(证据可靠)和50-59岁(证据充分)女性乳腺癌的生存率。另有近期开展的基于人群的研究对参与筛查的人群长期获益情况提出质疑。

效应大小:对多项临床试验进行meta分析,发现要减少1例乳腺癌死亡病例,需要进行乳腺癌筛查的女性人数因年龄而异,1,904位39-49岁女性(95%CI, 929-6,378),1,339位50-59岁女性(95%CI, 322-7,455),377位60-69岁女性(95%CI, 230-1,050)。

实验设计:基于人群的随机对照试验;

内部效度:不一致,但随机对照试验的荟萃分析效度较好;

一致性:较差;

外部效度:不确定;

随机对照试验meta分析未有效证明乳腺X线筛查可以有效降低死亡率,因为临床试验是在几十年前进行的,数十年内医学影像学和乳腺癌治疗方法都有改善。对加拿大国家乳腺筛查研究(CNBSS)随访25年,2014年随访结束,发现乳腺X线筛查并未改善生存率。

害处

根据可靠证据,乳腺X线筛查的害处包括:

·过度诊断及过度治疗。筛查发现的癌症有些可能是致命的,但有些没有危害,没有明确的方法区分是否有危害。因此,一旦发现癌症,医生都会建议进行标准治疗,如手术、放疗、内分泌治疗、化疗以及HER2靶向治疗,虽然并非所有患者都会因治疗获益。

效应大小:筛查发现的乳腺癌中20%-50%属于过度诊断,不同年龄、预期寿命和肿瘤类型(导管原位癌和/或浸润癌)过度诊断概率不同。以上概率基于两种不完善的分析方法得出:

长期随访筛查临床试验。

大型筛查项目高出的发病率。

研究设计:基于人群的描述性对比研究,尸体解剖系列报道、乳腺缩小术样本系列报道。

·假阳性与过度检查和焦虑

效应大小:筛查后平均10%的女性需要进一步检查,其中仅有0.5%可能确诊乳腺癌,即9.5%女性检查结果为假阳性。在美国,连续十年每年参加筛检的女性中,约50%的人都曾出现假阳性结果,其中有7%~17%会进一步接受活检。如果有之前的乳腺X线检查结果作为对照,那么过度检查的可能性会降低。

研究设计:基于人群的描述性研究。

·假阴性与虚假的安全感以及潜在的诊断延迟

效应大小:6%-46%筛查女性可能存在浸润性乳腺癌,但乳腺X线检查未检测到(假阴性)。粘液性癌和小叶性癌出现假阴性可能性较大,以及两次筛查间期出现的生长迅速的肿瘤和乳房较为致密的女性,尤其是年轻女性

研究设计:基于人群的描述性研究。

·放射引发的乳腺癌

放射引起乳腺癌所需剂量高于单次乳腺X线检查。一般典型的双投照体位不太可能引发癌症。

效应大小:理论上,1000位每年都接受乳腺X线筛检的40~80岁的女性中最多有一位因照射出现癌症。

研究设计:基于人群的描述性研究。

上述证实乳腺X线筛检潜在坏处的研究具有良好的内部效度、外部效度以及一致性。

临床乳腺检查

获益

加拿大国家乳腺筛查研究(NBSS)未比较临床乳腺检查和不筛查的有效性。现有临床试验对临床乳腺检查的有效性进行研究,两项在印度开展,一项在埃及开展,但是尚未报告死亡率情况。因此,无法评估临床乳腺检查筛查的效果。

效应大小:现有证据不足以评估临床乳腺检查额外的获益和害处。单一随机对照试验对比高质量CBE与乳腺X线证实两种方式的益处相当。在社区开展的CBE得出的准确性可能比随机对照临床试验低。

实验设计:单一随机对照临床试验,人群队列研究。

内部效度:良好。

一致性和外部效度:较差。

害处

CBE筛查可能有以下弊端:

·假阳性与过度检查及焦虑。

效应大小:在50~59岁女性中,CBE的特异性为88%~99%,假阳性率为1%~12%

研究设计:基于人群的描述性研究。

内部效度、外部效度、一致性:良好。

·假阴性导致的虚假安全感和癌症诊断延迟

效应大小:17%~43%女性乳腺癌患者CBE检查结果为阴性。由熟练的技术人员进行,检查时间较长、质量较好,CBE的敏感性较高。

研究设计:基于人群的描述性研究。

内部效度和外部效度:良好。

一致性:一般。

乳房自检

获益

研究发现,与常规医护(无筛查)相比,乳房自检(BSE)不能降低乳腺癌死亡率。

效应大小:无。

研究设计:两项随机对照试验。

内部效度和一致性:一般。

外部效度:较差。


害处:

基于可靠证据,鼓励和指导女性进行BSE(乳房自检)之后,进行乳房活检的人数增多,更多乳房良性疾病得到确诊。

对健康结局的效应大小:试验人群中1.8%进行了活检,对照组为1%。

研究设计:两项随机对照试验,队列研究。

内部效度:良好。

一致性:一般。

外部效度:较差。


背景

乳腺癌发病率和死亡率

乳腺癌是除皮肤癌以外美国女性中最常见的癌症。预计2017年美国共有原位乳腺癌63,410例,新发浸润性乳腺癌252,710例,预计死亡40,610例。存在遗传风险的女性,尤其是BRCA1和BRCA2基因携带者,仅占全部乳腺癌病例的10%。男性占乳腺癌和乳腺癌死亡病例的1%。

乳腺癌最大的患病风险是女性,其次是年长。其他风险因素有激素状况(如,初潮早,绝经晚,无生育史,首次妊娠较晚及绝经后内分泌治疗),酗酒及电离辐射暴露。

白人女性乳腺癌发病率比黑人女性高,且各期生存率低。可能与筛查习惯和医疗条件有关。西班牙和亚太平洋岛民发病率和死亡率比白人和黑人都低。

乳腺癌的发病率与生育状况相关(如,初次妊娠年龄,是否妊娠多次及是否母乳喂养)、筛查参与度和绝经后是否使用内分泌治疗。美国和英国广泛应用乳腺X线筛查后乳腺癌的发病率剧增(特别是导管原位癌[DCIS])。绝经后使用内分泌治疗也与乳腺癌发病率有关,内分泌治疗应用减少后,发病率有所降低。

所有人群中,乳腺癌筛查并未降低晚期乳腺癌的发病率。

·乳房症状的评估

出现乳房症状的女性需要诊断性检查,只有无症状的女性才进行筛查。对十年内需要进行医学护理的乳房症状进行研,10.7%出现乳房肿块的患者确诊为乳腺癌,因疼痛就医的患者仅1.8%为乳腺癌。

乳腺组织的病理评估

浸润性乳腺癌

对活检取得的乳腺组织细胞进行镜下观察可以确诊乳腺癌。应在影像学提示异常或可扪及的部位取样。乳房活检有多种形式,细针抽吸活检、粗针活检、或切除活检。在影像学引导下进行活检可以提高准确率。针吸活检抽取的异常区域足够大才能用于诊断。切除活检的目的是切除整个异常区域。

导管原位癌

导管原位癌(DCIS)是一种非浸润性癌症,可以发展为浸润性乳腺癌,发生率和病程不一。有学者认为导管原位癌属于浸润性乳腺癌,但有人认为,导管原位癌应该称导管上皮内瘤变,定义类似宫颈或前列腺癌前病变,需要慎重考虑将导管原位癌这一分类除去。

导管原位癌通常由乳腺X线检查确诊。1983年美国仅有4,900位女性确诊导管原位癌,由于乳腺X线检查得以普及,预计2017年有63,410位女性导管原位癌患者。加拿大国家乳腺筛查研究2对50~59岁女性开展的试验发现,与仅采用CBE检查的女性相比,临床乳腺检查(CBE)加乳腺X线检查检出乳腺癌的发生率是CBE的四倍,乳腺癌死亡率无差别。(参见PDQ乳腺癌的治疗部分了解更多信息)

人们对导管原位癌的自然史了解很少,因为几乎所有导管原位癌都是筛查发现的,而且几乎全部接受了治疗。确诊导管原位癌后,乳腺癌的发展取决于病灶的病理特点与采取的治疗。一项随机试验发现,通过乳腺肿瘤切除术治疗后90个月内13.4%出现了同侧浸润性乳腺癌,同时接受了乳腺肿物切除和放疗的女性中3.9%出现了同侧浸润性乳腺癌。确诊为导管原位癌且进行治疗的女性中,死于乳腺癌的比例不高于同年龄段人群的死亡率。这一结果可以反映导管原位癌的性质、治疗的益处或志愿者效应(即参与筛查的女性总体比未参加筛查的女性健康状况更好)。

非典型增生

非典型增生是乳腺癌的一个风险因素,4%-10%活检结果存在非典型增生。

病理学家对乳腺活检样本解读的差异

病理学家对乳腺组织的诊断结果可能为良性无非典型增生、非典型增生、导管原位癌或浸润性乳腺癌。过去三十年间,由于乳腺X线筛查的普及,非典型增生和导管原位癌的发病率均有所提高,尽管乳腺X线对非典型增生通常不敏感。乳腺病变误诊可能引起过度治疗或治疗不足——非典型增生和导管原位癌误诊率最高。

B-Path是针对这一课题开展的规模最大的调查,纳入了115位执业病理学家,对乳腺活检切片进行判断,将他们的判断结果与经过专家讨论得出的诊断结果进行对比。单个病理学家与专家在浸润性乳腺癌的判断方面达成一致的最多,导管原位癌和非典型增生差异非常大。由于B-Path调查中使用了大量非典型增生和导管原位癌的样本,比临床实践中遇到的要多,因此研究人员应用贝叶斯定理利用调查结果评估诊断差异如何影响准确率,以进行乳腺活检的50~59岁的女性为例.以美国的人口标准,预计与病理学家专家得出一致结果的概率为92.3%(CI,91.4%-93.1%),预计最初活检结果被过度解读的概率为4.6%(CI, 3.9%-5.3%),解读不充分的概率为3.2%(CI, 2.7%-3.6%)。表1列出了预计每100例乳腺活检的结果,与专家小组给出的诊断结果的总一致率和不同疾病类型诊断的一致率。

表1:预计每100例乳腺活检的结果,与专家小组给出的诊断结果的总一致率和不同疾病类型诊断的一致率。来源:《病理学家对乳房活检解读的差异性:一项基于人群的研究》,Elmore JG, Nelson HD, Pepe MS, Longton GM, Tosteson AN, Geller B, Onega T, Carney PA, Jackson SL, Allison KH, Weaver DL,《内科学年鉴》第164卷第10期,649-655页。版权归2016年美国临床医师学会所有。

   由于不同医生对乳腺组织的诊断不一致性很高,越来越多的病理诊断要求第二诊疗意见。对国内参与B-Path的252名乳腺病理医师展开调查,65%受访者表示有规定要求对所有初次诊断为浸润性乳腺癌的病例寻求第二诊疗意见,56%受访者表示对初次诊断为原位导管癌的病例需要第二诊疗意见,36%受访者表示有规定明确指出初次诊断为非典型增生的病例必须寻找第二诊疗意见。该调查发现大多数病理学家认同第二诊疗意见改善了诊断准确率(96%)。

一项模拟研究使用B-Path的数据评估了12种获取第二诊疗意见的策略,改善乳腺组织病理的解读一致性。其中一项策略是仅对诊断为浸润性乳腺癌的病例寻求第二诊疗意见,除这项策略外,其余策略都提高了诊断准确率。无论病理学家对自己的诊断是否有信心,或是否有足够的经验,准确率都得到了提高。第二诊疗意见虽然提高了准确率,但并没有完全消除诊断的不一致现象,尤其是对较难诊断的非典型增生病例。

特殊人群

风险较高的女性获益较多

BRCA1和BRCA2基因突变的女性

存在BRCA1或BRCA2基因突变的女性乳腺癌风险较高,因筛查获益可能更大(参考乳腺癌和妇科肿瘤的遗传学部分了解更多信息。)

进行胸部放射治疗的人群

进行斗篷式放疗的霍奇金淋巴瘤和非霍奇金淋巴瘤女性患者患乳腺癌的风险较高,从放疗结束10年开始持续终身。因此,这部分人群也应该参与乳腺癌筛查,尽管她们的年龄可能相对较小。

筛检无获益的人群

预期寿命较短的女性

筛查潜在的益处一般在筛查多年以后才表现出来,但是,筛查的弊端通常在筛查之后即出现。因此,预期寿命较短且伴合并症的女性接受筛查可能并无益处。然而,这个人群中很多女性都会参与筛查。一项研究发现,大约9%癌症晚期女性都进行了筛查。

老年女性

大约1%老年女性通过筛查确诊乳腺癌,但很多是低风险癌症。老年女性确诊乳腺癌及因局部肿瘤接受治疗是否有益尚不确定。

年轻女性

尚无证据表明筛检对患病风险一般的40岁以下年轻女性有益。

男性

男性乳腺癌仅占所有乳腺癌的1%左右。大部分是在对可扪及的病变进行评估时确诊,相对而言比较容易发现。治疗的方法包括手术、放疗、系统性激素辅助治疗以及化疗。筛查对男性不大可能有益。


乳腺X线检查

描述和背景

乳腺X线检查使用电离辐射形成乳房组织的影像。检查时须将两乳紧紧压在两片检测板之间,挤压可以减少组织重叠,降低成像所需的放射量。在美国乳腺癌常规筛查中,检查时一般取内外斜位和头尾位。两种体位均应包括从乳头到胸肌的所有乳房组织。标准的双视角乳腺X线筛查的辐射量在4~24毫西弗之间。双视角拍摄的重拍率比单视角拍摄要低,因为前者能够避免拍摄时正常乳房组织重叠而引起的误差。经过双视角乳腺X线检查与采用单一体位检查的患者相比,发生间隔期乳腺癌的比例也较低。

根据(美国)国会1992年制定的《乳腺X线检查质量标准法案(MQSA)》,所有进行乳腺X线检查的机构均需要经过FDA认证,保证操作人员接受过正规培训,且使用放射剂量较小的标准技术进行检查。(参考FDA网站《乳腺X线检查质量标准法案(MQSA)》中规定的乳腺X线摄影调查、设备评估和操作医生资质要求)1988年MQSA再授权法案要求检查医生用平实的语言出具一份手写检查结果总结给患者。

乳房影像报告数据系统(BI-RADS)分类可反映乳房X线检查结果:

0:不完整——需要进一步影像学检查和/或与之前的乳腺X线检查结果对比

1:阴性,1年内出现可以确诊的癌症的风险为1%

2:良性,1年内出现可以确诊的癌症的风险为1%

3:可能为良性,1年内出现可以确诊的癌症的风险为2%

4:可疑,1年内出现可以确诊的癌症的风险为2%-95%

4a: 2%-10%

4b: 10%-50%

4c: 50%-95%

5:高度怀疑恶性,1年内出现可以确诊的癌症的风险为95%

6:经活检证实为恶性

多数乳腺X线筛查结果为阴性或良性(分别对应BI-RADS1/2),美国大约10%接受筛检的女性需要接受额外检查。需要进行额外检查的比例不仅与每位女性自身差异有关,也与检查设备和检查医生有关。

数字乳腺X线和计算机辅助探测(CAD)

数字乳腺X线比屏片式乳腺X线(SFM)更加昂贵,但更容易实现存储和共享。一些临床试验比较了SFM和数字乳腺X线在乳腺癌检出率、敏感性、特异性和阳性预测值(PPV)方面的表现,发现二者无明显差别。

乳腺X线成像筛查试验(DMIST)比较了42,760名在美国33个筛查中心参与筛查的女性的数字乳腺X线检查和SFM结果。尽管数字乳腺X线检查在50岁以下女性中肿瘤检出率更高(数字乳腺X线检查的曲线下面积为0.84±0.03;SFM的曲线下面积为0.69±0.05;P=0.002),乳腺癌总检出率无差别。DMIST另一项报告发现65岁以上女性采用SMF的曲线下面积大于数字乳腺X线检查。

美国一项大型队列研究也发现相比数字乳腺X线检查,SFM对50岁以下女性敏感性更高,两者特异性相近。

对2004-2010年内荷兰进行的150万数字乳腺X线摄影片和450万屏片式乳腺X线摄影片比较,发现数字乳腺X线检查后进一步检查的女性更多,乳腺癌检出率更高。对10项研究进行meta分析 ,包括DMIST(乳腺X线成像筛检试验)和上文提到的美国开展的队列研究,比较了82,573位接受了数字乳腺X线和SFM两种检查的女性。一个随机效应模型中,这两种检查方法的癌症检出率无显著差异(SFM的AUC为0.92;数字乳腺X线AUC为0.91)。对50岁以下女性而言,所有研究均发现数字乳腺X线检查的敏感性较高,但特异性与SFM检查持平或高于后者。

计算机辅助探测(CAD)系统可以凸显簇状微钙化灶或肿块等可疑区域 ,提高敏感性,降低特异性,同时提高导管原位癌(DCIS)的检出率。目前有多个CAD系统已经投入使用。一项基于人群的大型研究对比了引进CAD前后的召回重检率和检出率,发现均无差异。另一项大型研究发现CAD提高了召回重检率以及DCIS检出率,但未提高浸润性乳腺癌检出率。一项研究使用了大型数据库,纳入接受数字(而非屏片式)乳腺X线检查的40~89岁女性,发现CAD未提高乳腺X线敏感性、特异性、间隔期癌症检出率,但未提高DCIS的检出率。

使用与医疗保险相关的监控、流行病学和最终结局数据,对2001~2002和2008~2009两个时间段内超过27万65岁及65岁以上女性使用新筛查模式进行评估。使用数字乳腺X线检查的比例从2%增长到了30%,使用CAD技术的从3%增长到了33%,检查费用从6.6亿美元增加到9.62亿美元。2008年76%CAD筛查由医疗保险覆盖,这一比例是2004年的两倍。两种检查方法在早期癌症(DCIS或I期癌症)或晚期癌症(IV期癌症)的检出率方面无统计学差异。

数字化体层融合

数字化体层融合或称三维乳腺成像,在操作上与标准二维乳腺成像类似。挤压乳房,利用X线成像。此技术需要在不同角度利用短射线对乳腺进行照射。这种方法对某些肿瘤检出率比乳腺X线检查或超声更高。放射剂量是二维乳腺X线检查的两倍。

仅少数试验评估了数字化体层融合技术,一些专业人士认为该技术处于研究阶段,没有经过广泛验证。

乳腺影像检查检出的癌症特征

无论疾病分期、淋巴结状态和肿瘤大小,筛查发现的乳腺癌预后优于其他方式发现的癌症。表明筛查发现的癌症生物学特点较温和(生长较慢、较少出现局部浸润或转移),有助于预测患者预后及制定治疗方案。

对1,983名芬兰浸润性乳腺癌患者进行10年随访,发现癌症检测方式是影响预后的一个独立因素。当年龄、淋巴结状态以及肿瘤大小相似时,筛查发现的癌症比其他方式发现的癌症复发率低,总生存率更高。通过筛查以外的方式发现乳腺癌的女性死亡危险比为1.90(95%CI, 1.15-3.11),尽管这些女性更可能接受全身辅助治疗。

此外,另一项研究对比了三项随机筛检试验发现的乳腺癌病例(健康保健计划,加拿大国家乳腺筛查研究1和2),结果显示,在考虑了分期、淋巴结状况以及肿瘤大小因素后,筛查发现的癌症患者预后较好。筛查发现的癌症患者间隔期癌症和新发癌症的死亡相对风险比为1.36(95%CI, 1.10~1.68),而通过其他方式发现的癌症患者这一数据为1.53(95%    CI, 1.17~2.00)。

还有一项研究对比了1998-2003年期间5,604名筛查发现癌症的女性与因症状确诊的癌症女性。研究者发现在肿瘤大小、淋巴结状态、分期以及年龄接近的情况下,前者比后者状况更好。因症状确诊的女性生存的风险比(HR)为0.79(95%CI, 0.63~0.99)。

上述研究结果证明筛查确定的癌症有些为低风险癌症,即存在过度诊断现象。

乳腺癌筛查偏倚-概念

许多非对照临床试验以及回顾性研究表明乳腺X线检查可以诊断早期较小乳腺癌,这类癌症有着较好的病程。虽然经筛查发现的乳腺癌患者生存时间与其他方式发现的患者相差不多,但是经筛查发现的乳腺癌患者生存率更高。这一现象可以通过以下四种偏倚来解释:

1. 领先时间偏倚:与出现症状后确诊的乳腺癌相比,筛查发现的乳腺癌只是将确诊时间提前了。早期发现与治疗并不会改变疾病的自然病程。筛查发现的乳腺癌从确诊之日起患者的5年生存率较高,但是筛查发现的乳腺癌与因症状确诊的乳腺癌患者生存时间无明显差异。

2. 病程长短偏倚:乳腺X线检查可以发现生长缓慢的肿瘤,这类肿瘤预后优于临床发现的肿瘤(医生或患者本人发现异常)。与致命的肿瘤(早期治疗不能改善结局)相比,这类肿瘤5年生存率较高,但是,两种肿瘤的死亡率相差不大。

3. 过度诊断偏倚:筛查可能发现一生都不会产生症状或导致死亡的癌症,因此筛查人群生存率较高,但生存时间与非筛查确诊的人群无差异。

4. 健康志愿者偏倚:参与筛查的可能是人群中最健康或最具健康意识的女性。因此,无论是否得益于早期诊断,她们的结局比非健康或健康意识不足的女性更好。

上述偏倚的影响程度尚未知。要确定过度诊断、领先时间、病程长短和健康志愿者偏倚对生存率的影响,需要一项以病因特异性死亡率为终点的新随机对照试验。这很难实现,因为将患者随机分为筛查组和非筛查组有违伦理,而且该临床试验需要至少随访30年,30年内治疗方法和影像学技术的进步会影响试验结果的有效性。因此,必须利用现有的临床试验,忽略其限制,对足够的对照组和混杂因素进行调整,运用生态学研究或队列研究的方法进行分析。(参考癌症的筛查部分了解更多信息。)

效果及精确性评估

美国乳腺X线筛查的判断标准公布在乳腺癌监控联盟(BCSC)网站。(参考癌症的筛查部分了解更多信息。)

敏感性

乳腺X线检查的敏感性是指在特定人群中检测出乳腺癌的比例。敏感性与肿瘤大小、肿瘤是否显著、对激素的敏感性、乳房组织致密性、患者年龄、月经周期、影像检查的总体质量以及放射医师的阅片水平有关。乳腺X线检查总体敏感性约为79%,但对年轻女性和乳房组织致密的女性敏感性较低(见BCSC网站)。敏感性不代表筛查获益,因为一些乳腺癌女性可能为过度诊断。美国医师保险协会(PIAA)的数据显示,乳腺癌未及时诊断和误诊是医疗事故诉讼最常见的原因。2002~2011年期间乳腺癌医疗事故中的赔偿金额最多的首要诉讼原因是误诊,平均赔偿金额为444,557美元。

特异性和假阳性率

乳腺X线检查的特异性指的是非乳腺癌女性检查的阴性率。假阳性率是指非乳腺癌女性检查结果为阳性的概率。低特异性和高假阳性率会导致筛查人群进行本无必要的进一步检查。由于特异性针对的是所有非癌症女性,因此,即使假阳性率很低,实际人数也很多。因此,要判断一项筛查特异性好,其特异性必须非常高。即使达到95%,这项筛查的特异性也不高。


间隔期癌症

间隔期癌症是指在一次正常筛检和下次筛查期间发现的癌症。一项研究发现间隔期癌症多发生在50岁以下女性,尤其是伴有粘液性和小叶性组织学特点,分化程度高,增殖活跃,乳腺X线检查结果为良性病变,无钙化的女性。相反,筛查发现的肿瘤通常具有导管性组织学特点,较小,分期较早,激素受体阳性,主要是导管原位癌。总体而言,间隔期癌症生长迅速,确诊时多为晚期,预后不良。

新斯科舍乳腺癌筛查项目将筛查结果为假阴性的女性视为漏诊,发生率为不足1‰。试验结论为40-49岁女性间隔期癌症的发生率大约为1‰,50-59岁女性发生率为3‰。

还有一项试验发现40-49岁女性间隔期癌症发生率较高。在乳腺X线筛查显示阴性后12个月内确诊癌症的女性通常是因为乳房组织较致密,24个月内确诊癌症的女性通常是因为乳房组织致密或肿瘤生长迅速导致筛查敏感性降低。

与准确性相关的因素

患者因素

乳腺X线检查准确性取决于参与筛检女性年龄、乳房致密程度、是否为初次筛检以及与上次筛检间隔的时间。年轻女性乳腺X线筛查的敏感性较低,假阳性率较高。

对各年龄段的女性而言,乳腺组织致密可能使敏感性降低10%~29%。乳腺组织致密可遗传,可能为家族性的,也可能受年龄、内源性激素以及外源性激素激素、选择性雌激素受体调节剂(如他莫昔芬)以及饮食等因素影响。内分泌治疗可能引起乳腺组织致密,导致筛检敏感性降低以及间隔期癌症增多。

英国的“百万女性乳腺癌研究”项目显示,50~64岁女性的三个特征与乳腺X线筛检敏感性和特异性降低有关,分别是绝经后内分泌治疗、乳房手术史以及BMI低于25。此外,筛检间隔期较长可以提高敏感性、召回重检率以及癌症检出率,降低特异性。

已经提出多种策略来提高乳腺X线检查的敏感性,如改变饮食、根据月经周期安排乳腺X线检查时间、检查前中断激素治疗、或使用数字乳腺X线。与偏瘦和正常体重女性相比,虽然筛查敏感性相同,但肥胖女性乳腺X线检查出现假阳性的风险增加20%。

肿瘤因素

乳腺X线容易检测出乳腺粘液癌和乳腺小叶癌。生长迅速的肿瘤可能被当做正常乳腺组织或髓样癌;存在BRCA1或BRCA2基因突变的无痛性肿瘤可能漏诊。

医师因素

不同放射医师对影像的解读存在差异,影响放射科医师技术的因素包括他们的经验以及阅片量。敏感性与特异性之间存在一定的平衡;医生漏诊癌症的次数越多,健康女性得到假阳性结果的可能性越大。学术机构放射医师在X线检查后推荐活检的阳性预测值(PPV)比社区放射医师高。乳腺放射专科培训可以帮助医师提高癌症检测的水平。

不同机构影像检查结果也不一致。专门负责筛查,并且拥有专职乳腺放射医师的机构准确率较高,且单次读片,每年进行2次或更多次阅片结果审查。

医疗事故多发的机构假阳性率较高,收治弱势女性(少数民族或少数族裔女性,教育程度低,家庭收入低或居住在农村)的机构假阳性率也较高。这些人群发病率可能较高,而随访不到位。

国际对比

国际对比研究发现,拥有高度集中的筛检系统以及国家筛检质量控制项目的国家,乳腺癌筛检的特异性更高。

美国的召回重检率是英国的两倍,但两国癌症检出率不存在差异 。

普查、后续检查以及检查间隔期

普查(首次)检出癌症的可能性最大,不同年龄女性癌症检出率为9~26‰。后续检查检出率较低,为1~3‰。

两次筛查最佳间隔时间未知。聚焦乳腺癌死亡率的随机对照试验使用了单一筛查间隔,且不同研究之间区别较小。英国一项前瞻性试验将50~62岁的女性随机分为年度筛检组或者标准的三年一次的筛检组中;研究发现,虽然两组肿瘤分期以及淋巴结状态相似,但前者中发现了更多较小的肿瘤,且较后者有大约7个月的领先时间。

一项大型观察性研究发现,对于40多岁的女性而言,每两年进行一次筛检的女性比每年筛查一次的女性有更大风险在确诊时已经为晚期癌症(28%vs.21 %,OR, 1.35;95%CI, 1.01~1.81),但在50多岁和60多岁的女性两年筛查一次和每年筛查一次无差异。

芬兰一项研究安排14,765名40~49岁女性中生于偶数年者每年筛查一次,生于奇数年的每三年筛查一次。该研究死亡人数较少,难以发现两组死亡率的区别。每三年筛查一次的人群中死亡率为18/100,738质量校正寿命,每年筛查一次的人群中死亡率为18/88,780质量校正寿命(危险比=0.88,95%CI, 0.59~1.27)。

乳腺X线筛查对乳腺癌死亡率的影响

随机对照试验

1963年至2015年间,来自四个国家的大约50万女性参加了随机对照试验(RCT),旨在考察定期参加筛检女性的乳腺癌死亡率。加拿大的一项试验,“加拿大第二次国家乳腺筛查研究(NBSS)-2”,对比了乳腺X线检查结合临床乳房检查与单独临床乳房检查的异同。其他试验将单独乳腺X线检查、乳腺X线检查结合临床乳房检查以及无筛检的情况进行了对比研究。

不同临床试验在设计、受试者招募、干预措施(包括筛检和治疗)、对照组管理、受试者依从性以及结果分析等方面各有不同。一些试验采用个体随机抽样,而另一些则采用的是整群随机抽样,后者一般先分成队列,然后进行筛检试验。还有一项研究采用了非随机的方式,以出生日期(1-30日,月和年不作为参考)作为分组依据。整群随机抽样有时可能导致试验组与对照组之间不平衡;在一些试验中,两组之间的年龄被发现有差异,但差异不足以影响试验结果。在爱丁堡试验中,试验组和对照组的社会经济地位之间存在巨大差异,与乳腺癌死亡率有关,这让结果解释起来非常困难。

上述试验的主要结局评价指标是乳腺癌死亡率,因此明确死因至关重要。减少死亡归因偏倚的方法包括:盲法监测委员会(纽约试验采用)或与独立的数据库建立连接,如国家死亡率注册(瑞典的试验采用)。但是,上述方法不能保证筛查组和对照组的癌症死因分析不存在偏倚。一项涉及了乳腺癌死亡的错误分类的“两县试验”,分析了可能存在的有利于筛检的偏倚。

用于分析上述试验结果的方法也各有不同。五项瑞典研究中的四项在对照组中使用了单独乳腺X线检查,检查时间与试验组最后一次乳腺X线检查的时间相当。这些试验最初分析时采用“评估”分析法,也即仅计数最后一次X线检查时或之前发现的癌症女性的死亡。一些试验实验组最后一次X线检查的时间出现了延迟,导致对照组有更多的时间出现或诊断出癌症。另一些研究则采用随访的方式,不考虑确诊的时间,计算所有因乳腺癌死亡的病例。考虑到“评估”分析法存在的问题,对四项试验进行荟萃分析时应用了“随访”法。

能用于国际验证和审核的试验数据的可及性也因地而异,目前仅有加拿大在实施标准的国际数据审核。另一些研究审核的结果也各异,但大多严谨性不足。

上述试验目的均为研究乳腺癌死亡率,而不是总死亡率,因为相对于总死亡数而言,因乳腺癌而死的人数非常少。在回顾性地考虑人群总死亡率时,只有爱丁堡研究发现了显著了差异,这主要是受社会经济因素的影响。针对四项瑞典试验的荟萃分析(随访方法)也发现总死亡率有所下降。

筛查大约可使乳腺癌死亡率降低15%-20%,但是筛查对单个患者的益处低很多。乳腺癌筛查的潜在益处是早期乳腺癌检测可以延长许多患者的生命。

上述讨论的数据均来自一段时间内定期乳腺X线筛检,但事实是女性一生有20~30年在接受筛检。

利用50年进行的临床试验分析筛查对降低乳腺癌死亡率的影响可能存在以下问题:

1.乳腺X线检查技术的进步,能够发现微小的异常。

2.女性对乳腺癌的认识提高了,开始评估和治疗的年龄提前。

3.风险因素的变化(如初潮年龄,第一次怀孕年龄,肥胖,绝经后使用激素治疗)。

4.乳腺癌治疗方法的改变,病灶较大及分期较晚的肿瘤治愈率提高。

5.短期临床试验(5-10年)很难评估乳腺癌筛查的长远影响。

因此,除临床试验外还通过队列和生态研究评估筛查对降低乳腺癌死亡率的影响。

基于人群的筛查项目的有效性

虽然有关筛查的随机对照试验(RCTs)探讨了筛查的效果(即在理想的试验情况下筛检降低的死亡率),但这些RCTs并未涉及筛检的有效性(即在美国一般人群中筛检降低的死亡率)。探讨有效性的研究包括针对筛查人群和未筛查人群的非随机对照试验,基于社区的病例对照研究,以及探讨筛查对大规模人群影响的建模研究。上述所有研究中的关键在于它们是否能控制影响乳腺癌死亡率的其他因素,如治疗方法改进以及社区预防乳腺癌意识提升。

瑞典三项基于人群的观察性研究比较了接受和未接受乳腺癌筛查群体的死亡率。其中一项对瑞典25个县中的7个进行研究,比较了相邻时间内的死亡率数据,发现筛查可以显著降低死亡率18%~32%。这项研究最大的偏倚是筛查开始时各县乳腺癌辅助治疗水平有了大幅度提升,而研究者并未将其考虑在内。第二项研究比较了7个有筛查项目的县和5个没有筛查项目的县11年期间的乳腺癌死亡率。该研究结论也发现筛查可以降低死亡率,但研究人员同样未考虑乳腺癌辅助治疗水平的提升以及地理因素(农村或城市),这些因素都会影响诊疗,从而影响死亡率。

第三项研究逐县进行了详细的分析来解释治疗对死亡率的影响,发现筛检的作用非常有限,但该试验在设计和分析上存在一些下棋,因此,结论可信度不高。

荷兰奈梅亨市于1975年开始一项基于人群的筛查项目,一项基于此的病例队列研究发现,接受筛查的女性的乳腺癌死亡率下降了(OR,0.48)。但是,另一项将之与其临近的阿纳姆市(无筛查项目)进行比较的研究,并未发现死亡率有区别。

一项基于社区的病例对照研究考察了美国医疗系统从1983~1998年的乳腺癌筛查数据,并未发现筛查与乳腺癌死亡率降低之间有关系,但这一研究群体中乳腺X线筛查的比例普遍较低。

一项生态学研究对比了三对欧洲相邻国家的乳腺癌筛查和死亡率之间的关系,每对国家医疗系统和人口结构相似,其中一个国家的筛查项目较其他国家早几年。研究者发现,每个国家的乳腺癌死亡率均有所下降,筛查对互相比较的两个国家的乳腺癌死亡率没有影响。研究者指出,乳腺癌治疗水平提升以及医疗机构的改善或许比筛查更具有解释力。

对2011年3月发表的生态学和大型队列研究进行系统回顾,比较50~69岁于不同时间开始筛查的女性的乳腺癌死亡率。17个研究符合纳入标准,但每个研究的研究方法都有瑕疵,如对照组差异、没有充分考虑不同地区乳腺癌风险和治疗的差异,以及对各地区使用相似的乳腺癌死亡率计算方式。不同研究的结果差异很大,其中四项研究认为筛查使死亡率下降了33%或更多(置信区间较大),另五项未发现死亡率下降。由于死亡率下降可能有许多因素,筛查只是降低死亡率的一种因素,该综述指出乳腺癌死亡率最多因筛查降低了10%。

一项于1976~2008年在美国进行的生态学研究探讨了40岁及以上女性早期和晚期乳腺癌的发病率。为验证筛查的作用,研究人员对增长的早期癌症发生率和预计的晚期癌症降低的程度进行了比较分析。在此期间,早期癌症发病率的绝对增长量为122/100,000,而晚期癌症发病率绝对降低量为8/100,000。在校正了激素治疗和其他不确定因素的影响后,研究人员得出结论,(1)筛检对于降低乳腺癌死亡率的作用有限(大约28%),(2)在所有确诊乳腺癌的病例中22%~31%为过度诊断(3)乳腺癌死亡率下降的主要原因可能是治疗水平的提升,而非筛检。

一项研究采用了分析法粗略估计过度诊断的程度和筛查与治疗分别对降低乳腺癌死亡率的影响。采用监测、流行病学和最终结果(SEER)分析1975-2012年间美国40岁及40岁以上女性乳腺癌肿瘤位置分布的变化趋势,1975-2012年包含了应用乳腺X线检查之前和该检查技术得到广泛应用的阶段。假设有临床意义的乳腺癌患者比例在这一段时间内是稳定的。 结果发现较大的肿瘤(≥2cm)发生率降低,表明筛查有可能降低死亡率。但是也有研究认为,很可能由于治疗方法得以改善,较大的肿瘤发生率才相对降低,从而降低了乳腺癌的死亡率。特定大小的肿瘤患者死亡率的变化趋势表明乳腺癌死亡率的降低大约2/3是由于治疗方法的改进。


图2 乳腺X线筛查与浸润性乳腺癌发生率增加之间的关系。上图描述了1975-2012年间SEER项目开展的9个地区40岁及40岁以上女性中浸润性乳腺癌和转移性乳腺癌的总发生率。来源:Welch HG, Prorok PC, O'Malley AJ, Kramer BS,《乳腺癌肿瘤大小、过度诊断与乳腺X线筛查有效性》,《新英格兰医学期刊》第375卷,15期,1438-1447页。版权所有:2016麻省医学会。转载经2016麻省医学会同意。

一项基于社区筛查项目的前瞻性队列研究,分析对象为50-74岁女性和40-49岁乳腺组织不太致密的女性,发现相比每两年进行一次乳腺X线筛查,每年进行乳腺X线筛查未降低两组女性检出乳腺癌的比例。40-49岁乳腺组织致密的女性出现2cm以上肿瘤的发生率未降低(或每两年筛查一次:每年筛查一次,2.39;95%CI,1.37-4.18)


美国乳腺癌发病率与死亡率的统计建模

统计建模者探究了最佳的筛查间隔。虽然建模有时做出的假设并不正确,但当其产生的结果与随机对照试验大体一致或可用于内推或外推时,建模的可信度仍然较高。例如,如果一个模型得出的结果与年度筛检的随机对照实验结果一致,那么该模型在比较年度筛检与两年一次筛检的有效性时就有较高的可信度。

2000年,美国癌症研究所成立了建模者协会(癌症干预与监测建模,简称CISNET),用于研究筛检及辅助治疗对于乳腺癌死亡率降低的作用。这些模型得出的结果(死亡率降低)与RCTs预测的结果相似,但同时考虑了最新辅助治疗的影响。2009年,CISNET建模者研究了与乳腺X线检查害处和获益有关的若干问题,包括比较年度筛查与两年一次筛查的效果异同。对于50~74岁女性而言,年度筛查改为两年一次筛查后,就乳腺癌死亡率降低的比率而言,六个模型的估计值从72%到95%不一,平均为80%。

乳腺X线筛查的危害

虽然乳腺X线检查筛检可以降低某些人群的乳腺癌死亡率,但也能对参与筛检人群带来危害;主要包括假阳性(与检测的特异性相关)、过度诊断(真阳性,但不引起临床症状)、假阴性(与检测的敏感性相关)以及检查带来的不适、放射风险以及焦虑。

表1总结了预计筛查对10,000名女性连续10年每年进行乳腺X线筛查的女性可能带来的益处和危害。

表2 筛查对10,000名女性连续10年每年进行乳腺X线筛查的女性可能带来的益处和危害a

年龄/岁    乳腺X线筛查避免的未来15年内乳腺癌死亡人数b    十年内出现1项及以上假阳性结果的人数(95%CI)c    十年内活检出现1项及以上假阳性结果的人数(95%CI)c    十年内不会出现临床症状的乳腺癌或导管原位癌人数(过度诊断)d

40    1–16    6,130 (5,940–6,310)    700 (610–780)    ?–104e

50    3–32    6,130 (5,800–6,470)    940 (740–1,150)    30–137

60    5–49    4,970 (4,780–5,150)    980 (840–1,130)    64–194

a来源于Pace and Keating

b免于死亡的人数来源于Welch and Passow。下限代表当乳腺癌死亡的相对风险为0.95(根据加拿大临床试验得出的最小获益)时减少的乳腺癌死亡人数,上限代表乳腺癌相对风险为0.64时减少的乳腺癌死亡人数(根据瑞典两县试验)。

c来源于Hubbard等和Braithwaite等发表的95%CI下十年内出现假阳性和活检数。

d过度诊断病例数目为Welch and Passow计算。下限是根据Malm?试验得出的,上限是Bleyer and Welch预计的。

e预估的下限是根据Welch and Passow得出的,源于Malm?试验。该试验未纳入50岁以下女性。

过度诊断

筛查发现某些永远不会出现临床症状的肿瘤即为出现过度诊断。这不仅对浸润性乳腺癌有意义,对导管原位癌更有独特意义,因为人们对导管原位癌的自然病程尚不了解。由于几乎所有乳腺癌和导管原位癌患者都接受治疗,那些肿瘤不会出现临床症状的女性也难免接受治疗,忍受治疗相关的副作用。另一方面,将来某个时间点筛查对降低死亡率的益处将有所体现。

要理解过度诊断可以通过检测因肿瘤外原因死亡的女性中隐匿性乳腺癌的发病率。对7项尸检研究的综述发现,隐匿性浸润性乳腺癌的中位发病率为1.3%(0%-1.8%),隐匿性导管原位癌的中位发病率为8.9%(0%-14.7%)。

比较筛查人群中乳腺癌的发病率和未筛查人群中乳腺癌的发病率可以间接了解过度诊断情况,但是上述对比可能不只有筛查与未筛查的差异,还会受到筛查时间、所处地区、健康习惯和激素使用情况的影响。过度诊断可能在领先时间偏倚校正方面有所差异。对29个试验的综述发现过度诊断的发生率为0%-54%,随机试验得出的比例为11%-22%。 丹麦有些人进行了筛查,有些人没有进行筛查,在筛查人群中过度诊断为浸润性乳腺癌的比例为14%,未筛查人群中过度诊断为浸润性乳腺癌的比例为39%,该试验采用了两种不同的试验方法。若将导管原位癌考虑在内,那么过度诊断的发生率为24%-48%。

理论上看,在特定人群中,若发现更多早期乳腺癌患者,那么之后晚期癌症的发生率应该降低。但是,在研究过程中,这一现象并未出现。因此,筛查发现更多早期癌症可能代表过度诊断。

挪威一项队列研究比较了不同县引入筛查以后适合参加筛查的一定年龄的女性和尚无需进行筛查的女性中肿瘤发生率的增长情况。结果发现筛查的女性中局部肿瘤的发生率增高了60%(相对风险比,1.60;95%CI,1.42-1.79),两组女性中晚期癌症的发生率相似(相对风险比,1.08;95%CI, 0.86-1.35)。

一项对美国多个县进行的基于人群的研究发现乳腺X线检查的应用越广泛,确诊乳腺癌的病例越多,但是10年内乳腺癌的死亡率并没有下降。这项研究纳入了相当多的人数(1600万女性),在多个县进行的研究得出的相关性结论具有一致性。但是该实验存在一定缺陷,乳腺X线筛查患者报告,间隔两年评估筛查的普及情况及分析时机(绝经后激素治疗已经投入应用)。

加拿大国家乳腺癌筛查研究通过一项随机临床试验估计了过度诊断的发生情况。在第五轮筛查结束时,与对照组相比,使用乳腺X线技术的实验组确诊的浸润性乳腺癌患者多142名。15年后,实验组出现乳腺癌的人数比对照组多106名,说明,484名筛查发现的浸润性乳腺癌中22%属于过度诊断。

表1列出了预计10,000名女性中经筛查确诊乳腺癌而10年内没有临床意义(过度诊断)的人数。在健康保险计划的研究中,没有出现过度诊断的情况,该研究采用了老技术乳腺X线和触诊。经改良的乳腺X线出现过度诊断的情况较多见。但是新乳腺X线与旧技术之间在降低乳腺癌死亡率方面的差异尚未知。


假阳性导致的额外干预

由于实际筛查中每1000人仅有不足5人为乳腺癌患者,因此,即使乳腺X线检查特异性为90%(非乳腺癌女性中90%筛查结果为阴性),大部分异常X线检查结果也是假阳性。

高假阳性率未引起重视可以用统计学的基率谬误解释。由于乳腺癌的基率谬误较低(5‰),即使使用非常准确的检测,假阳性率仍远高于真阳性率。

乳腺X线检查的真阳性率大约为90%表示,患有乳腺癌的女性中大约90%筛查结果为阳性。真阴性率大约为90%表示没有乳腺癌的女性中大约90%筛查结果为阴性。若假阳性率为10%,则1000人中100个人筛查结果为假阳性。若1000人中有5位患乳腺癌,则4.5人筛查结果为阳性。或者说,每100例假阳性女性对应4.5位真阳性女性。

乳腺X线检查异常的女性一般要接受进一步检查,运用其他成像手段放大异常区域,或用超声、MRI以及组织采样法(细针抽吸、粗针活检以及手术切取活检)。总之,一定要权衡非必要检查和治疗手段与早期确诊之间的利弊。

一项乳腺癌筛查研究调查了某健康维护组织中2,400名女性,结果显示十年间共确诊88名乳腺癌患者,其中58名是通过乳腺X线检查发现的。在此期间,1/3的女性乳腺X线检查结果为异常,需要接受进一步检查,包括539人次乳腺X线、186人次超声检查以及188人次活检。因乳腺X线检查结果的累计活检率(即真阳性)大约为1/4(23.6%)。40~49岁女性异常乳腺X线检查的阳性预测值(PPV)为6.3%,50~59岁为6.6%,60~69岁为7.8%。上述女性也于1983年7月到1995年6月参加了“哈佛朝圣者医疗保健计划”,研究者通过对该计划数据的建模和分析发现,首次乳腺X线检查时出现假阳性的风险为7.4%(95%CI, 6.4%~8.5%),第五次时为26.0%(95%CI, 24%~28.2%),第九次时为43.1%(95%CI, 36.6%~53.6%)。到第九次筛检时,假阳性累计概率为5%~100%,取决于四个患者因素(年龄较小、曾进行多次乳房活检、乳腺癌家族史以及目前雌激素使用情况)以及三个放射因素(筛检间隔期较长、未与之前的筛检结果进行对比以及放射医师倾向于认为光片为异常)。总的来说,放射医师倾向于认为光片为异常是假阳性最大的风险因素。

一项前瞻性队列试验对基于社区的筛查进行研究,发现相比每两年进行一次筛查的女性,每年筛查一次的女性十年内更可能出现一次及多次假阳性结果,与乳房致密程度无关。40多岁,每年筛查一次与两年筛查一次出现假阳性的可能分别为68.9%和46.3%。50-74岁存在纤维腺体密度分散的女性,该数据分别为49.8%和30.7%。

如表1所示,预计10,000名每年进行筛查的女性中十年间出现至少1次假阳性检测的情况为,40-50岁女性为6,130名,60岁女性为4,970名。出现假阳性而进行活检的人数预计为700-980。

假阴性导致虚假的安全感

乳腺X线检查的敏感性在70%~90%之间,与放射医师水平(经验)和受检女性的年龄、乳房致密程度有关,而后者则与遗传倾向、激素使用情况和饮食有关。假设平均敏感性为80%,则可能有20%的癌症在筛检时未被查出(即假阴性)。这些成假阴性的癌症多为高风险肿瘤,表现出有害的生物学特点(更多信息请参见本概述乳腺癌筛查概念之间隔期癌症部分)。如果一个假阴性结果阻碍或延迟了患者和医生对乳腺症状的评估,患者可能承受非常不利的后果。因此,乳腺X线阴性也不能放弃后续症状的评估。

不适感

拍摄乳腺X线检查时须挤压双乳,这有利于减少运动伪像,提高影像的质量;同时,接受检查时的姿势也很重要。一项研究评估了乳腺X线检查时受检者的疼痛和不适感,研究发现,90%的人认为不舒服,12%的人则认为紧张,甚至难以忍受。对22项研究乳腺X线检查引起的疼痛和不适的研究进行系统恢复,发现疼痛的发生率差异很大。疼痛的程度与检查时患者当时的月经周期阶段、焦虑程度和以往接受检查时的疼痛程度相关。

放射暴露

放射相关的乳腺癌主要风险因素为暴露年龄和放射剂量,但对某些女性来说,她们对电离辐射危害有遗传易感性,任何时候都应该避免放射暴露。对多数40岁以上女性乳腺X线筛查利大于弊在美国。乳腺标准双视筛查平均双侧乳房辐射量为4毫西弗,全身平均辐射剂量为0.29毫西弗。因此,40-80岁每年接受乳腺X线检查的女性中1/1,000可能因筛查出现乳腺癌。乳房较大的女性由于所需放射剂量更大,出现放射相关乳腺癌的风险为2/1,000。相比自40岁起每年进行一次筛查,从50岁开始每两年进行一次筛查,辐射导致的乳腺癌可能降低5倍。

假阳性引起的心理负担

对参加乳腺X线检查筛检三个月后的308名女性进行电话调查,68名得到 “可疑”结果的女性中有1/4的女性即使在后续检查排除了癌症诊断的情况下仍感到担忧,情绪或行为仍受到影响。研究假阳性结果带来的心理影响是否为长期影响得出了不同的结论。2002年西班牙进行的一项队列研究发现假阳性结果对心理有即时影响,但影响几个月就可以消失。2013年丹麦开展的一项队列研究测量了假阳性结果数年后对心理的影响,发现假阳性结果会使几年内出现不良心理结果。一些研究表明假阳性导致焦虑,使未来参与乳腺X线检查的次数增多。

经济压力和机会成本

筛查潜在的弊端尚未研究透彻,但确实存在。

除乳腺X线之外影像学筛查方式:超声检查、磁共振成像、热成像检测

超声检查

超声检查主要用于对可扪及的或已经由乳腺X线发现的肿块进行诊断性评估,而不是用于筛查。对欧洲乳腺癌筛查小组的研究和专家观点进行回顾发现“目前无证据支持任何年龄段女性以超声检查作为乳腺癌的筛查手段”。

磁共振成像

乳房磁共振成像可用于女性乳腺癌的诊断评估,包括检查硅胶植入物的完整性,评估术后或放疗后可扪及的肿块情况,检测有腋窝淋巴结转移但乳腺X线或超声检查未查出的乳腺癌,以及用于某些已确诊乳腺癌的患者的术前规划等。磁共振成像无电离辐射。推荐有较高乳腺癌患病风险的女性使用磁共振检查作为筛检手段,包括BRCA 1/2变异基因携带者、有乳腺癌家族史者,以及患有其他基因变异性疾病的人,如李法美尼症候群(Li-Fraumeni)以及多发性错构瘤综合征。乳腺MRI比乳腺X线敏感性高,特异性较后者低,价格是后者的35倍。

热成像检测

利用红外线成像技术,热成像仪通过识别乳房皮肤的温度变化来检测潜在的肿瘤,并将这种变化以色谱的形式呈现出来。热成像仪已通过FDA的510(k)过程审查,不需要临床有效性证据即可上市。目前尚无随机对照研究探讨该技术的乳腺癌检测能力以及对乳腺癌死亡率的影响。一些小型队列研究认为将热成像作为乳腺癌筛查的联合方式无任何额外益处。


非影像学筛查方式

临床乳腺检查

目前尚无单独研究临床乳腺检查(CBE)的随机对照试验。加拿大国家乳腺筛查研究对比了高质量CBE加乳腺X线检查与单独CBE在50~59岁女性乳腺癌筛查中的效果(更多信息请参见本概述概论的临床乳腺检查部分)。CBE一般由富有经验的医务人员进行,每侧乳房持续5~10分钟,且要定期评估医务人员的检查成效。两组在癌症诊断率、分期、间隔期癌症以及乳腺癌死亡率等指标上相似。中位随访13年,两组乳腺癌死亡率类似(死亡率比值比为1.02, 95%CI, 0.78~1.33)。研究者估计了单独CBE检查的一些特征;对于50~59岁的19,965名女性,检查的敏感性分别为第1年83%, 第2年71%, 第3年57%, 第4年83%, 以及第5年77%;而特异性在88%到96%之间。阳性预测值(PPV),即阳性结果中癌症的比例,预计为3%~4%;对于40~49岁的25,620名女性,她们仅在入组时接受过一次CBE检查,预计敏感性为71%,特异性为84%,阳性预测值为1.5%。

社区医师行CBE检查的特异性比乳腺癌筛查临床试验中的检查员高,达97%~99%,但敏感性较低(22%~36%)。一项对有乳腺癌家族史的女性的筛查研究发现,在正常的初始评估后,患者自己或医师行CBE检查比乳腺X线检查发现的癌症比例高。

另一项研究探讨了将CBE与乳腺X线筛查结合的效果;该研究共纳入61,688名40岁以上的女性,进行乳腺X线检查和(或)CBE检查,其中单独乳腺X线的敏感性为78%,二者结合的敏感性为82%;但二者结合的特异性比单独乳腺X线低,分别为97%和99%。目前有两项关于CBE的国际研究正在印度和埃及展开。

乳房自检(BSE)

医学界目前提倡每月一次的乳房自检(BSE),但暂无可靠证据证明其能降低乳腺癌死亡率。唯一关于BSE的随机临床研究是上海的一项大型研究,该研究将266,064名女性工人随机分为BSE组以及预防腰痛组,BSE组接受BSE指导和鼓励,后者接受腰痛的预防指导。两组均未接受任何乳腺癌筛检。在随访10~11年后,BSE组出现135名乳腺癌死亡病例,对照组出现131名(相对危险度=1.04;95%CI, 0.82~1.33)。虽然两组浸润性乳腺癌诊断病例数几乎相同,但BSE组女性比对照组接受了更多的活检,发现了更多良性病变。

关于BSE的其他研究很有限。第一项研究:列宁格勒的研究人员将超过100,000名女性通过整群随机抽样的方法分配与BSE组或对照组;结果发现BSE组比对照组接受更多的乳房活检,但乳腺癌死亡率未降低。第二项研究:英国早期乳腺癌检测研究,两个区共63,500余名年龄45~64岁的女性被邀请参加BSE教育课程,在后续10年的随访中,未发现这些女性与未接受过BSE教育课程的女性在乳腺癌死亡率方面的区别(相对危险度:1.07;95%CI, 0.93~1.22)。第三项研究:加拿大国家乳腺癌筛查研究的一项巢式病例对照研究,该研究对比了不同女性在乳腺癌死亡率注册之前自述的BSE检查频率的区别。运用手眼结合方式、用指肚进行触摸以及运用中间三个指头进行BSE的女性乳腺癌死亡率较低。

组织采样(细针抽吸法、乳头抽吸法、乳管灌洗法)

目前,已有多种乳腺组织分析方法被提议用于乳腺癌筛检,但尚无研究表明上述采样方式可以降低乳腺癌的死亡率。

附录:随机对照试验

美国1963年健康保险计划

入组年龄:40~64岁

随机:个体随机化,各分配组之间存在显著不平衡,主要是绝经状态(P< 0.0001)以及教育程度(P = 0.05)。

样本量:实验组30,000~31,092;对照组30,565 ~30,765。

报告一致性:报告样本量有变化。

干预:每年一次双视角乳腺X线(MMG)和三年临床乳房检查(CBE)。

对照:常规医疗。

依从性:不纳入未参加首次筛检者(占筛检人群35%)。

沾染(对照组使用试验组措施):不能擅自参加试验以外的乳腺X线筛查,对照组女性进行临床乳房检查的频率未知。

死因分析:在分析时排除入组前已被诊断为乳腺癌并因此死亡的女性。但两组在排除此类受试者时情况并不一样。试验组女性基于首次筛查的结果来判断是否排除,排除者不在后续试验考虑之列;按照试验设计,对照组不需要参加定期临床检查,因此其入组前的癌症状况并不清楚。如果一个对照组女性确定死因为乳腺癌,那么需要做一个回顾性的检查,以确定其癌症的诊断日期。若诊断日期在试验之前,则该女性会不纳入分析范围。这种方法学上的差异可能导致两组乳腺癌死亡率对比时显著的偏倚,且可能偏向于筛检组。

分析:随访;

外部审查:无;

随访期限:18年;

筛检组与对照组乳腺癌死亡的相对危险度:10年期为0.71(95%CI, 0.55~0.93),15年期为0.77(95%CI, 0.61~0.97)。

评价:由于设备和技术比较落后,此试验MMG质量与后来的试验相比较差;值得注意的是,本试验干预措施包括MMG和CBE。本试验主要局限是首次随机D的效度和有乳腺癌病史女性的排除标准。

瑞典马尔摩市1976年试验

入组年龄:45~69岁

随机:个体随机,第一期均在出生队列内随机化,进行双视角乳腺X线筛检,即MMST I期;MMST II期从1933~1945年所有出生队列个体随机化,但由于资源有限,具体有所调整;年龄分析显示两组并无显著差异。

排除标准:在瑞典一项荟萃分析中,393名女性因在筛检前即存在乳腺癌,被排除,同样有412名女性被排除。总体而言,试验组总共排除的受试者比对照组多86名。

样本量:试验组21,088名;对照组21195名;

报告一致性:患者数量并无变化;

干预:双视角MMG每18~24个月进行其次,共进行5次(every 18 to 24 months*5);

对照:常规医疗,试验结束时进行MMG筛查;

依从性:从马尔摩市迁徙而来的试验受试者并未随访(每年2%),第一轮参与率为74%,后续几轮为70%。

沾染:对照组有24%的女性至少接受过一次MMG,对照组45~49岁女性中24%也至少接受过一次MMG。

死因分析:早期76%进行了活检率,后期这一数值降低;患有乳腺癌的女性进行死因评估时使用盲法(即不让评估者知道其患有乳腺癌);具体请参见瑞典死因登记系统。

分析:初期评估;后续分析作为瑞典荟萃分析的一部分;

外部审查:无;

随访期限:12年;

筛检组与对照组乳腺癌死亡的相对危险度:0.81(95%CI, 0.62~1.07)

评价:评估分析需要对对照组的MMG延迟进行纠正。大多数研究对MMST I期和II期进行了联合分析。


瑞典东约特兰省1977年两县试验之E县

入组年龄:40~74岁

随机:按地域整群随机,按居住地(城市或农村)、社会经济因素和地域大小分层;不同地域的乳腺癌发病率基线水平具有可比性。试验组女性年龄大于对照组女性(P< 0.0001),但这对试验结果并无重大影响。

排除标准:试验前已患有乳腺癌的女性被排除于两组之外,但不同报告中人数各有不同;瑞典荟萃分析中排除了所有先前诊断为乳腺癌的女性。

样本量:不同报告中各有不同;试验组38,405 ~ 39,034;对照组37,145 ~ 37,936

报告一致性:有不同;

干预:50岁以下女性每两年3次单视野MMG;50岁或以上女性每33个月3次;

对照:常规医疗,试验结束时进行一次MMG;

依从性:89%的人群参与筛检;

沾染:13%试验女性已在常规医疗活动中参加过MMG,大部分在1983年和1984年。

死因分析:由一组当地医师决定;瑞典荟萃分析后来重新计算了结果,采用了瑞典死因等级系统的数据。与先前研究结论不同,该分析认为筛检获益有限。

分析:初期评估,纠正了对照组MMG的延迟;后续分析作为瑞典荟萃分析的一部分;

外部审查:无;但是乳腺癌确诊和死亡病例均由瑞士一个专家委员会确认,本研究的人员也属于该委员会。

随访期限:12年。

筛检组与对照组乳腺癌死亡的相对危险度:0.82 (94%CI, 0.64~1.05)

评价:局限性主要在于方法学和评估分析,需要对对照组MMG延迟做修正。瑞典荟萃分析恰当地解决了上述问题。


瑞典科帕尔贝里省1977年两县试验之W县

入组年龄:40~74岁。

随机:按地域整群随机,按居住地(城市或农村)、社会经济因素和地域大小分层;随机过程并未叙述;试验组女性年龄大于对照组女性(P<0.0001),但这对试验结果并无重大影响。

排除标准:排除试验前已患有乳腺癌的女性,但不同报告中人数各有不同。

样本量:不同报告中各有不同;试验组38,562 ~ 39,051;对照组18,478~ 18,846;

报告一致性:有不同;

干预:50岁以下女性每两年3次单视野MMG;50岁或以上女性每33个月3次;

对照:常规医疗,试验结束时进行一次MMG;

依从性:89%的人群参与筛检;

沾染:13%试验女性已在常规医疗活动中参加过MMG,大部分在1983年和1984年。

死因分析:由一组当地医师决定(具体参见东约特兰省试验);

分析:评估;

外部审查:无;但是乳腺癌确诊和死亡病例均由瑞士一个专家委员会确认,本研究的人员也属于该委员会。

随访期限:12年;

筛检组与对照组乳腺癌死亡的相对危险度:0.68 (95%CI, 0.52~0.89)


英国爱丁堡1976年试验

入组年龄:45~64岁;

随机:根据医师执业模式进行整群随机,但研究开始之后随机分组有所改变;根据医生对研究受试者是否适合参加试验的判断,研究受试者进入各组方式不一;在试验结束前,各组之间存在较大的社会经济地位差异。

排除标准:排除先前被诊断为癌症的女性,试验组排除338名,对照组排除177名;

样本量:试验组23,226;对照组21,904;

报告一致性:好;

干预:最初为双视角MMG和乳房自检(CBE);然后为年度CBE和第3、5、7年的MMG;

对照:常规医疗;

依从性:61%参与筛检;

沾染:无;

死因分析:癌症注册数据;

分析:后续分析;

外部审查:无;

随访期限:10年;

筛检组与对照组乳腺癌死亡的相对危险度:0.84 (95%CI, 0.63~1.12);

评价:随机化过程存在缺陷;对照组与试验组较大的社会经济地位差异可能导致对照组全死因死亡率高于试验组;对照组全死因死亡率是试验组的四倍,这可能解释了对照组乳腺癌死亡率高于试验组的结果。虽然最终分析时纳入了修正因素,但并不充分。

试验设计与实施的缺陷使得结果难以评价,并很难与其他研究结果联系起来。


加拿大国家乳腺癌筛查研究1-1980年

入组年龄:40~49岁;

随机:个体志愿者,名字相继加入分配名单;虽然有人质疑这一随机化过程,但一项独立详细的评审未发现其存在可以对结果造成重大影响的缺陷。

排除标准:很少;各组保持平衡;

样本量:试验组25,214(入组CBE之后100%参与筛检);对照组25,216;

报告一致性:好;

干预:每年双视角MMG和CBE,持续4~5年;

对照:常规医疗;

依从性:初始为100%,第五次筛检时降到85.5%;

沾染: 26.4%在常规医疗组;

死因分析:死亡证明;有疑问的病例由盲法审查小组审核;同时参考加拿大死亡率数据库;

分析:随访;

外部审查:有;独立外部评审者进行数据分析;

随访期限:25年;

筛检组与对照组乳腺癌死亡的相对危险度:1.09 (95%CI, 0.80~1.49);

评价:这是一项专门针对40~49岁女性的乳腺癌筛检研究。入组时查出乳腺癌的受试者两组均未排除。试验完成之前有人质疑该研究的MMG的技术可行性、放射医师培训以及设备的标准化等,研究者因而开启了独立外部审核。该审核发现的最主要的缺陷是1980~1985年该研究使用的是中外侧视野MMG,而非中外斜侧视野MMG(1985年之后使用)。后续分析发现,本试验MMG发现的肿瘤大小和分期与其他试验相当。本试验和NBSS-2不同于其他试验之处在于腋窝淋巴结转移阳性女性在局部乳腺癌治疗的之后使用激素辅助治疗和化疗。

加拿大国家乳腺筛查研究2-1980年

入组年龄:50~59岁;

随机:个体志愿者(见NBSS-1);

排除标准:很少;各组保持平衡;

样本量:试验组19,711(入组CBE之后100%参与筛检);对照组19,694;

干预:每年双投照体位MMG和CBE;

对照:每年CBE;

依从性:试验组初始为100%,第五次筛检时降到86.7%;对照组初始100%,第五次筛检时降到85.4%;

沾染:对照组(CBE组)有16.9%的人接受MMG;

死因分析:死亡证明;有疑问的病例由盲法审查小组审核;同时参考加拿大死亡率数据库;

分析:随访;

外部审查:有;独立外部评审者进行数据分析;

随访期限:25年;

筛检组与对照组乳腺癌死亡的相对危险度:1.02 (95%CI, 0.77~1.36).

评价:本研究独特之处在于其将二种筛检方式进行对比,但缺少无筛检对照;具体批评和评论请见NBSS-1。


瑞士斯德哥尔摩1981年研究

入组年龄:40~64岁;

随机:根据出生日期进行整群随机分组;包括两个亚试验,第一个随机化较为平衡,第二个存在显著不平衡,试验组比对照组多508名女性。

排除标准:报告不一致;

样本量:根据公开发布的报告,试验组从40,318降至 38,525;对照组从19,943 升至 20,978;

报告一致性:有变化;

干预:每28个月进行1次单视野MMG,共两次;

对照:第五年进行一次MMG;

依从性:82%的受试者参与了筛检;

沾染:25%的女性在参与试验前三年内接受过MMG;

死因分析:参考瑞典死因注册系统;

分析:评估,对照组的试验后MMG延迟1年;后续分析作为瑞典荟萃分析的一部分;

外部审查:无;

随访期限:8年;

筛检组与对照组乳腺癌死亡的相对危险度:0.80 (95%CI, 0.53~1.22);

评价:局限性在于随机分组,第二个亚试验的排除标准,以及对照组MMG的延迟等;瑞典荟萃分析纳入了这部分数据,并解决了许多上述问题。


瑞典哥德堡1982年试验

入组年龄:39-59岁;

随机:较为复杂; 50~59岁进行整群随机化,根据同一年出生的日期(仅指日,不包括月)进行分组;39~49岁进行个体随机化;试验组和对照组人数比例根据MMG可及性有所变动;随机化在1982~1984年完成;

排除标准:先前患有乳腺癌的女性被排除,在对照组和试验组均占约1.2%。

样本量:最新报告显示试验组21,650,对照组29,961;

报告一致性:有变化;

干预:最初双视角MMG,然后每18个月一次单视野MMG,共四次;前3轮由医生进行一次读片,后几轮由医生交叉进行读片;

对照:试验组进行最后一次筛检的前3~8个月对照组进行一次筛检;

死因分析:参考瑞典死因注册系统;同时采纳一个独立死亡分析委员会的意见;

分析:评估和后续分析方法;

外部审查:无;

随访期限:12~14年;

筛检组与对照组乳腺癌死亡的相对危险度:39~59岁评估时为0.79 (95%CI, 0.58~1.08),后续分析为0.77 (95%CI, 0.60–1.00);

评价:50~54岁女性乳腺癌死亡率未降低;但其他5年年龄区段的女性死亡率有所降低;

结论:对照组MMG的延迟以及两组受试者数量不平衡(随机化较为复杂导致)使得分析较为复杂。


AGE试验

入组年龄:39~41岁;

随机:个体随机;受试者主要来自英格兰、苏格兰以及威尔士各地理区域医师的患者名单,参与人具体来自哪个区域未知。

排除标准:小部分受试者因无法确定住址或已经去世被排除(试验组30人,对照组51人);

样本量:共160,921(试验组53,884;对照组106,956;)

报告一致性:不适用;

干预:试验组48岁以下的进行年度MMG筛查(第一次进行双视角MMG,以后进行单视野中外斜侧MMG);68%的受试者接受了首次筛查,其中69%~70%被再次邀请参加后续筛查(也即81%的受试者至少参加了一次筛查)。

对照:常规医疗,对照组并不知道自己参与了研究,随机化之前很少有人接受了MMG筛查;

死因分析:参考NHS中心死因注册系统,并收到死亡认证码;

分析:随访,以及意向性处理分析方法(虽然NHS对50岁以上女性均提供筛检服务);

外部审查:无;

随访期限:10.7年;

筛检组与对照组乳腺癌死亡的相对危险度:0.83 (95%CI, 0.66~1.04);

结论:结果并无统计显著性;但与其他试验结果相符;

随访期限:中位17.7年;

筛检组与对照组乳腺癌死亡的相对危险度:0.88(95%CI, 0.74-1.04);

结论:无统计学意义;

随访期限:中位17.7年;

筛检组与对照组全因死亡的相对危险度:0.98(95%CI, 0.93-1.03)

结论:无统计学意义。

中位随访17.7年乳腺癌死亡率降低相当于死亡率绝对风险降低0.1‰(或万分之1)。

证据尚不足以证明39-49岁女性进行乳腺X线筛查与乳腺癌死亡率降低有关。据报道,死亡率降低非常有限,短暂的死亡率降低基于不同的筛查间期,不一致的影像检查技术及不同的活检标准;因此对大部分人群而言没有参考价值。按绝对值计算,相当于死亡率绝对风险降低0.1‰(或万分之1)。此外,死亡率降低是在原始数据上进行再次分析得出的,不具有统计学意义,而且亚人群中乳腺癌死亡率是随访10年得出的。随访20年发现,乳腺癌死亡风险或全因死亡风险降低均无统计学意义。

证据不足以确定过度诊断的影响。由于是对亚人群的分析,而且筛查间隔不一致,影像检查技术不同,活检技术不一,因此是否适用于普通人群不一定,不能因此得出结论“只有一小部分为过度诊断”。