小细胞肺癌筛查
筛查有益的证据
应用低剂量螺旋CT扫描进行肺癌筛查
益处:
有证据表明对55~74岁吸烟史大于等于30包年(包年是指每天吸烟的包数乘以吸烟的年数)或戒烟时间在15年以内的人群进行肺癌筛查,能使肺癌致死率降低20%,总致死率降低6.7%。(95% 置信区间, 1.2–13.6; P = .02). 一项新的分析显示筛查可将肺癌致死率降低约16%。(95% 置信区间, 5–25).
效果量级:肺癌致死率降低16%
试验设计:证据来自一项随机对照试验
内部效度:高。
一致性:不适用(N/A)——目前只有一项随机试验。
外部效度:正常。
害处:
有确切证据显示,98%(不是所有)的低剂量螺旋CT扫描筛查阳性的参与者最终没有被诊断为肺癌。假阳性可能导致不必要的侵入性检查。
效果量级:高
试验设计:证据来自一项随机对照试验
内部效度:高。
一致性:高。
外部效度:正常。
筛查无益的证据
应用胸部X线和/或痰细胞学检查进行肺癌筛查
益处:
有确切证据表明,在总人群或有吸烟史的人群中,应用胸部X线和/或痰细胞学检查并不能降低肺癌致死率。
效果量级:N/A
试验设计:几项随机对照试验
内部效度:高。
一致性:高。
外部效度:高。
害处:
假阳性检查结果
有确切证据显示,95%(不是所有)的胸部X线筛查阳性的患者最终没有被诊断为肺癌。。假阳性可能导致不必要的侵入性检查。
试验设计:几项随机对照试验
内部效度:高。
一致性:高。
外部效度:高。
过度诊断
有确切证据显示,有少量但所占比率不可忽略的患者因胸部X线和/或痰细胞学检查出肺癌,最终被证明为过度诊断;这个群体所占比重大约在5%到25%。肺癌诊断导致了不必要的检查和不必要的治疗。而这些过度检查和治疗所带来的害处多发生于长期和/或大量吸烟者,其原因在于吸烟合并其他疾病会使患癌风险增加。
效果量级:在5%到25%之间,具体取决于筛查人群和筛查方案的不同
试验设计:几项随机对照试验
内部效度:高。
一致性:高。
外部效度:高。
背景
发病率和死亡率
肺癌是美国第三常见的非皮肤癌症,且在男性和女性中的癌症致死率均居首位。仅2016年,据估计将有117,920名男性和 106,470名女性诊断为肺癌,且这一年中将会有85,920名男性和72,160名女性因肺癌死亡。近几十年,肺癌在男性和女性中的死亡率快速增长,但男性的肺癌死亡率从1991年开始出现了持续下降。从2008至2012年,男性的肺癌死亡率每年降低3.0%,女性每年降低1.9%。
危险因素
肺癌(如许多其他癌症一样)最重要的危险因素是使用烟草。根据流行病学和临床前期动物试验数据显示,吸烟已经明确成为患肺癌的首要诱因。这种因果联系自上世纪60年代就已被广泛认可,当时英国和美国对吸烟增加患癌风险的分析报道引起了民众的重点关注。因吸烟导致的肺癌在男性和女性中的发生率分别为90%和78%。
筛查有益的证据
低剂量螺旋CT筛查
经过大量的努力,肺癌筛查因新技术的出现已经得到了提升,包括低剂量螺旋计算机断层扫描(LDCT)。研究证明LDCT比胸片更敏感。在早期肺癌行动项目(ELCAP) 中发现,LDCT检测到的I期肺癌是胸片的近6倍之多,这些肿瘤大多数直径都没有超过1厘米。
一项系统分析总结了1993年到2004年之间进行的13个针对LDCT的观察性研究,分别涉及了60至5,201名参与者。除了一些日本研究囊括了非吸烟者,其他研究都仅限于目前或曾经吸烟的烟民。检测到结节的比例从3%到51%不等,其差异可能归因于以下几个因素:
?结节的定义(一些研究需要对结节大小进行限制)
?CT技术的不同(扫描层厚越薄就能检测到更多、更小的结节)
?地方性肉芽肿疾病的地理差异
总之,有1.1%到4.7%接受筛查的参与者被诊断为肺癌;他们中大部分为早期。
随着全美肺癌筛查试验(NLST)完成,现在有证据表明,LDCT筛查可以降低吸烟史大于等于30包年和戒烟时间在15年以内人群的肺癌死亡率。NLST在美国各地的33个中心进行。受试者年龄在55岁~74岁之间,至少有30包年吸烟史,若已戒烟,戒烟时间应在过去的15年之内。试验共纳入53,454人;其中 26,722人被随机分配为接受LDCT筛查,另外26,732人则接受胸部X线筛查。任何LDCT检测到的4毫米以上的非钙化结节、X线扫描检测到的所有非钙化结节或肿块被归类为阳性,然而,如果一个非钙化结节在三次筛查中都出现且稳定,那么放射科医师可以判定最终筛查结果为阴性。LDCT组的筛查阳性率比X线放射组明显较高(第1轮,27.3%对9.2%;第2轮,27.9%对6.2%;第3轮,16.8%对5.0%)。总体而言,39.1%的LDCT组参与者和16.0%的X线放射组参与者至少出现过一次阳性筛查结果。对于筛查结果阳性的参与者,LDCT组的假阳性率为96.4%,而X线放射组为94.5%。这在三轮筛查结果中一致。
在LDCT组,649名筛查阳性的参与者最终被诊断为肺癌,筛查阴性的肺癌确诊者有44名,367名参与者错过了筛查或在筛查阶段结束后才被确诊为肺癌。而在X线放射组中,279筛查阳性的参与者最终被诊断为肺癌,筛查阴性的肺癌确诊者有137名,525名参与者在错过了筛查或在筛查阶段结束后才被确诊为肺癌。LDCT组的肺癌死亡人数为356人,而X线放射组为443人,前者较后者降低20%(95%置信区间 [CI],6.8-26.7)。 一项新的分析显示肺癌致死率降低约16% (95% 置信区间, 5–25)。 总体而言,死亡率降低6.7%(95%置信区间,1.2-13.6)。每320人接受LDCT筛查,就能防止1人死于肺癌。
随着NLST结果的公布,越来越多的人了解到,哪些人群可以充分利用LDCT筛查肺癌并从中获益。一组研究者开发了一种个体风险模型来评估哪些人可能从筛查中受益。模型中加入了NLST中未列入纳入标准的额外因素,例如慢性阻塞性肺疾病、个人或家族性肺癌史、以及更详细的吸烟史。若用此标准来代替NLST的纳入标准,就可以有更多的人进行筛查来防止癌症的遗漏。另一组研究者对NLST的数据进行了重新分析,并计算出每个患者患肺癌的风险,以及他们的肺癌致死率。基于计算出的风险值,研究人员将NLST参与者分为五组。在低风险组,每5,276人接受筛查能避免1人死于肺癌。;而在高风险组,每161名参与者接受筛查能避免1人死于肺癌。此外,筛查结果假阳性的人数在五组中的最低风险组为1648名,而最高风险组为65名。风险最高的三个组的病死率因筛查降低了88%,而最低风险组病死率降低了1%。这些研究表明了哪些人群最可能从筛选中最大程度地获益,并能潜在地减少假阳性的数量,并在评估过程中同时减少潜在的不良反应事件发生。计算个体风险的另一个好处是可以将结果最终合并为一个公开的决策过程,使患者可以决定是否接受肺癌筛查。
其他有关LDCT的随机临床试验(RCT)正在一些国家进行。其中最大的是在荷兰和比利时进行的随机肺癌筛查试验(又称NELSON试验)。这项研究与NLST的不同之处在于对照组没有胸片筛查。在欧洲还有一些较小的试验也在将LDCT和非筛查组进行对比。这些小规模试验并没有达到致死率的研究终点,但是当NELSON试验数据成熟后,研究者会努力将那些试验的结果与NELSON试验的数据相结合。研究者也可以评估这些研究结果和NLST结果的一致性。除了从正在进行的试验中收集数据,研究者还会分析NLST的数据以评估有关肺癌筛查的一些其他方面的重要问题,例如成本效益、生活质量以及筛查对比NLST参与者年轻的人群和吸烟史低于30包年的人群是否有益。来自美国的前列腺、肺、结直肠和卵巢(PLCO)癌症筛查试验数据表明,在没有筛查的情况下,与吸烟史大于等于30包年和戒烟短于15年的人群相比,吸烟史在20~29包年的烟民在肺癌死亡风险方面没有差异(危险比1.07;CI,0.75-1.5)。虽然前吸烟者群体的风险与未戒烟者(美国预防服务工作组推荐该人群接受LDCT筛查)没有区别,筛查对于前吸烟者的作用仍是未知的。
筛查和戒烟
与普通人群相比,肺癌筛查的目标人群包含了许多患病率较高的当前吸烟者。肺癌筛查计划可能会影响人们戒烟的动力,理论上会促进筛查发现肺部异常的人群进行戒烟。相反,筛查也可能使没有发现肺部异常的参与者停止戒烟。丹麦肺癌筛查试验是一项随机试验,它比较了LDCT和不进行干预对于50?70岁有至少20包年吸烟史的参与者的区别。研究者在5年的随访期内监测发现,每年两组中戒烟的参与者所占的比例从实验开始时(CT组和对照组各有23%的戒烟者)到5年随访期结束时(两组均有43%的戒烟者)几乎完全相同。这两个随机组的比较表明,CT筛查程序对戒烟的可能性的净影响接近于零。
另一份报告使用了NLST的数据以回答筛查结果是否影响戒烟的问题。 NLST将CT与X光胸透进行了比较,研究者将两组数据汇总并评估了异常影像结果对戒烟动力的影响。与没有异常发现的参与者相比,筛查发现可疑肺癌(但不是肺癌)的吸烟者明显更倾向于一年后戒烟。若筛查发现肺部有大异常但不怀疑肺癌或小异常,那么发现异常和戒烟之间的联系则较弱且在统计学上不够明显。
这两项研究的结果表明,CT筛查程序对戒烟的的净影响很小——如果它存在的话,但对于发现可疑肺癌的吸烟者来说,戒烟的可能性有所提高。这个重要的研究领域的问题还有待阐明,特别是发现筛查程序有可能促进戒烟后,评估如何干预戒烟就显得更加重要起来。
筛查无益的证据
X线和/或痰细胞学检查筛查
肺癌筛查的问题可以追溯到上世纪50年代,当时肺癌发病率和死亡率不断上升,人们不得不采取干预措施。为了应对新出现的肺癌问题,在上世纪50年代和60年代期间人们进行了五项胸部影像学研究,其中两项为对照研究;两项研究还包括了痰细胞学检查。这些研究结果表明筛查对整体没有益处,尽管由于研究设计的限制,这些结果很难得到确切的证据支持。
在上世纪70年代初期,美国国家癌症研究所资助了早期肺癌检测合作项目,旨在评估胸部X线及痰细胞学筛查在降低男性吸烟者肺癌死亡率方面的作用。该项目由三个独立的随机对照研究组成,每个试验都纳入了约10,000名45岁及以上的男性参与者,这些参与者在过去的一年每天至少抽一包香烟。其中一项研究在梅奥诊所进行,一项在约翰·霍普金斯大学,一项在纪念斯隆凯特琳进行。霍普金斯大学和纪念斯隆凯特琳的研究采用相同的设计:参与者被随机分配在两组,一组每4个月接受一次痰细胞学检查,并每年接受一次胸部X线影像学检查,而随机分配到对照组的参与者只接受每年一次的胸部X线影像学检查。研究均未观察到筛查使肺癌死亡率降低。这两项研究认为,在每年一次胸部X线检查的基础上加入频繁的痰细胞学检查没有益处。
梅奥诊所的研究(被称为梅奥肺计划,或MLP)的设计与上述不同。所有潜在的参与者都同时接受胸部影像学检查和痰细胞学检查,而已确诊或怀疑有肺癌以及身体状况差的对象被排除。留下的受试者被随机分配为两组:一组6年内每四个月接受一次胸部X线检查和痰细胞学检查,而对照组每年接受一次同样的两种检查。观察发现肺癌死亡率并没有因筛查增多而降低。这项20世纪70年代的MLP研究认为,高强度地同时进行X线胸片和痰细胞学检查的筛查方案并没有表现出任何益处。
在20世纪70年代,欧洲进行了一项有关肺癌筛查和胸部影像学的随机对照试验。该研究在捷克斯洛伐克进行,它纳入了6,364名40~64岁的男性吸烟者,这些受试者终生消费的香烟至少达到15万支,他们将接受肺癌的流行病学筛查(胸部X线检查和痰细胞学检查)。除了18名经检查被诊断为肺癌的患者外,其余所有的参与者被随机分配到以下两组之一:干预组将在3年内每半年接受一次筛查,而对照组仅在第三年接受筛查。研究发现,在干预组发生了19例肺癌死亡,而对照组为13例,并得出结论认为频繁的筛查是没有必要的。
至1990年,医学界仍然不确定胸部影像学筛查(使用传统的胸部X线)和肺癌致死率之间的关系。尽管以前的研究显示筛查没有任何益处,但由于统计功效不够,研究结果也并不确切。于是,一项有足够统计功效的多相试验——PLCO癌症筛查试验[376]于1992年开始进行,PLCO纳入了154,901名55?74岁的参与者,其中包括妇女(50%)和不吸烟者(45%)。受试者一半被随机分配到筛查组,另一半则接受常规医学支持。PLCO的统计功效为90%,它检测到肺癌死亡率降低的概率为20%。
PLCO的肺计划讨论了与常规医学支持相比每年一次单相(后前位)X线胸片是否能够降低肺癌死亡率的问题。研究开始时,随机分配到筛查组的参与者会接受一次基本筛查和三个年度胸部X线筛查,虽然最终版本被改为对从不吸烟者只筛查三次。经过13年的随访期,干预组观察到1213例肺癌死亡,而常规支持组为1230例(死亡率的相对危险度,0.99;95%CI,0.87-1.22)。亚组分析认为,性别或吸烟状况对结果没有影响。
鉴于证据的充分度和一致性,以及在PLCO试验中观察到的益处的缺乏,我们可以得出结论,无论性别或吸烟状况如何,胸部X线和/或痰细胞学检查作为肺癌筛查不能降低肺癌的死亡率。
应用低剂量螺旋CT进行肺癌筛查
假阳性结果
在肺癌筛查的大背景下,假阳性检查结果是一个特别的问题。最有可能接受肺癌筛查的人群,即重度吸烟者,如果有合并症(如慢性阻塞性肺疾病和心脏疾病),可能不适合某些诊断性检查。
当使用低剂量螺旋CT(LDCT)这一肺癌筛查方案进行评估时,必须对假阳性检测结果加以考虑。假阳性结果可能会导致焦虑和侵入性检查,如经皮穿刺活检或开胸手术。假阳性结果的百分比在不同研究中也不尽相同,这主要是由于阳性结果定义的不同(大小标准)、扫描断层的厚度(层厚较薄可检测出更多结节)和肉芽肿性疾病高发的地理位置的不同。一项关于使用CT扫描筛查肺癌的利弊的系统回顾分析指出,筛查检出结节后常进行进一步的影像检查,在21项筛查试验中,接受检查的受试者比例在1%~接近45%之间。2.5%~5%的患者接受了正电子发射断层扫描(PET)。 各种筛查试验中非外科活检或非外科操作的比例范围在0.7%~4.4%。各研究中接受活检的患者,最终结果为良性的比例也不同(6%~79%)。而这些筛查出结节者,手术切除的比例在0.9%~5.6%之间。这其中,6%~45%的患者在手术过程中发现了良性结节,由此可看出肺癌筛查的潜在危害。全国肺癌筛查试验(NLST)发现,在诊断为肺癌的患者中,大部分重大并发症与侵入性操作和手术相关,其中重大并发症的发生率为14%。此外,每10,000名诊断为有良性结节的患者中会有4.5名出现并发症,且会有4.1名患者因此死亡。NLST中并发症的发生率可能不能扩大到一个社区;NLST的参与者比适合接受筛查的美国烟民和前烟民年龄更小,教育程度更高,并且当前吸烟者更少(因此更加健康)。值得注意的是,82%的参与者是在大型学术医疗中心纳入的,其中76%进入了美国国家癌症研究所指定的癌症中心进行试验。这也许可以解释NLST的并发症发生率和手术致死率(1%)为何如此之低,这也导致了多学会意见书强烈建议在那些拥有与NLST相同的病患管理资源的中心开展筛查。
在前列腺、肺、结直肠和卵巢(PLCO)癌症筛查试验中,肺癌假阳性在所有阳性筛查结果中占98%。考虑到吸烟状况的影响,研究者发现假阳性筛查结果的百分比(在所有阳性筛查结果中)最高的是从不吸烟者(>99%),最低的是当前吸烟者(95%)。吸烟状况调整后,假阳性筛查结果的比例不存在性别差异。
过度诊断
一个不太被人熟知的危害是过度诊断,有些病症如果不是被筛查发现,将不会出现明显的临床症状。如果患者没有被诊断为癌症,病人可能会死于其他疾病。但是经过LDCT筛查,本不该被诊断为癌症的患者可能会被过度诊断,并需要接受一些相关操作处理(例如肺叶切除术、化疗和放射治疗)。尸检研究表明,大量的人死后才会发现患有肺癌,而不是死于肺癌。一项研究指出,约六分之一的肺癌是由尸检发现的,生前在临床上并未发现。这个数据可能被低估;由于尸检范围的限制,许多CT检测出的小肺癌可能不会在尸检报告中记录。日本的一些研究提供了更多证据并表明,LDCT筛查可能会导致大量的过度诊断。确定与CT筛查肺癌相关的过度诊断的量级还需要进行更多研究。然而,一项研究使用了指数模型和连续CT图像扫描,估测了61例肺癌的体积倍增时间。病灶分为以下三种类型:
?G型(磨玻璃影)。
?GS型(局灶玻璃样变,中心为实性结节)。
?S型(实性结节)。
G型、GS型和S型的平均体积倍增时间为813天、457天和149天。在这项研究中,每年一次CT筛查发现了大量缓慢增长的腺癌,这些腺癌在胸部X线不可见,并可能导致过度诊断。
一项超过5000人的筛查试验对癌症中被认为是过度诊断的比例进行了评估。体积倍增时间被用作过度诊断的指标。在手术切除前,体积倍增时间超过400天的癌症患者被认为是过度诊断。研究人员发现,那些最终被确诊为肺癌的患者中有25%满足了惰性筛查结节的标准,这意味着该试验中有四分之一的癌症是过度诊断。乳腺癌的过度诊断率也与之相似。这个比率与以往的胸片筛查试验及其他实体肿瘤试验的研究结果一致。NLST的过度诊断率尚未计算,但该研究的数据显示,LDCT组与胸片组相比肺癌过度诊断的病例数相差约120例,不过这还需要长期随访支持。丹麦肺癌筛查随机试验发现了一些有关LDCT筛查导致过度诊断的其他证据。在10年的随访期后(最后一次筛查的5年后),筛查组诊断出的肺癌几乎是对照组的两倍(1000人-年中新发病例为5.1例 vs 2.7例;共4,104名参与者在两组中肺癌患者为100例 vs 53例);大部分肺癌为很早期的腺癌,两组中III期和IV期癌症的例数没有明显的统计学差异。
梅奥肺计划(MLP)的一项随访期约20年的队列研究表明,通过高强度胸部X线和痰细胞学检查诊断出的肺癌有17%为过度诊断;干预组共诊断出585例肺癌,而常规支持组则诊断出500例。PLCO的一项随访期13年的队列研究发现干预组共诊断出1,696例肺癌,而常规支持组则诊断出1,620例。这表明,每年一次胸片检查会导致约6%参与者被过度诊断为癌症,虽然这一比例与0%没有显著的统计学差异。
诊断性操作并发症
在PLCO中,诊断评估发现至少有一次阳性筛查结果的参与者中有0.4%出现了诊断操作相关并发症。这69种并发症中最常见的为气胸(29%)、肺不张(15%)和感染(10%)。
肺癌致死率增加
从MLP的研究结果可以看出,高强度的胸部X线和痰细胞学检查筛查方案有可能导致肺癌致死率增加。经过20年的随访期,最终得出的肺癌致死率在干预组为每1000例参与者有4.4人死亡,而常规支持组为3.9人。两组间没有统计学差异(P =0.09)。在约翰·霍普金斯大学和纪念斯隆-凯特琳进行的研究显示,干预组的致死风险没有增加(相对危险度[RR],0.88;95%置信区间[CI],0.74-1.05),而在PLCO也是同样的结果(RR,0.99;95%置信区间,0.87-1.22)。
放射线暴露
LDCT筛查的另一个潜在风险是放射线暴露。LDCT的平均暴露剂量是非常低的,为1.5 mSv。据估计,经过3年的筛查,NLST参与者受到的平均辐射量为8mSv(包括筛查和检出结节后进行的其他辐射性影像学检查)。根据放射线暴露和患癌所建立的模型来看,对于加入如NLST的筛查项目的参与者,每2500次筛查就可能导致一例死亡,虽然筛查的好处(每320次筛查可避免1例死亡)远远超过它带来的风险。对于较年轻和那些没有明显肺癌风险的人群来说,筛查放射线暴露导致肺癌的风险可能要超过避免死于肺癌的筛查益处。
应用胸部X线和/或痰细胞学检查进行肺癌筛查
除了上文提到过的,痰细胞学检查或痰细胞学检查联合胸部X线组合方案相关危害的数据尚未被报道过。