下一代测序(NGS)技术使快速读取患者DNA中成千上万的碱基序列成为了可能,NGS的快速崛起为遗传诊断开启了一个崭新的时代。然而,新技术的发展也带来了巨大的挑战,包括技术水平、数据管理和检测结果的解释与咨询三方面带来的挑战。将NGS数据应用于诊断领域之前,尚且还有很多问题需要解决。
在这种背景下,EuroGentest和欧盟人类遗传学会对基于NGS的遗传病诊断进行评估和验证,并制定了NGS诊断指南。该指南经过实验室遗传学家、生物信息学家、临床遗传学家、企业界和患者代表及其他人类遗传领域相关人员的共同讨论,最终由实验室遗传学家和生物信息学家制定。该指南可做为补充材料,帮助诊断实验室有效应用NGS技术并指导NGS的资质认证。
该指南主要针对罕见病和单基因疾病的NGS诊断,主要专注于基因panels的靶向分析、特定的捕获分析以及从全外显子测序中提取可用数据。理论上或许很快就能从全基因组测序中提取类似的信息,在这种情况下,该指南将仍适用,但由于全基因组测序还能检测到其他疾病的分子特性,因此测序深度应当相应延长。该指南涵盖了过去几年关于NGS的指导方针,但比旧版多了一些新见解,其中最重要的新特性是NGS诊断测试的“评价系统”。
该指南在三次NGS与诊断的重大讨论会中生成。第一次研讨会于2013年2月25日-26日在比利Leuven举行,2013年3月7-8日在EuroGentest科学大会上NGS指南初步意见形成;第二次讨论会于2013年10月1日-2日在Leuven举行,主要对NGS诊断指南进行编写,2013年11月21日-22日在Nijmegen敲定该指南;第三次讨论会中,邀请了更多的相关人员参与,他们被邀请对指南进行评论并作评述报告,指南出版前递交欧洲人类遗传学董事会审核,最终该指南于2015年7月正式通过审批并刊出,并获得了基因诊断联盟的高度称赞,对欧洲NGS诊断产业的质量监督有重要意义。
该指南从目前发展水平、诊断/临床的效用、知情同意书及对患者和医生的通知、验证、报告、研究与诊断之间的区别六个方向做了38个声明,并发表于《欧洲人类遗传学杂志》上。
一、目前发展水平
从某种意义上说,由于技术发展迅猛导致了NGS平台出现不稳定的现状。然而,这不能作为阻止NGS应用于诊断领域的理由,因为NGS给患者带来了潜在的利益。阻止NGS过早用于诊断的原因只能是其质量差,未通过验证就进入临床诊断对患者而言具有威胁性,同时也是不可接受的。
声明1:未根据最新指南要求进行可接受性验证测试,NGS不应进入临床实践中。
诊断测试的目的是排除还是确认诊断应事先定义好,因为排除和确诊的区别很重要,这种区别主要取决于测试的完整性和授权性,不仅仅涉及测试技术的不同设置还包括诊断的不同意见。
声明2:实验室必须确定即将进行的测试是用于排除诊断还是证实诊断。
二、诊断/临床的效应
NGS应用于诊断领域最大的优势是可在相对短的时间内和相对低的成本下检测多个基因,从而得出更多的分子诊断信息。NGS的局限性在于其对平台及浓缩方法的依赖,且一直以来认为浓缩方法和测序平台容易受影响,因而额外的测试对高质量诊断来说很重要。
声明3:测试或分析的目的和实用性必须在验证起始时进行讨论,且验证报告中应包括摘要总结。
诊断的效率必须明确,因为致病变异的概率被标识了才能做出相应的分子诊断。这个概率值由病人群为单位进行计算,从临床角度确定了NGS的性能,是反应测试效率和临床应用的很好指标。
声明4:当诊断实验室考虑引进NGS监测时,首先必须考虑它的诊断效率。
在实践中,诊断实验室将提供更好的基因panels,在开发诊断测试时必须确定将一个基因移植到panels上所需的条件。在理想情况下,该问题应以多学科的方式进行一级处理,目标是编译用于诊断的基因列表。
声明5:出于诊断目的,只有异常基因型和与病理相关的已知基因(发表或证实过的)才能纳入分析中。
一直以来人们都将与身理缺陷相关基因称为“核心基因”,从Sanger技术发展NGS技术,测序的灵敏度不应降低。例如BRCA1和BRAC2基因,Sanger测序技术结合缺失/重复分析可使灵敏度达99%,以此类推该方法对其他基因的诊断效率也应该很高。理论上增加其他基因的检测会增加诊断率,但不应以牺牲原有的突变检测为代价。检出率的提高是决定核心基因检测列表和处理缺口的关键因素。
声明6:出于比对,为了避免不负责任的测试,为了患者的利益,“核心疾病基因列表”应由临床和实验室专家制定。
若不考虑本指南,实验室可用不同参数的NGS检测(技术和诊断)。事实上,有太多的变量无法通过固定的指南来指导检测。因此我们为NGS检测提出一个简单的评分系统,该系统可公平打分并对不同实验室提供的NGS检测进行简单比对。
A类检测:实验室保证编码区和内含子区序列的可靠内参或识别变体大于99%,并用Sangger测序(或其他互补的测序分析)进行缺口填补,根据所使用的平台,选择额外的分析,如进行均聚物延伸的分析。
B类检测:实验室能正确描述哪些区域能在可靠内参或识别变体大于99%的条件下测序,并用Sangger(或其他)测序方法进行缺口填补。
C类测试:C类测试仅仅基于NGS的试验,没有额外的Sangger(或其他)测序试验。
声明7:简单的评分系统基于检测覆盖面和诊断率,可对不同实验室提供的检测进行比较。
三、知情同意书及对患者和医生的通知
基于NGS的诊断取决于实验室所用的程序、平台、数据过滤和数据储存。至关重要的是,咨询医生应当被完全告知检测的局限性及检测可能出现的不良影响。
声明8:实验室提供的每个NGS检测应明确以下几点:明确目标疾病,明确所检测的基因名称,明确可报告范围,明确分析敏感度和特异性,如果可以,还应明确与临床表型无关但与所检测的基因相关的疾病。
NGS诊断的应用性主要依赖于直观结果和二次结果。尽管直观结果可从与检测疾病相关的基因信息中获得,但二次结果却隐藏在与检测疾病无关的疾病基因中。
声明9:诊断实验室的分析途径应聚焦于处于调查研究中的基因pannel以避免二次结果的发生,并进行相应的验证。
直观结果在基因pannel中的概率很低,一般依赖于疾病基因。然而,检测结果还有可能反映出隐性杂合突变,根据此还可判断疾病的携带状况。这将对后续的咨询、生育选择等产生影响。
声明10:实验室应该提供直观结果的信息。
在执行NGS诊断检测之前,临床(遗传)中心需要建立一个“直观结果和二次结果的协议”,该协议必须与伦理委员会的意见相符,应明确——在实验室、研究所或国家层面上——除了最初的诊断结果,患者对检测出来的额外结果的告知是否有选择决定权,还应详细说明检测直观结果与疾病携带状况是否出现在检测报告中。实验室必须确保能妥善管理协议中的每一条选项。
声明11:关于与目标疾病无关的其他疾病携带状态和二次结果是否被告知的选项协议,如果临床中心或实验室决定为患者提供,那么该协议应该包含所有的逻辑性。
此外,检测前遗传咨询是必要的,且应包括预期结果和潜在的直观结果与二次结果的讨论,并提供足够的信息。
声明12:应让患者清楚当地对直观结果与二次结果的管理政策。
声明13:建议给患者提供一份书面说明书或在线可用信息说明。
四、验证
样品的质量与许多参数有关,包括数据的产量、PCR拷贝和覆盖的比例。在诊断设置中,只有好的样本才是必须分析的,因此对高质量的目标基因pannel、外显子或基因组的标准定义十分必要。
声明14:应准确描述诊断程序中所有的NGS质量测量指标。
NGS技术要求监测特定的run和特定分析/样本的特性。监测数据无需做成报告但可用于后续的验证。
声明15:诊断实验室应对平台、所有的分析和所有的样本设置一个相关质量度量结构化数据库。
由于NGS工作流程非常复杂,因此应建立样本的追踪方法,包括在实验室和计算分析中实施并联法。
声明16:在评估分析处理中包括平台验证过程应建立样本追踪方法和设置样本识别条形码。
在平台验证过程中,实验室必须确保所有的设备和试剂都与制造商的要求相符。必须明确每种技术的局限性,并在开发测试和数据分析中将其考虑在内。实验室必须能区分附属于平台、特殊检测或分析流程的特性。
声明17:平台验证应包括精准度和精密度,且通过验证的平台工作结果无需其他方法来重复验证。
显然每种测序技术都存在着优缺点,生物信息学工具必须能反映这些特征。
声明18:生物信息学流程必须针对所使用的技术平台。
在流程的验证期间,诊断规范必须通过敏感和特性的分析评估。例如,SNP检测最佳化的算法对(小片段)插入/删除的检测准确性不高。实验室必须证实意识到这些特性以及所使用的变异检测流程能满足当前诊断分析。
声明19:在不同的流程验证中,必须为每种类型的变异建立敏感性和特异性分析。
任何化学成分的改变、浓缩方法或生物信息学分析平台应该保证后续的有效性。
声明20:诊断实验室必须验证所有的生物信息学流程(公用工具或商业软件包)的标准信息设置,以确保相关数据更改后(新版本)及时跟进。
包含所有相关变异的本地数据库提供了识别特定工作平台的工件、跟踪验证结果、提供特异性位点数据和meta-分析交换代理(exchange proxy)的重要工具。通常这个数据库应允许进一步注释(假阳性、已知突变、隔离变体等),这将大大简化诊断过程。
声明21:诊断实验室应使用当前注释相关变异体的结构化数据库。
数据存储应使用标准的开放性格式如FASTQ、BAM或VCF,这些格式的数据可与其他实验室共享。当存储分析结果时,应额外保存完整的日志文件。日志文件应尽可能完整以保证FASTQ数据转换为整个诊断报告的可复写性。遗憾的是,关于如何存储目前国际上还没有共识。然而,存储必须符合国家的需求和常识。
声明22:诊断试验必须对所有相关数据的长期存储采取相应措施。
在启动任何试验之前,必须确定好临床目标(包括编码区和保守的剪接位点),临床目标取决于诊断测试与所定义的基因pannel。
声明23:可报告范围必须在测试开发过程中确定,且对临床医生具有可用性(报告或传达数字)。
声明24:“可报告范围”的要求取决于诊断分析的目的。
例如,外显子测序分析的目的是获得高效率的诊断,不需要进行额外分析来获取所有基因组所覆盖的信息,但需要与临床医生清晰沟通这种测试方法不能用于排除特定的临床诊断。诊断测试必须进行准确性、灵敏性和特异性的分析评估。原则上,这些评估并不是新颖的,且被认为很麻烦,但ISO标准对其的要求十分严格。
声明25:当测试发生重大变化时,必须对质量参数进行检查,且必须重新上样检测。实验室应事先定义好当测试方法更新或升级后哪种类型的样本要重新分析及分析次数。
五、报告
NGS检测结果报告的清晰性和一致性至关重要,因为实验室的报告可能被专家和非专家阅读。从实用的角度来看,临床上的重要结论、相关测试和测试质量数据应写在报告的首页。
声明26:NGS的分析报告应该对患者的鉴别诊断进行总结,简要描述测试,总结结果,将主要结果放于报告首页。
所有致病(5类)或可能致病(4类)的变异必须包含在报告中,由当地政策决定是否报告未分类的变异(UVs-3类),且实验室科学家及临床医生必须清楚UVs-3类。
声明27:关于基因变异报告的当地政策(符合国际建议)应由实验室在分析之前建立和制定。
声明28:必须收集UVs数据,最终目的是将这些变异体进行分类。
需发起收集和分享可用信息的群体活动,最终目的是将变异体绝对分类为致病性(5类)或良性(1类)。被实验室或研究所采纳的与直接结果和二次结果相关的政策必须体现在实验室的实践和报告中。
声明29:在启动检测之前,实验室应有一个关于访问直接结果和二次结果的明确协议。
诊断实验室不应该因旧数据的分析请求而超载。诊断请求应是包含合适时间与合适地点的合同,诊断试验只能在给定的时间提供已知的和经过验证的信息。
声明30:一般情况下实验室不会系统性地重分析旧数据并生成新报告,即使与疾病相关的核心基因发生了变化。
但在特殊情形下(该情形由疾病的实验室或社区专家决定,如变体类型发生变化时),实验室有责任重新分析数据,在新证据的基础上生成新报告,并重新联系相关临床医生和患者,告知变异新状态可能带来的影响,这种情况下,建立病人与变异体的有效连接系统十分有必要,该系统在变异体重新分类时可对受影响病例进行检索。
声明31:为了管理疾病变异体,实验室必须建立本地变量数据库,为不同疾病的检测提供临床依据。
六、研究和诊断之间的区别
随着全基因组测序在研究和诊断领域的可能性增加,两者之间的界线也越来越模糊,因此描述对患者诊断数据的用途以及确定特定类型的分析研究是必要的。然而,这并不排除对诊断结果进一步研究的建议,但研究与诊断之间的区别必须时刻保持清晰。
声明32:任何诊断测试都是为了回答与患者医疗条件相关的临床问题。
声明33:研究测试是一种驱动假设,结果可能仅限于参与研究的患者的临床效应。
声明34:通过分析外显子或基因组得出的诊断测试结果可假设生成。
在诊断过程中,使用NGS技术获得的外显子测序和基因组数据是可以接受的,如果目标是获得一个遗传诊断那么检测将局限于与该疾病相关的已知基因。
声明35:当以单一患者的诊断为的目的诊断检测应在获认可的实验室中进行。
当参与一个研究项目时,患者及其家庭必须意识到这个项目可能会披露其遗传性疾病的信息。在研究中,临床相关的结果必须在诊断确定后才能纳入患者的医疗记录中。
声明36:研究结果必须在通过认证的实验室确定后方可转移至患者身上。
大多数实验室都建立本地测序/分析样本变异频率数据库以便易于进行变异解释。这类数据库不包含任何敏感的信息。出于隐私原则考虑,不掂量这些数据对诊断和医疗改善的重要性。
声明37:所有来自健康个体的诊断测试或研究测试的变异频率都应共享。
理想情况下,疾病检测中所有与基因相关的变体应该提交至致病性变异数据库,并与患者的临床数据相结合。用于变异体分类的标准和参数应清楚描述。