最初发布于2017年8月3日,最后更新于2021年4月6日,作者是威尔·阿诺德。
2017年为所有进入的质粒引入NGS对Addgene来说是一个巨大的改变——我们使用Sanger测序进行质量控制已经超过10年了。现在,多亏了赫什家族慷慨的捐赠,我们能够采取更大的所有权与内部测序的过程!除了测序质粒,我们还开始使用NGS来检查我们提供的其他服务的质量,包括病毒的家庭作业和集中库。
任何曾在NGS平台上进行DNA测序的人都会告诉你,尽管测序过程已经变得更加精细和方便,但要想完全拥有这个过程仍然是一项艰巨的任务。首要任务是确保这种转变不会影响我们向请求的科学家提供高质量数据的能力!
Addgene的新内部NGS流程
首先,这一过程是通过使用我们的高通量DNA分离过程,产生高质量的分离DNA样本,有足够数量的测序。这一过程是完成在一个板格式产生任何地方从两个到六个板96个样品每周。这将是我们的新进程开始的地方。与seq合作,我们正在使用plexWell技术轻松快速地创建Illumina测序库。从开始到完成文库准备过程只需要大约一天,甚至是6个盘子(576个单个质粒)!然后将这些文库进行质检、汇总,并为Illumina测序准备我们新捐赠的MiSeq。
对于完整质粒测序,我们在MiSeq上进行了2x251次运行,大约需要两天时间完成。运行完成后,我们开始组装过程。再次,感谢我们的合作伙伴在seqWell我们利用一个管道,每个样本的原始数据池和单独组装读取到一个FASTA序列我们QC的科学家可以很容易地分析(见下文为我们寻找在分析质粒序列)。
与Addgene的所有事情一样,这个新过程的每个部分都涉及到大量的质量控制。首先,我们对每个分离的质粒样品进行Picogreen定量,并将其归一化至10倍范围内。不符合这一范围下限的质粒被“失败”,并从培养皿中取出再次制备。然后,这些孔被我们队列中的其他样本填满,比如用于病毒基因组测序(VGS)的病毒样本。质控贯穿于整个文库制备过程,包括Picogreen对各个中间步骤的定量,电泳凝胶的大小,以及最终文库的qPCR定量。
整个质粒的更广阔的视野
为了确定质粒的序列,我们检查了三件事:
- 将NGS结果与参考序列比对以确认主干元素。
- 通过对齐NCBI入口或使用BLAST来确认基因/插入物。
- 确认标签和融合蛋白。
我们将在下面分解这些步骤。
调整顺序
当我们对新沉积的质粒进行质量控制时,第一步是将NGS结果与参考序列(如已知的主链序列)进行比对。我们并不一定期望一个完美的匹配-我们经常会在复制的起源或其他共同的主干元素中发现一些不匹配。因为我们已经成功地培养了质粒,为测序做准备,我们相信这几个微小的不匹配通常不会影响质粒的功能。
确认插入物
我们通常将插入物确认完毕爆炸或通过直接对准NCBI参考序列或由储户提供的序列。存储实验室通常提供插入序列或注释的基因库文件,这些对更复杂的质粒很有用,比如那些包含没有公开参考序列的合成区域的质粒或含有许多修饰基因的质粒。我们寻找可能损害功能的点突变、截断和插入。当我们确实发现突变时,我们检查它们是否会影响翻译的氨基酸。我们也证实了基因的种类与质粒相关的数据相匹配。
确认标签和融合蛋白
最后,我们利用Snapgene对启动子、标签、融合蛋白和可选择的标记进行识别。如果我们发现的信息不同于我们所期望的存放实验室提供的数据,我们称之为“质量控制(QC)问题。”然后我们询问存放实验室检查差异。如果存放实验室确认这些差异是预期的,并且不会影响质粒的功能,我们将更新质粒页面上的信息。
有时我们会遗漏一个质粒
正如我们在以前的文章,存在一些质粒的区域,特别难以序列和组装,包括GC富含和重复的区域。由于这些问题,一些质粒的NGS不会导致一个完整的圆形大会。大多数情况下,这些质粒作为一个或两个部分组件返回。
我们已经见过一些质粒元素由于它们的序列一直难以组装。例如,CAG启动子是一个由CMV增强子、鸡β肌动蛋白启动子和兔β球蛋白剪接受体组成的杂交启动子,包含的序列GC超过80%。一些IRES序列也包含GC丰富的区域。当我们分析含有这些元素的质粒的NGS结果时,我们将删除受影响的区域,并将序列呈现为线性的、部分的测序结果。
病毒准备和集合库
除了定期质粒测序外,你们中的许多人将熟悉我们为确保获得高质量、随时可用的病毒制剂和汇集文库所做的努力。
病毒样本被填入与我们正常的完整质粒测序(CPS)工作流程相同的流程中,并产生足够的数据来捕获整个病毒基因组。该工作流及其分析的详细信息可以在这里找到:一种新的下一代测序和分析平台,以评估重组腺相关病毒制剂的身份从病毒DNA提取物。
对于NGS的QC来说,池化库更具有挑战性,因为它们常常是不同的库。它们与CPS过程的不同之处在于,我们没有对池中的所有质粒进行完全测序,而是选择性地对池中质粒的可变部分进行测序,例如CRISPR文库中的gRNA。总的来说,我们的QC科学家与沉积实验室合作,开发一种适用于相关文库的PCR策略。我们将订购能放大文库插入内容的引物。该PCR步骤还为Illumina测序添加了必要的适配器序列,以及每个样本的独特条形码,这样我们就可以为正确的样本分配测序reads。然后进行PCR,根据需要进行优化,并使用标准PCR清除试剂盒清除任何模板DNA和引物。
在对该示例执行了广泛的QC之后,我们将把它加载到新的MiSeq中,并设置运行,确保为每个示例注意到适当的条形码。大约24小时后,我们从仪器上卸载FASTQ数据并开始分析。我们使用了Python程序的修改版本容等人,2017,我们希望在不久的将来将其作为OpenBio存储库的一部分。呆了!
参考
Guerin K,“政府改造”,布尔日D,人我,Haery L, Harten DeMaio K,桑德斯E, Tasissa M, Kostman M, Tillgren M,汉利的马卡拉L,穆勒,Mitsopoulos,风扇M(2020)小说下一代测序和分析平台评估重组腺相关病毒制剂的身份从病毒DNA提取。人类基因治疗31:664-678。https://doi.org/10.1089/hum.2019.277
Joung J, Konermann S, Gootenberg JS, Abudayyeh OO, Platt RJ, Brigham MD, Sanjana NE, Zhang F(2017)全基因组规模CRISPR-Cas9敲除和转录激活筛选。Nat协议12:828-863。https://doi.org/10.1038/nprot.2017.016
留下你的评论