进展综述:用于基因工程和合成生物学的CRISPR-dCas应用工具箱(作者是dCas9应用权威:亓磊和他的博后徐晓庶)
2023-02-15
摘要:
可程序化控制基因表达对于理解基因功能、细胞行为和开发治疗方法至关重要。 除了由核酸酶CRISPR-Cas9和CRISPR-Cas12a的基因编辑应用之外,核酸酶失活的Cas分子(dCas9和dCas12a)的发明提供了用于精确控制基因组功能而无需基因编辑的平台。目前已经开发的多种dCas工具,构成了一个工具箱,可进行基因功能研究和调节细胞行为。本综述总结了dCas工具在转录调控、表观遗传工程、基因组成像、遗传筛选和染色质免疫沉淀方面的应用。 本文还强调了当前dCas工具在基因工程和合成生物学方面的优势和现有挑战,并提供了有关未来方向和应用。
摘译文章:X. Xu, L. S. Qi, A CRISPR-dCas Toolbox for Genetic Engineering and Synthetic Biology. J Mol Biol, (2018).
1背景
能够程序化控制基因表达的工具对于基因组功能的研究和合成生物系统的实施是有价值的。作为一个跨学科领域,合成生物学正在成为一种普遍的“前向工程”方法,用于研究复杂细胞行为如何从简单的生物学部分中产生。虽然早期的合成生物学工作主要集中在微生物(细菌或酵母)工程,但最近的工作旨在扩展合成生物学以理解和设计哺乳动物细胞系统。因此,需要能够非常有效且精确地控制哺乳动物基因组中的基因表达的工具。
包括锌指和转录激活因子效应物(TALEs)在内的蛋白质是第一批基因编辑工具。然而,这些分子通过DNA蛋白质相互作用起作用,需要对不同基因组序列的不同蛋白质进行费力的工程改造。当然,锌指或TALE工具的开发为基因编辑时代的研究人员做了铺垫。因此,CRISPR迅速发展成为一种强大的基因编辑工具,这并不奇怪。
阐明CRISPR-Cas系统的机制使工具开发成为可能。 CRISPR系统是针对外源DNA或RNA的获得性免疫系统,其存在于40%的细菌和几乎所有的古细菌中。 CRISPR-Cas系统根据Cas蛋白效应物分为两类和六型。第2类CRISPR系统对基因编辑特别适用,它使用单个核酸内切酶蛋白Cas9(II型)或Cas12a(以前称为Cpf1,V型),RNA引导DNA的切割。高效(需要快速消除入侵的DNA),高特异性(需要区分自身与外源DNA)以及RNA引导的DNA识别特征使这些系统成为多种生物中基因编辑应用的最佳选择。
Cas9和Cas12a内切核酸酶均通过设计碱基配对sgRNA(crRNA)诱导靶DNA的双链断裂。双链断裂通过非同源末端连接(NHEJ),微同源性介导的末端连接(MMEJ),同源定向修复(HDR)或这些途径的组合触发宿主DNA修复途径。 DNA修复导致基因缺失、插入或修饰的过程。
除基因编辑外,CRISPR-Cas系统已被用于可编程的靶向基因调控。我们和其他人已经开发出核酸酶死亡(失活)的Cas9(dCas9)分子,该分子能够实现转录调控、表观遗传修饰、DNA循环、基因组成像以及其他应用。使用基于dCas9或dCas12a的分子控制基因表达的能力提供了广泛的“基因开关”,可用于研究基因和功能的关系、表征非编码基因和调控元件的功能。它也提供了设计合成基因电路的强大策略。因此,dCas工具构成了研究生物学和工程生物学的工具箱,这种方法我们称之为“基于发现的合成生物学”。
我们的目标是提供有关最新CRISPR-dCas平台的概述,以及在哺乳动物系统中的应用。特别是,两个方面:(1)生物工程策略,以重新利用dCas系统的多种用途,包括转录或表观基因组工程,和基因组成像,和(2)使用dCas工具,包括遗传筛选和染色质免疫沉淀。我们还总结了dCas平台的优势,挑战和未来发展方向。
2使用dCas系统进行可编程基因调控
第一代dCas融合蛋白作为CRISPR干扰和CRISPR激活工具
作为RNA引导的DNA结合平台,可将dCas9用于调节转录。尽管Cas9是一个大的多结构域蛋白,早期工作显示通过点突变失活Cas9中的两个核酸内切酶结构域(切割靶DNA链的HNH结构域和切割非靶DNA链的RuvC结构域),使得核酸酶失活的dCas9仍然可以与DNA结合。我们的早期发现证明,dCas9可以通过在编码序列上空间阻碍启动子上的RNA聚合酶活性或RNA聚合酶活性来抑制靶基因的转录。 dCas9抑制基因表达的这种用途被称为CRISPR干扰(CRISPRi)。由于大多数原核生物缺乏RNA干扰途径,CRISPRi为原核生物中靶向基因沉默提供了一种易于使用的方法。
提高真核细胞中靶向基因调节的效率。将各种转录效应结构域与dCas9融合以测试任何效应是否可导致哺乳动物细胞中更好的抑制或激活。抑制效应结构域与dCas9融合,包括Kox1的KRAB结构域、Hes1的WRPW结构域,HP1α的CS结构域、SID4X结构域。在这些结构域中,dCas9-KRAB融合体在靶向基因抑制中表现出相对一致和稳定性。对于激活效应结构域,包括单纯疱疹病毒蛋白16(VP16)的反式激活蛋白结构域,将VP16(VP64或VP160)或核因子κB的反式激活因子结构域(p65)与dCas9融合。早期工作使用VP64证明了有一定程度但不是很大的激活效应,被称为CRISPR激活(CRISPRa)。这些简单的融合分子工具共同构成了第一代可编程dCas基因调控工具箱。
通过复杂蛋白质和sgRNA工程的第二代更有效的dCas工具
目前已经设计了许多策略来提高dCas的效率,特别是对于CRISPRa的研究。沿着启动子平铺多个sgRNA使得有更好的基因激活作用。该观察结果启发了一种方法,该方法将转录结构域的多个拷贝融合至dCas9以扩增激活信号。
Tanenbaum等开发了dCas9-SunTag系统。其中dCas9与多聚体肽阵列(SunTag)融合,每个肽与一个与VP64融合的单链可变片段(scFv)结合。与募集相同反式激活因子的多个拷贝的SunTag系统相反,协同激活介质(SAM)系统将dCas9-VP64与含有两个MS2发夹的修饰的sgRNA组合:每个MS2发夹与一个MS2结合蛋白(MCP)相互作用。在名为dCas9-VPR的第三个系统中,dCas9与筛选的协同作用三联活化剂融合,其由VP64,p65AD和Epstein-Barr病毒R反式激活因子(Rta)组成。之后设计了更多变体,包括将SAM与SunTag结合,或使用SunTag系统招募p65AD-HSF1而不是VP64(SPH)。与SunTag,SAM或VPR相比,这些系统的表现仍然是一个问题,需要对不同基因和不同细胞类型进行比较和评估。
第三代合成dCas输入/输出分子器件
基因表达的配体诱导控制是理解时间和空间表达模式的有效方法,并且是工程师设计者细胞,可以检测输入信号并产生功能输出。通过外部扰动(人类添加的外部配体)或自主方法(检测天然细胞或微环境信号的细胞)偶联dCas活性已成为开发更强大的CRISPRi / a工具以实现基因功能的空间和时间控制的目标。
已经报道了产生输入/输出(I / O)dCas9分子装置的两种主要策略:(1)将dCas9或split-dCas9偶联到化学或光遗传学感知结构域,和(2)将dCas9偶联到配体感应受体结构域。这两种策略都旨在通过dCas9将输入信号转换为可编程的转录响应。
为了感知合成输入,化学诱导的二聚化结构域(CID)或光遗传学诱导的二聚化结构域(OID)融合到dCas9及其各自的调节结构域(抑制或激活结构域),它们被作为两个独立的蛋白质表达 。
3dCas介导的表观基因组工程
哺乳动物基因组包含广泛的DNA或组蛋白上的表观遗传化学修饰,它们对染色质组织和基因表达有深远的影响。由于缺乏工具,理解表观遗传修饰与特定基因组位点基因表达之间的因果关系一直具有挑战性。与表观遗传酶结构域融合的dCas9已经能够进行基因座特异性表观遗传修饰。
DNA甲基化调节哺乳动物细胞中的许多生物学过程,并且是使用表观基因组工程对靶标的重要修饰。在哺乳动物细胞中,甲基转移酶DNMT3A和DNMT3B催化未甲基化CpG的甲基化,辅因子DNMT3L是DNMT3A的重要刺激因子。 dCas9分子已经与DNA甲基转移酶(DNMT3A)的催化结构域融合,这使得dCas9靶位点周围的CpG岛的位点特异性甲基化和附近基因的抑制。dCas9融合蛋白的组合,其中KRAB,DNMT3A和DNM3L结构域分别与dCas9融合,进一步允许靶内源基因的长期表观遗传沉默。如果为了激活基因,将去甲基化酶TET1的催化结构域与dCas9融合以诱导位点特异性DNA去甲基化,导致相关基因的上调。
dCas9-SunTag策略适用于靶向DNA去甲基化。将TET1融合到dCas9-SunTag系统的scFv结构域显示CpGs的去甲基化和胚胎干细胞,癌细胞系,原代神经前体细胞和小鼠胎儿体内靶基因的上调。
4dCas介导的基因组成像
dCas9系统已被开发为可视化活细胞基因组的工具。核中染色体的3D组织影响基因表达,重组和功能。已经开发了各种成像工具来研究染色质组织如何影响生物功能。大多数工具基于核苷酸碱基配对相互作用或蛋白质-DNA相互作用,或两者的组合,包括荧光原位杂交(FISH),一种使用荧光标记的寡核苷酸检测“死亡”固定细胞中DNA序列的方法。活细胞成像更具挑战性。使用与荧光蛋白融合的DNA结合结构域(DBD)的方法允许标记特定的基因组基因座。一些基因组基因座具有天然相关的特异性DBD,例如着丝粒和端粒;因此,通过将FP融合到DBD可以方便地将它们可视化。然而,大多数基因组序列缺乏特异性结合蛋白。因此,基于可编程DBDs的dCas9能够在细胞中的特定基因座处进行基因组成像。由于dCas9s可以通过改变指导RNA重新编程以靶向特定的DNA序列,因此该工具有望研究基因组在活细胞中的时空行为。
5CRISPR-dCas用于新的遗传元件和相互作用
遗传筛选可用于以高通量方式同时研究多个基因的功能。 CRISPRi或CRISPRa已用于进行大规模功能丧失或功能获得筛选。 将这些文库包装到病毒颗粒中,然后稳定整合到哺乳动物细胞的基因组中,每个细胞接受不超过一个sgRNA。 由于sgRNA被条形码化(或它们的DNA靶序列用作条形码),因此在表型选择后通过深度测序可以容易地确认它们的身份和相对富集。
6dCas染色质免疫沉淀用于发现基因组位点的相互作用元件
基因组DNA的免疫沉淀是阐明DNA如何与调节元件(蛋白质或RNA)相互作用的有用方法。以前,将DBD的DNA序列如LexA和LacI插入感兴趣的基因组区域。标记的DNA结合分子可以靶向细胞中的特定基因组基因座,其将在DNA结合分子与针对其标签的抗体的亲和纯化过程中被下拉。捕获的复合物可包括与靶基因组区域具有物理相互作用的DNA片段,RNA或调节蛋白。可以通过测序相互作用的DNA或RNA或蛋白质的质谱来分析这些遗传元件。
遵循类似的概念,已经开发了基于dCas9的染色体免疫沉淀以鉴定与特定基因组基因座相互作用的蛋白质。例如,一项研究描述了与干扰素调节因子-1启动子相互作用的蛋白质,其响应于干扰素-γ刺激。 除了蛋白质外,还可以使用dCas9染色质免疫沉淀技术检测与特定基因组区域相关的DNA和RNA,并与下一代测序和RNA测序配对。 最近,一项工作报告了一种称为CAPTURE的方法,其中将生物素化的dCas9与蛋白质组学,染色体构象捕获(3C)-序列和RNA测序相结合,以鉴定基因座特异性染色质调节复合物和任何位点的长程DNA相互作用。
6总结
CRISPR-Cas9作为RNA引导DNA结合的系统彻底改变了基因编辑。除编辑外,dCas9还提供了一个广泛的基因表达调控平台,并已在基于发现的合成生物学中得到开发。合成生物学研究的两个主要方面是(1)新工具的开发和(2)通过这些工具实现新发现。这两个者相互补充。利用遗传元件作为工具的新技术能够理解未知基因。作为回馈,新的发现可以提供更多的基因模块来开发新的强大工具。
目前,dCas9融合可以作为基因切换工具来执行各种不同的功能。然而,我们对基因组功能的内源调节机制的理解仍然有限。因此,在将来,有必要表征更多染色质相关分子以及特定细胞环境。这将有助于理解自然调节机制并为合成电路的设计提供信息。除了发现新的遗传元件和相互作用外,看看dCas9如何有助于理解表观遗传修饰,探索基因组的3D结构,以及描述表观遗传学,基因组组织和基因调控之间的因果关系,将会很有趣。在复杂和精细的细胞环境中,看到诱导型dCas9工具如何允许探索创建用于诊断和治疗的新型哺乳动物细胞功能将是有趣的。