2024 年诺贝尔生理学或医学奖联合授予了维克多·安布罗斯(Victor Ambros)和加里·鲁夫昆(Gary Ruvkun),以表彰他们发现了微小 RNA(microRNA)及其在转录后基因调控中的作用。
微RNA及其在转录后基因调控中的作用
当多细胞生物从单细胞生物祖先演化而来时,其体内的每种细胞类型都获得了特定功能,故而需要愈发复杂的基因调控机制。除了由作用于调控序列的 DNA 结合因子介导的转录水平的基因调控之外,随着复杂生物的演化,其他形式的控制系统也逐步出现。在漫长的数亿年时间里,编码微 RNA 的基因在多细胞生物的基因组中不断发展,以便在 mRNA 稳定性和蛋白质翻译水平上发挥转录后调控作用。
然而,直到 1993 年,维克托・安布罗斯和加里・鲁夫昆发现了微 RNA 及其基因调控方式,这些情况才得以被完全知晓。2024 年的两位诺贝尔奖得主对因 lin - 4 和 lin - 14 遗传位点变异而出现发育缺陷的突变秀丽隐杆线虫进行了研究:安布罗斯的实验室克隆了 lin - 4 基因,却惊讶地发现它并不编码蛋白质,而是编码一个由 22 个核苷酸组成的非编码 RNA。与此同时,鲁夫昆实验室发现 lin - 4 通过 lin - 14 的 3' 非翻译区(3'-UTR)中的多个元件对 lin - 14(一种核蛋白)进行调控。
通过对比序列信息,他们发现短链非编码 RNA lin - 4 与 lin - 14 对应基因的 3'-UTR 元件之间存在部分序列互补性。这首次揭示出一种在概念上全新的调控 RNA 类型 —— 微 RNA。2000 年,鲁夫昆实验室发现了高度保守的 let - 7 微 RNA,随后科学家们在包括人类在内的多种动物中进一步发现了同源的微 RNA。这一发现引发了动物界对微 RNA 的广泛克隆和测序研究,结果表明微 RNA 涵盖了一大类调节元件,控制着庞大的蛋白质编码基因网络。
安布罗斯和鲁夫昆的发现完全出乎意料,揭示了一种由微 RNA 介导的、在演化上保守的转录后调控机制,该机制在动物发育以及成年生物体的组织功能中起着关键作用。
基因的调控机制
生命能够掌控自身在何时何地转录基因、生成 RNA,并将其翻译为蛋白质,这是生物中一个极为基础的过程(图 1)。比如,胰岛素由胰岛中的 β 细胞产生,视蛋白则由视网膜中的细胞产生。针对不同细胞的精确特异性基因调控指令被编码在其遗传物质当中,并通过序列特异性的 DNA 结合蛋白发挥作用。弗朗索瓦・雅各布和雅克・莫诺因发现基因的调控机制,于 1965 年荣获诺贝尔生理学或医学奖。在单细胞和多细胞真核生物里,DNA 结合转录因子高度保守,而在多细胞生物体内则出现了额外的基因调控层级,以确保在任何特定时刻,每种细胞中都能正确地产生 RNA 和蛋白质。
图 1. 细胞类型特异性的功能调控。每个细胞都包含一套相同的染色体,因此具有完全相同的基因组。细胞类型特异性功能指的是,在每种不同类型的细胞中只有一部分特定的基因被激活。(图片来源:诺贝尔生理学或医学委员会。制图:Mattias Karlén)
真核生物模型在遗传研究中有着难以估量的价值,带来了众多意想不到的发现。半个多世纪以前,悉尼・布伦纳将秀丽隐杆线虫引入遗传学研究领域。这种生物每一代寿命较短,身体透明,又易于进行遗传操作,故而得到了广泛研究。布伦纳、约翰・萨尔斯顿和罗伯特・霍维茨借助这种线虫,揭示了在器官发育过程中,遗传基因如何控制细胞分裂、分化和死亡,他们也因此获得了 2002 年诺贝尔生理学或医学奖。
20 世纪 70 年代,布伦纳实验室通过对秀丽隐杆线虫进行突变筛选,发现了 lin - 4 突变体(e912)。这些线虫呈现出一些明显的表型,如许多细胞类型和形态结构完全缺失,例如因阴门发育失败致使卵子积聚(图 2),这似乎是由于一些特定细胞谱系的发育程序出现重复而引发的。
在 lin - 4 线虫突变体中观察到的显著发育中断表明,lin - 4 编码了发育时序中的一个主要调控因子。大量具有不同时序发育缺陷的异时性突变体被鉴定出来,其中包括霍维茨实验室发现的第二个突变体 ——lin - 14 突变体。
与此同时,安布罗斯彼时正跟随戴维・巴尔的摩研究脊髓灰质炎病毒基因组的结构与复制。在获得博士学位后,他加入了霍维茨实验室。身为博士后研究员,安布罗斯立即展开对异时性突变体的遗传分析,并发现 lin - 14 突变体有着与 lin - 4 突变体相反的发育时序缺陷(图 2)。在 lin - 14 突变体中,幼虫程序完全缺失。值得注意的是,安布罗斯后来发觉 lin - 4 是 lin - 14 的负调控因子。
在此期间,鲁夫昆在 Frederick Ausubel 的指导下完成了细菌遗传学博士学位。在欧洲游历期间,他学会了异时性突变体的细胞谱系分析,从而对线虫遗传学开始产生浓厚兴趣。随后,他与 Martin Chalfie 和霍维茨进行讨论,这更进一步激发了他利用秀丽隐杆线虫来研究这些问题的兴趣。1982 年,鲁夫昆开始在 Walter Gilbert 和霍维茨的实验室进行联合博士后研究。
发现微RNA介导转录后基因调控
在霍维茨实验室中,安布罗斯和鲁夫昆开启了他们漫长的克隆 lin - 14 的征程。那时,通过遗传学确定基因座的 DNA 序列是一项极为艰巨的任务。历经多年的实验,他们成功运用经典的限制性片段长度多态性方法确定了该区域。
在此期间,安布罗斯和鲁夫昆都获得了教职岗位:安布罗斯在美国哈佛大学任职,而鲁夫昆则在麻省总医院和哈佛医学院工作。他们专注于自己的研究问题,持续进行分子分析。鲁夫昆证实,lin - 14 是一种在发育过程特定阶段表达的核蛋白,在 L1 阶段(幼虫的第一阶段)表达量较高,而在 lin - 4 和 lin - 14 发生突变的个体中,其表达量会发生改变。有趣的是,研究人员发现了 lin - 14 的功能获得突变体,其 3'-UTR 区域存在缺失,致使 lin - 14 蛋白在 L1 阶段之后仍能被检测到。3'-UTR 元件的破坏对蛋白质序列并无影响。因此,鲁夫昆推测,一种作用于 mRNA 稳定性、核输出或翻译的转录后机制或许介导了 lin - 14 的时间切换。
与 lin - 14 有若干个突变体不同,科学家仅发现了一个 lin - 4 突变体(e912)。安布罗斯实验室着手通过限制性片段长度多态性和 DNA 印迹探针来克隆 lin - 4 基因。他们沿着染色体序列依次并反复测试较小的基因组片段,查看其能否挽救 lin - 4 突变的表型,最终精确定位了一个 693 个碱基对长的、被 SalI 限制性内切酶切下的片段。经过多轮开放阅读框(ORF)预测和克隆重测序后,他们排除了许多错误选项,随后开始怀疑 lin - 4 基因可能是一个非编码 RNA,因为它的 ORF 序列较短。他们将移码突变引入秀丽隐杆线虫的基因组中,结果并未影响 lin - 4 的功能,这证实了他们的怀疑。1991 年,他们通过 RNA 印迹法和 RNA 酶保护实验检测了 lin - 4 的转录本,发现了两个长度分别为 61 和 22 个核苷酸的短 RNA 转录物(图 3)。
图 3. 两种短 lin-4 转录物的鉴定。RNA 印迹法的实验结果,从左至右依次为野生型、lin-4 突变体和用 Sal I 片段挽救的 lin-4 突变体的总 RNA。研究人员用放射性标记的 lin-4 RNA 作为探针,并用 U6 作为对照。(图片来源:Lee, Feinbaum 和 Ambros, 1993)。
在分别解析出 lin - 4(安布罗斯实验室)和 lin - 14(鲁夫昆实验室)的序列后,1992 年 6 月 11 日晚,安布罗斯与鲁夫昆交换了 lin - 4 和 lin - 14 基因的序列数据。两人均注意到 lin - 4 非编码 RNA 与 lin - 14 的 3'-UTR 中的多个元素之间存在显著的部分互补性(图 4)。
在意识到这一观察结果的重要性后,两个实验室进一步开展了一系列实验,证实 lin - 4 微 RNA 是通过与位于 3'-UTR 上的元件碱基互补配对来调控 lin - 14 的 mRNA。他们的这一开创性发现于 1993 年发表在《细胞》杂志上,两篇论文以 “背靠背” 的形式呈现。
图 4. lin-4 和 lin-14 RNA 中的互补序列元件。通过比较 lin-4 和 lin-14 的克隆序列,他们发现了长度为 22 个核苷酸的 lin-4 RNA 与 lin-14 的3'-UTR 中的重复元件存在部分互补性。(图片来源:诺贝尔生理学或医学委员会。插图:Mattias Karlén)
基于秀丽隐杆线虫的 lin - 4 序列,安布罗斯实验室在其他线虫物种中鉴定出了包含 lin - 4 的克隆。这些实验显示,来自其他线虫的 lin - 4 克隆能够挽救 lin - 4 突变的秀丽隐杆线虫的表型。他们还筛选了超过 20000 个突变染色体,鉴定出了第二个 lin - 4 突变体(ma161),该突变体包含单个核苷酸突变。值得注意的是,这个突变位于互补序列内,进一步支撑了 lin - 4 微 RNA 与 lin - 14 的 3'-UTR 元件之间互补碱基的功能重要性。
鲁夫昆实验室则对野生型和 lin - 14 功能获得突变体中的 lin - 14 蛋白和 RNA 含量进行了比较。突变体中的 lin - 14 蛋白水平提高了 4 至 7 倍,而 RNA 含量没有差异,这表明 lin - 14 是在转录后水平(即 RNA 转录完成后)受到调控的。将 lin - 14 的 3'-UTR 转入报告基因后,报告基因的转录后调控与 lin - 14 相似,这表明异源 3'-UTR 足以控制 mRNA 翻译。进一步地,研究人员将 lin - 14 3'-UTR 的较小片段转入报告基因,直至识别出一个功能性的 124 个核苷酸长的 3'-UTR 片段。该 3'-UTR 区域包含多个与 lin - 4 部分互补的序列,并且该区域在双桅隐杆线虫(C. briggsae)中也是保守的。
通过对新发现的 lin - 4 微 RNA 与来自所有物种的全面核苷酸序列数据库进行计算分析,研究人员发现,与 lin - 4 相匹配的序列仅存在于其他线虫中,例如双桅隐杆线虫。于是,一个关键问题依然存在:微 RNA 的存在究竟是线虫特有的现象,还是在整个动物界中都具有深远功能影响的保守性特征呢?
保的let-7微RNA
首个微 RNA 基因 lin - 4 “亮相” 七年后,第二个微 RNA 基因 let - 7 也被发现了。鲁夫昆实验室开展了一项遗传筛选,重点聚焦于一类突变体,它们能够抑制 lin - 14 和 egl - 35 位点突变的合成不育表型。let - 7 编码一个由 21 个核苷酸组成的短链 RNA,该 RNA 与多个异时性基因的 3'-UTRs(包括 lin - 14、lin - 28、lin - 41、lin - 42 和 daf - 12)具有互补性。let - 7 的缺失会致使成虫重复出现幼虫阶段的细胞命运,这表明微 RNA 或许在调控细胞系形成的阶段特异性时序方面发挥着更广泛的作用。
下一个突破同样来自鲁夫昆实验室。他们发现,与 lin - 4 不同,let - 7 基因在多种动物中具有演化保守性。科学家将 let - 7 微 RNA 的序列与核苷酸数据库进行比对,结果在果蝇和人类中都找到了匹配序列。在秀丽隐杆线虫中,let - 7 的一个已知靶标是 lin - 41,这是一种在斑马鱼和果蝇中具有同源蛋白的蛋白质。令人欣喜的是,斑马鱼和果蝇 lin - 41 同源基因的 3'-UTR 均显示出与 let - 7 的互补性。此外,多种人体组织中也存在 let - 7 微 RNA,这表明 let - 7 与哺乳动物细胞的基因表达普遍相关。
与线虫类似,let - 7 微 RNA 在果蝇中也呈现出时序调控性,这表明 let - 7 在昆虫、甲壳类和线虫中具有保守作用。值得注意的是,科学家在软体动物和环节动物的成体阶段也检测到了时序性质的 let - 7 表达,而这些物种并没有幼虫阶段。此外,脊椎动物也没有明显的幼虫阶段,但在发育过程中也出现了时序调控的 let - 7 表达(包括在成年斑马鱼中的强烈表达)。令人印象深刻的是,在具有左右对称性的动物中,let - 7 的表达也是时序调控的,这种特性可能是在这些动物从双胚层物种(即从两个主要胚层发育而非三个,如人类和其他脊椎动物)分化后演化产生的(图 5)。let - 7 在演化上高度保守,极大地增加了人们对微 RNA 作为基因表达后转录调控因子的兴趣。
图 5. let-7 RNA 表达及微 RNA 的演化保守性。 左图:一个后生动物的演化树,突出显示了能检测到 let-7 微 RNA 表达(+)或没能检测到 let-7 微 RNA 表达(-)的物种分支。具有相似 let-7 RNA 表达发育模式的物种(早期阶段无 let-7 但成年期表达 let-7)用“Dev.”表示。右图:微 RNA 基因在多细胞生物的基因组中已经演化并扩展了超过 5 亿年。 (图片来源:诺贝尔生理学或医学委员会。制图:Mattias Karlén)
随着 let - 7 的被发现,借助小 RNA 克隆技术,多个实验室开始在人类及其他物种中探寻其他微 RNA。例如,Thomas Tuschl 实验室从人体和果蝇组织中克隆出新的微 RNA,David Bartel 实验室从线虫中分离出新的微 RNA,安布罗斯的实验室也进行了类似的研究。如今,这些综合证据极具说服力:动物界中存在大量调控性微 RNA,极可能在基因调控中发挥重要作用。分子生物学和测序技术的进步使得我们在人类基因组中已鉴定出超过一千种微 RNA 基因。目前,微 RNA 基因的数据库 miRBase 已涵盖超过 38000 个发卡前体和 48860 个成熟的微 RNA 基因序列,涉及 271 个物种;甚至在病毒中,科学家也找到了编码微 RNA 的基因。
由于更多微 RNA 的克隆以及全基因组序列技术的日益完善,科学家能够更好地找出微 RNA 与 3'-UTR 区域之间的碱基配对规则。David Bartel、Christopher Burge 和 Stephen Cohen 实验室提出了将实验和比较基因组学方法相结合的研究规范,专门用于识别微 RNA 靶标。这些研究表明,微 RNA 通常与目标 mRNA 具有部分互补性,主要集中在微 RNA 的 “种子” 区域。该研究还揭示,每个微 RNA 可能调控多个蛋白质编码基因,因为许多基因的 3'-UTR 区域呈现出与微 RNA 种子序列的极度保守性互补。
有趣的是,与细胞类型或谱系特异性微 RNA 共表达的基因缺乏该特定微 RNA 的目标位点。与之相反,这类微 RNA 靶点在相邻细胞和组织中表达的基因中很常见。这些观察结果强化了一种假说,即微 RNA 在多细胞生物的细胞系形成以及细胞类型稳定性中具有重要功能。
微RNA的生物合成与功能
在克隆其他微 RNA 基因的同时,多个研究团队也投入了大量精力去理解微 RNA 的生物合成及其作用机制。微 RNA 基因的转录策略丰富多样。许多微 RNA 基因是独立的转录单元,有时会成簇出现,而其他微 RNA 则位于蛋白质编码基因的内含子中。典型的初级微 RNA(pri-microRNA)由 RNA 聚合酶 II 转录而成,具有发卡结构。这种发卡结构作为底物,由细胞核内特定的微处理器(一种包含 Drosha 内切酶的异三聚体复合物)进行加工,切断其双链以产生前体微 RNA(pre-microRNA),通常长度为 60 - 70 个核苷酸,这是由安布罗斯实验室首先检测到的(图 2)。Exportin 5 和 RAN-GTP 促进前体微 RNA 向细胞质运输。
随后,前体由 Dicer(一种最初由 Greg Hannon 实验室鉴定的内切酶,属于核糖核酸酶 III 家族成员之一)进一步加工,形成微 RNA 双链。这些微 RNA 链会被加载到含有 Argonaute 蛋白的沉默复合物上,而另一个 “随从链” 则会被取代。一旦微 RNA 链被加载到沉默复合物中,它就能够通过减少翻译和 / 或促进 mRNA 降解来执行具有序列特异性的负调控。这种调控过程会涉及衔接蛋白质 TNRC6 和多聚腺苷酸结合蛋白 PABPC,它们可以招募脱腺苷酶复合物,缩短 mRNA 的多聚腺苷酸尾巴,从而根据细胞所处的环境(例如细胞的发育阶段及其类型),导致 mRNA 降解或翻译被抑制。
微 RNA 功能处理和执行的机制同样可用于其他基于 RNA 的沉默机制,通常称为 RNA 干扰(RNAi)。其中包括小干扰 RNA(siRNAs)、内源性 piwi 相互作用 RNA(piRNAs)和重复相关小干扰 RNA(rasiRNAs)。有关双链 RNA 可以诱导序列依赖性基因沉默的发现,使安德鲁・Z・法尔和克雷格・C・梅洛获得了 2006 年诺贝尔生理学或医学奖。虽然 RNAi(在低复杂性的植物和动物中)主要用于防御病毒感染以及对抗不必要的基因组移动元件活动,但微 RNA 在发育过程和成体的不同细胞中会参与 mRNA 的转录后调控。为此,微 RNA 已演化出与其目标 mRNA 序列相应的部分互补性,以 “调整” 对每个 mRNA 目标的影响,而例如 siRNAs 通常是外源的,与特定 RNA 目标序列具有完全互补性,并会切割这些序列。1999 年,David Baulcombe 证明植物中的转录后基因沉默与具有特异性的短 RNA 对靶序列进行处理有关,这进一步将不同领域中的观察联系了起来。
微RNA的演化及其生理作用
微RNA基因的出现及发展与更复杂生物体的演化紧密相连(图 5)。在早期两侧对称动物的演化进程中,微RNA基因的数量显著增多,据推测,它们在原口动物和后口动物分开之前的两侧对称动物的最后共同祖先中发挥作用。自那时起,随着复杂生物体中出现更为特化的细胞类型和组织,又有数百个额外的微 RNA 基因诞生。在早期的后生动物海绵、植物以及两种单细胞真核生物物种中,科学家也寻找到了微 RNA 基因。因此,微RNA可能在演化过程中多次出现,或许出现在大约 6 亿年前多细胞动物早期谱系,又或者在 10 亿年前植物和动物的共同祖先中。值得注意的是,许多演化上古老的微 RNA 基因在后来的生物中得以保留。另外,这些基因在演化过程中很少丢失,这表明它们在基因调控中起着至关重要的作用。
通过消除微 RNA 生物合成途径中的组分,科学家证实了微 RNA 在多细胞生物发育和组织功能中的关键作用。负责在细胞质中处理前体微 RNA 的 Dicer 的缺失,会导致小鼠和斑马鱼胚胎致死。在果蝇和小鼠中,单个或一组微 RNA 基因的缺失也会引发强烈的表型变化。然而,由于多个微 RNA 基因可能作用于相同的目标序列,存在冗余作用,使得单个微 RNA 基因的功能被掩盖。尽管这些系统中的冗余性阻碍了科学家对单个微 RNA 基因功能的深入研究,但它也展现了该系统的稳健性,并解释了为何该系统不易被病毒等外界因素轻易操控。
为凸显微 RNA 的基础作用,值得关注的是,在两侧对称生物中共享的、演化上最为保守的微 RNA 基因在胚胎发育早期发挥作用,而那些在哺乳动物中特别演化出的微 RNA 则在胚胎发育后期阶段发挥作用。相比之下,物种特异性的微 RNA 基因通常在成体细胞类型中起作用,而非在胚胎发育过程中。通过对不同演化保守性的微 RNA 基因进行系统性敲除实验,这些模式清晰可见。在动物发育过程中,微 RNA 的特定调控作用包括调控发育时序、细胞命运的形成和稳定性,以及普遍生理学和内稳态。
通过选择性地将 Dicer 从转基因小鼠体内敲除,研究人员阐明了微 RNA 在成体细胞和组织中的功能。例如,在 B 细胞成熟过程的早期,敲除 Dicer1 会使该细胞分化停滞在祖 B 细胞阶段。在胚胎发育的第 15.5 天,从神经元中敲除 Dicer1 会导致新生儿过早死亡,同时伴有小头畸形、神经元树突分支减少和树突棘长度增加。在胚胎发育两周时,在分裂后的小脑浦肯野细胞中敲除 Dicer1,会引发小脑退化和共济失调(肌肉运动不协调)。同样,中脑多巴胺能神经元中 Dicer1 的缺失会导致渐进性神经元丧失和运动活动减少。研究人员在其他多种细胞类型和组织中也观察到了严重的表型,证明微 RNA 在发育过程和成体细胞类型的功能中具有关键作用。
随着越来越多与特定微 RNA 基因突变或相关生物合成通路中的成分突变相关的综合征被发现,微 RNA 在人类发育和机体功能中的重要性愈发明显。例如,DICER1 综合征是一种罕见的遗传性疾病,由 DICER1 基因突变引起,患者易患肾、甲状腺、卵巢、宫颈、睾丸、脑、眼和肺的肿瘤。在这些患者体内,通常 DICER1 的一个等位基因存在使其失活的胚系突变,降低了细胞中功能性 DICER1 蛋白的含量。这些个体容易发生额外的体细胞突变,因此往往在儿童期就发展出肿瘤。
微RNA基因的碱基配对部分(即种子序列)较短,使得它们不太可能因随机突变而改变。然而,已知微 RNA 基因的种子序列中存在与疾病相关的突变,其中包括与进行性听力损失相关的 miRNA - 96 突变、导致 EDICT 综合征(一种罕见的眼疾,表现为虹膜发育不全、内皮营养不良和先天性白内障)的 miRNA - 184 突变,以及导致先天性骨骼疾病的 miRNA - 140 - 5p 突变。目前,针对代谢紊乱、心血管疾病、神经退行性疾病和癌症等疾病,基于微 RNA 的诊断和治疗方法正在不断取得进展。
邮政编码:200052 电话:021-63800152 传真:021-63800151 京ICP备15010734号-10 技术:网至普网站建设