您的当前位置:休克 > 休克治疗 > MolecularCell综述RNA
MolecularCell综述RNA
年3月来自加州大学圣地亚哥分校细胞与分子医学系的三位作者MeredithCorley,MargaretC.Burns和GeneW.Yeo于MolecularCell上发表综述,详细的阐述了RBPs与RNA相互作用的分子机制。该文章题目为:HowRNA-BindingProteinsInteractwithRNAMoleculesandMechanisms。
RNA结合蛋白(RBP)在其整个生命周期内对转录物进行潜在和广泛的调节。RBP与RNA的相互作用从单蛋白RNA分子相互作用到多个RBP和RNA分子(如剪接体)的组装。RBP如何选择性地结合它们的目标并不总是被理解的,尽管目前有许多技术用于研究这些相互作用。X射线晶体学和核磁共振(NMR)实验有助于精确研究蛋白质RNA复合物中相互作用的氨基酸和核苷酸,并且已经为与RNA复合物中的RBP结构域生成了许多这样的数据集。对这些数据的分析推断出了分子间相互作用的数量和类型以及表征特定蛋白质RNA结合的首选氨基酸。此外,许多研究已经建立在蛋白质RNA结构数据的基础上,开发出越来越精确的软件来预测蛋白质中的哪些残基与RNA相互作用。为了预测和研究RBPs如何与RNA相互作用,作者对最新的软件和数据资源进行了描述。蛋白质中的RNA结合域是与RNA结合的功能单元。多个这样的结构域经常出现在单个RBP中,这些模块化排列可以协调和增强与RNA的结合。此外,RBPs往往富集在本质上无序的区域,这些区域本身充当RNA结合域,RNA结合结构域具有明显的异质性,很难分类。此外,许多区域仍有待确定,其中数百个RBP缺乏已知的RNA结合域。这里作者概述了17个特征良好的RNA结合域用于实现RNA结合。此外还分析了其中八种结构域类型的蛋白质RNA氢键的偏好。RBP结合最终实现一系列细胞目标,但许多机制以及许多调控机会介于结合和生物后果之间。有研究者提出将这些机制分为几层:蛋白质RNA组装、核糖核蛋白(RNP)的联合作用以及调节前两层的修饰和相互作用。在这里,作者描述了这些高级过程并提供功能示例,包括通过对蛋白质RNA结构的观察。这些总结交叉了研究领域,使其能够机械地理解RBP调节。
蛋白质-核糖核酸分子相互作用
要了解核糖核酸靶点的RBP调节,必须了解促进与这些位点精确和特异性相互作用的生化基础。RBPs通过蛋白质残基和RNA核苷酸之间的分子化学相互作用与RNA靶结合。在这个分辨率下,RNA和蛋白质之间的区别开始融合,因为形成蛋白质和RNA三级结构的相同分子间作用力也将两个分子缝合在一起。这些相互作用是动态发生的,有时在RNA和蛋白质中有相当大的重排。
图1:蛋白质-核糖核酸氢键和堆积相互作用示例
氢键与范德华力相互作用
氢键和范德华力(VdW)相互作用在蛋白质RNA相互作用中被广泛分析。氢键形成于与氢原子结合的电负性原子之间,其部分正电荷吸引电负性伙伴。氢键可以由中性基团和离子基团形成,也可以由水分子配位(图1B)。每键贡献0.5–4.5kcal/mol,最弱的氢键被认为是VdW相互作用。分析蛋白质结构中VdW相互作用和氢键的所有研究都确定了与HBPLUS的氢键,并将VdW相互作用确定为高于临界供受体距离的氢键。所有RNA碱基、2’OH和磷酸二酯主链都能与蛋白质形成氢键和VdW相互作用(图1A-C)。对蛋白质RNA结构中氢键类型的多重分析发现,与碱、2’OH(糖)和磷酸盐(RNA骨架)的氢键分别占蛋白质RNA氢键的35.5%、23.5%和41%(图2A)。对含碱、糖和磷酸盐的VdW百分比的研究更具变数(图2B),在对VdW相互作用进行分类时,可能会重新确定不一致的阈值。
图2。蛋白质RNA结构中氢键和范德华相互作用的7项研究的Meta分析
蛋白质可以利用任何残基的主链和大多数残基的侧链与RNA相互作用。
研究一致发现,蛋白质侧链与主链相比,在71.5%的氢键和76%的VDW位点中与RNA相互作用(图2A和2B)。极性氨基酸Ser和Asn以及形成强离子氢键(盐桥)的正电荷氨基酸Lys和Arg主导了这些相互作用。VdW相互作用对氨基酸的偏好通常与氢键相同。在蛋白质-核糖核酸界面发生的一系列相互作用中,VdW相互作用被认为占主导地位,尽管每个蛋白质-核糖核酸复合物的VdW与氢键相互作用比率的估计值相差很大(图2C)。RNA碱基和疏水侧链之间的疏水相互作用可以通过将疏水残基和碱基从溶剂中分离形成“疏水核”,成为蛋白质RNA界面上的重要稳定因素。例如,SRP54“M”绑定结构域与SRPRNA形成富含蛋氨酸的疏水表面。在蛋白质-核糖核酸结构中,疏水相互作用的研究更为稀少,但根据RBP的不同,可能占蛋白质-核糖核酸界面相互作用的50%。
Π相互作用可在任何含氮碱环和含Π氨基酸之间形成,其中包括芳香残基Trp、His、Phe和Tyr以及带电残基Arg、Glu和Asp。这些相互作用在每相互作用2–6kcal/mol时相对较强,并且通常更喜欢叠加(称为Π叠加)。对蛋白质RNA晶体结构中Π相互作用的分析发现,平均每个结构中存在多个此类相互作用。这些相互作用可为蛋白质与RNA的结合提供相当大的稳定性,其中一些Π相互作用对结合功能至关重要。这就是将人类U1A剪接体蛋白与RNA多聚腺苷酸化抑制元件(包括夹在Phe和Asp残基之间的两个连续碱基)结合在一起的广泛堆积相互作用的情况(图1D)。碱基和疏水残基之间也发生了堆积作用,这些作用可能与Π-Π堆积作用混合。例如,细菌4.5srpRNA突起中的单个胞嘧啶与FtsY中的Phe和Leu堆积在一起。更奇特的Π堆积结构包括堆积在残基之间的蛋白质主链上的碱基和蛋白质侧链和碱基之间的垂直“T堆积”。总的来说,与RNA的叠加相互作用是非常关键和多样的,其发生率可能高于蛋白质与DNA的相互作用。
与蛋白质-DNA相互作用的差异
蛋白质-DNA结构的类似分析允许与蛋白质-RNA相互作用进行比较。RBPs和DNA结合蛋白对相互作用残基显示出许多相同的偏好,即带正电和极性残基。然而,DNA和RNA分子之间的化学和结构差异导致了相互作用的显著差异。大约20%的蛋白质与RNA的相互作用发生在2’OH上,而这不可用于蛋白质-DNA相互作用(图2)。RNA碱基中的碱基配对部分也比DNA中的碱基配对部分更广泛地与蛋白质接触,因为Watson-Crick碱基面通常是DNA中的碱基配对。同样,蛋白质-DNA相互作用更频繁地使用磷酸二酯主链。DNA结合蛋白倾向于包围其目标DNA螺旋,但这种结合方式并不总是适用于RBP,RBP必须适应不同范围的茎环、凸起和其他复杂结构。此外,双链RNA(dsRNA)采用了与标准DNA形式螺旋不同的螺旋,解释了为什么与dsRNA相互作用的rbp最适合于RNA螺旋而非DNA螺旋。尽管存在这些总体差异,许多蛋白质同时结合DNA和RNA。人类ADAR1可以结合dsRNA和Z型DNA,但每个都使用不同的结构域。因此,即使一个双重的DNA和RNA结合蛋白可能仍然使用独特的策略来接触每个分子。
结合动力学蛋白质与RNA的相互作用是通过两个分子的动态重排发生的。
核磁共振和分子动力学(MD)模拟以及有无配体的晶体结构都揭示了蛋白质与RNA相互作用的动力学过程。RNA和蛋白质在结合过程中大多表现出局部重排。结合后,相互作用的部位变得坚硬,将分子锁在一起,而两个分子中的相邻元素则会松动,以平衡熵的减少。这样,如果核苷酸或不直接相互作用的残基直接作用于结合的补偿变化。蛋白质和RNA中的非结构环是结合过程中常见的重排位点,如蛋白质中有序结合域之间的无序连接区。事实上,与RNA相互作用的大部分残基往往位于非结构环中,这些区域采用结合RNA的结构。最后,RNA的大三级灵活性是蛋白质结合的一个关键功能特征。蛋白质-核糖核酸结合的计算模型发现,与核糖核酸折叠然后对接相比,同时将核糖核酸折叠并对接到蛋白质界面更为成功,重申了核糖核酸结合蛋白质所需三级重排的重要性。
蛋白质RNA的预测与资源
蛋白质中RNA结合位点的预测一直是研究的热点,上述对protein-RNA结构的分析表明,蛋白质RNA界面更喜欢带正电的残基,这与蛋白质蛋白质界面不同,后者更喜欢极性残基。这些指标和越来越多的已解决的蛋白质RNA结构使得基于机器学习的预测蛋白质RNA相互作用的尝试成为可能。对这些算法的元分析发现,预测蛋白质中RNA结合位点最成功的特征是残基组成、保守性和溶剂可及性。此外,改进的热力学模型使对接模拟有助于理解蛋白质RNA结合的第三动力学。
RNA结合域
RBPs通常包含用于结合RNA的离散域。许多RNA结合域非常小(个残基),并且仅利用它们的少数残基直接与RNA相互作用。这就引出了如何实现特定绑定的问题。如上文所述,多个RNA结合区域参与氢键、堆叠相互作用以及与RNA核苷酸的所有部分的额外弱相互作用的组合,累积地使RBPs能够结合RNA中的特定区域。多个结合域通常共存于一个RBP中,增强特定RNA结合。域之间的连接子也被证明介导了重要的RNA接触,并且连接子的灵活性可以决定相邻的RNA结合域是独立结合还是协同结合。二分序列模体的识别是常见现象,由多个RNA结合域及其连接子和向RBP呈现二分序列的RNA结构安排介导。此外,一些RNA结合域能够介导蛋白质-蛋白质相互作用(PPI),包括与RNA结合一致。这种多层次的方法允许几乎无限的组合,这样就存在着数百种不同的RBP,它们执行着广泛而多样的功能。在这里,作者详细描述了17个结构特征域,这些域被描述为在多种蛋白质中结合RNA。
RNA识别基序RRMs是最常见和研究最深入的RNA结合域
在蛋白质数据库(PDB)中搜索“RRM”可产生多个结构,估计RRM出现在所有人类蛋白质中的1%。RRMs平均90个氨基酸大小,采用β1α1β2β3α2β4拓扑结构,在反平行的β片上形成两个α螺旋,在β1和β3链的中央包含保守的RNA结合RNP1和RNP2基序。RRMs与单链RNA(ssRNA)中的2–8-nt相互作用,通常是通过几个顺序叠加相互作用和与RNP基序的氢键进行的,通常具有纳摩尔亲和力。每个RRM都有自己的序列偏好,通常用于退化序列,如富GU区。RBP中连续RRMs的结合显著增加了结合亲和力和特异性。例如,异质核RNPA1(hnRNPA1)中两个RRM结构域的双重结合对其整体结合能力和抑制剪接功能至关重要。还观察到RRM与其他蛋白质结构域相互作用,例如hnRNPC,其单个RRM结构域驱动与其他hnRNPC分子的多聚。
K同源性
在异质核核糖核蛋白K(hnRNPK)中首次发现K同源性(KH)结构域。在70个氨基酸中,KH结构域甚至比RRM结构域更小,并且通常在ssRNA或ssDNA中识别4个nt。KH结构域采用I型β1α1α2β2β0α0拓扑(在真核生物中)或反向II型α0β0β1α1α2β2拓扑(在原核生物中),在a1和a2螺旋之间具有保守的“GXXG”RNA结合基序。RNA结合发生在疏水性口袋中,包括由“GXXG”基序配位的多个氢键。KH结构域中蛋白质和RNA之间的堆叠相互作用很少,这可能解释了该结构域弱的微极亲和力。与RRMs一样,RBP中的多个KH结构域(I型)可以独立或协同地增加结合特异性。例如,MEX-3C中的两个KH结构域将其结合位点增加到以0.17mM亲和力结合的5-plus-4-nt二部基序。KH域也是常见的共生域以震动(QUA)结构域作为RNA(STAR)结构域更大信号转导和激活的一部分,它大大扩展了结合面,容纳7或8个具有0.07mM亲和力的nt。
锌指(ZnFs)
ZnFs描述了一个大的蛋白质家族,其平均大小为30个氨基酸,形成一个简单的ββα拓扑结构,其中β发夹轮和α螺旋中的残基由Zn2离子进行配位。大多ZnFs结合了DNA,但还被证明结合了RNAs、蛋白质和小分子。与RNA相互作用的ZnF亚型包括CCHC(锌指关节)、CCCH、CCCC(RanBP2)和CCHH亚型,其中C和H分别指与锌原子配位的散布半胱氨酸和组氨酸残基。这些子类型显示了一系列的序列和结构特征。锌指关节通过与环中的碱基和茎的磷酸骨架接触,识别RNA(或ssDNA)中的茎环元素。CCCH和CCCC亚型倾向于通过一个RBP中的多个这样的ZnF识别3-nt重复。这些接触是通过与碱的氢键和在碱之间堆积的芳香侧链的插入形成的。多功能和丰富的CCHH-ZnF与单链和dsRNA以及DNA相互作用,已经成功地设计了CCHH-ZnF的模块化阵列以结合所需的DNA序列。因此,设计者ZnFs被认为具有RNA序列定向结合的潜力,这一目标已经在如此大的同源结构域中实现。
Pumilio同源结构域
蛋白质的Pumilio和FBF(PUF)家族存在于大多数真核生物中,由Pumilio同源结构域(PUMHD)或PUF结构域定义。PUF结构域非常大,由8个高度保守的36个氨基酸序列的α螺旋重复组成,形成一个凹形RNA结合面。每个重复序列通过氢键和稳定的堆积相互作用识别一个未配对的碱基,其中全结构域在具有低纳米摩尔亲和力的ssRNA中识别高达8nt。野生型PUF重复序列并不特别识别胞嘧啶;然而,蛋白质工程已经产生了这样的重复序列。这些进展与PUF结构域的可预测的碱基识别代码相结合,pumilio蛋白质的异构化设计可识别包含所有RNA碱基的8-10nt序列。
五肽重复序列与PUF重复序列非常相似,真核生物五肽重复序列(PPRs)的长度均为35个残基,形成两个反平行的α螺旋。2–30重复形成一个螺线管状支架,将特定的ssRNA序列与纳摩尔亲和力结合。每个重复序列中的两个残基通过氢键确定碱基特异性结合,从而开发结合特定ssRNA或ssDNA序列的设计ppr。
假尿苷合成酶和太古宙糖基化酶
在上述酶中也发现假尿苷合成酶和太古宙糖基化酶(PUA)结构域其他几种RNA修饰和代谢酶。PUA结构域的长度从67到94个氨基酸不等,形成由两个a螺旋包裹的假桶。PUA结构域通过广泛的氢键与dsRNA及其邻近的环或外伸部分相接触。这些接触通常由α1和β2或α2和β6之间富含甘氨酸的环形成。与许多其他域不同,PUA域不是作为串联重复出现的。
THUMP以硫尿苷合成酶、甲基转移酶和假尿苷合成酶命名,在许多tRNA修饰酶中发现THUMP结构域。大约个氨基酸长的THUMP结构域总是在RNA修饰结构域附近发现,并且经常在N-末端铁氧还蛋白样结构域(NFLD)附近发现。由RNA结合的THUMP结构域的第一个结构,细菌4-硫尿苷合成酶与tRNA的复合物,揭示了一个三维折叠,专门识别tRNA的3’-CCA尾和相邻的茎。多个氢键和VdW触点正确定位了tRNA,以便通过伴随的焦磷酸盐结构域进行修改。
YT-B同源性
YT-B同源性(YTH)结构域发现于YTH蛋白家族中,在RNA中“读取”N6甲基腺苷(m6A)标记。YTH结构域的长度从到个氨基酸不等,形成一个由四个或五个α螺旋包围的六股β桶。β桶疏水核心中的三个残基在“芳香笼”中捕获m6A的甲基,该“芳香笼”由色氨酸环与甲基之间的腺苷和p相互作用的氢键组成。在未修饰的腺苷酸上,YTH结构域特异性结合m6A。在0.3mM处测量了YTHDC1对一致DRm6(A)CH基序的亲和力,而未检测到对未甲基化序列的结合。类似地,对甲基化RNA的YTHDF2亲和力测量为2.54mm,对非甲基化靶的亲和力降低了10倍。
双链RNA结合域双链
RNA结合域(dsRBDs)或模体(dsRBMs)由65–70个氨基酸组成,是第三常见的RNA结合域。dsRBDs特异性地识别和结合dsRNA,并在蛋白中发现,在病毒保护、RNAi和细胞运输中发挥作用。dsrbd通常以串联重复或与其他功能性RNA结合结构域(如RNA编辑或螺旋酶结构域)结合出现。dsRBDs特别识别A型RNA螺旋的结构,其跨度高达16bp,与磷酸二酯主链和2’OH有氢键接触。在某些情况下,dsrbd显示了特定于碱基的接触,例如相邻环中的碱基。堆叠相互作用是罕见的,可能解释了dsrbd与RNA靶的低亲和力(高纳米摩尔到微摩尔范围)。
解旋酶
解旋酶结构域存在于所有生命形式的解旋酶蛋白中,解旋酶蛋白同时释放DNA和dsRNA。解旋酶由六个超家族(SFs)组成,其中SF1和SF2包含所有真核RNA和DNA解旋酶。RNA结合螺旋酶包括SF1中的Upf1样家族和SF2中的死盒、DEAH、RIG-I样、Ski2样和NS3家族。其余的SFs,包含形成多聚环的细菌和病毒螺旋酶。螺旋酶结构域非常大,包含–个氨基酸。在SF1和SF2中,螺旋酶结构域由两个重组酶A(recA)样亚结构域组成,每个亚结构域包含一个ATP催化核、一个核酸结合区和协调这两个亚结构域。在解旋酶家族中,这些亚结构域是相当保守的。螺旋酶的成环SFs中的螺旋单体类似地相当大,并且由多个子结构域组成。结合的RNA被类recA结构域包围,或者在多聚体解旋酶的情况下,RNA被拉过环的中心。与RNA的接触主要是与磷酸盐和糖部分的氢键,但偶尔会观察到与碱的接触。与RNA的亲和力通常在纳摩尔范围内,尽管它们随螺旋酶的变化很大,并且受螺旋酶的其他亚结构域的调节。ATP结合通常通过使螺旋酶RNA结合区“钳制”来促进对RNA的更高亲和力。随后,ATP水解促进构象变化,导致螺旋酶转移1nt或释放其底物。
冷休克结构域
冷休克结构域(ColdShockDomain,CSD)存在于一个大的蛋白质家族中,与生命所有结构域中的冷适应有关。csd由70个氨基酸(在真核生物中更多)和5个反平行的β链组成,它们形成一个共同的β桶结构,称为寡糖/寡核苷酸结合(OB)折叠。CSD包含RRMs共有的保守RNP1和RNP2基序,它们结合ssRNA和ssDNA。CSDs通过顺序堆积相互作用和氢键与碱接触3或4nt,实现纳米摩尔亲和力。含CSD的蛋白质在它们识别的序列类型上有很大的不同。据报道,细菌CspB与富含嘧啶的将ssDNA序列与ssRNA序列进行比对,结果显示ssDNA比ssRNA序列高出10倍。Y盒蛋白含有研究最为深入的真核CSD,显示出对富含G的ssRNA序列的偏好,而不是ssDNA。
S1RNA结合域
S1RNA结合域最初发现于S1核糖体蛋白中,它结合mRNA和rRNA。70氨基酸S1结构域在与CSD相同的OB褶皱家族中形成5-链反平行β桶。尽管两个域共享一个共同的第三纪结构,但没有显示出序列相似性,这表明它们共享的第三纪结构是通过收敛演化实现的。另外,在一些外核糖核酸酶和真核翻译起始因子中发现了S1结构域,并与其他RNA结合结构域如KH结构域或CSDs结合。尽管它们很丰富,但对于与RNA复合的S1结构域却很少有结构信息。S1结构域在外核糖核酸酶的RNA结合通道中与ssRNA和dsRNA相互作用。同样,核糖体S1蛋白的S1结构域可能与核糖体进入通道的mRNA相互作用。
Sm
在真核生物和古细菌中的Sm和类似Sm(Lsm)蛋白以及原核生物中的Hfq蛋白中发现Sm-RNA结合基序。Sm基序由具有拓扑结构的70个残基组成,形成弯曲的反平行β片。含钐的蛋白质很容易通过把β4和β5串成两个Sm母题。例如,Sm-Sm相互作用将构成剪接体中小核核糖核蛋白(snRNPs)蛋白核心的七个人类Sm蛋白连接起来。Sm多聚体与RNA的结合具有纳摩尔亲和力。两个Sm基序形成一个6-nt结合面,通过氢键和堆积相互作用结合特定的碱基,通常是尿苷。
La基序
在真核细胞La和La相关蛋白(LARPs)中发现有90个小残基La基序(LAM)。LAM由五个α螺旋和三个β链组成,它们形成一个小的反平行β片,与一个改进的“翼螺旋”拓扑相对。有翼螺旋结构本身与其他几种RNA和DNA结合蛋白相同。LAMs总是与至少一个RRM相邻,在RRM中,这两个域的组合可能作为一个单元进化。在La蛋白中,双LAM-RRM区域紧密结合在聚合酶酶ii转录的小α的30个末端的UUU-OH元素。结合发生在LAM和RRM之间的裂缝,而不是RRM或LAM翼螺旋褶皱的传统RNA结合面。一些尿嘧啶碱基与高度保守的芳香残基堆积在LAM中,并且LAM和RRM配位碱基、磷酸盐和末端20OH的氢键都存在。这些接触导致LAM对3’末端UUU-OH元素的低纳米摩尔亲和力。另一种含有LAM的蛋白质,LARPs,结合了一组具有尚未特征化结构机制的不同RNA。
Piwi-Argonaute-Zwille和Piwi
Argonaute-Zwille(PAZ)和Piwi-RNA结合域定义了真核生物中发现的Argonaute蛋白质家族。在Argonaute蛋白的对侧发现,这两个结构域促进小干扰RNA和microRNA与mRNA靶点的结合。PAZ结构域除Argonaute蛋白外,还存在于Dicer蛋白中。PAZ结构域的晶体结构显示一个六股β管,顶部有两个α螺旋,另一侧由一个包含β发夹和短α螺旋的特殊附件连接。在该附体和β桶之间形成的结合囊结合了具有低微极亲和力的导向RNA(GRNA)中的2-nt30。结合主要由保守的酪氨酸残基协调,这些残基与两个末端核苷酸的磷酸骨架和糖羟基形成氢键。PIWI域第三结构形成一个RNaseH样褶皱,由一个由两个面上的螺旋连接的五股b片组成。PIWI结构域在某些情况下具有内核溶解活性,但主要通过与核苷酸的gRNA骨架和50个悬基的氢键稳定gRNAmRNA双种子区。PIWI结构域也以某种构象与PAZ结构域接触,表明其活性可能受到PAZ结构域构象状态的调节。
其他的RNA结合结构域所代表的是现存的RNA结合结构域的一部分,占个RNA结合结构域的23%PDB中的结构,而还有成百上千个RNA结合域有待鉴定。一些结构域,如Brix结构域、不育α基序(SAM)和SAF-A/B、腺泡和PIAS(SAP)结构域,大多被称为蛋白质或DNA结合结构域,但有一个或两个蛋白质成员与RNA结合。例如,SAM结构域是一个众所周知的α螺旋PPI结构域,但是SAM包含的蛋白Smaug及其同系物VTS1p结合了RNA发夹元素的五环,称为Smaug识别元素(SRE),具有纳摩尔亲和力,Smaug同源物之间的RNA相互作用残基的保存表明RNA结合功能存在于其他含SAM的蛋白质中。许多其他RNA结合域是完全独特的,即尚未发现类似于任何其他域。茎环结合蛋白结构域仅在相同名称的蛋白质(SLBP)中发现,该蛋白质仅在组蛋白MRNA末端与保守的茎环结合。IRP1,也称为ACO1,是一种具有独特折叠的乌头酸酶,能紧密结合铁代谢相关转录物的UTR中的铁反应元件。大多数核糖体蛋白质都含有一个独特的RNAbinding结构域,S1结构域除外。病毒RBPs的结构数据揭示了极其多样和独特的结构,这些结构专门用于结合高度结构化的病毒RNA元素。最近的大规模研究发现了蛋白质中数百个新的RNA结合区域,包括许多具有良好特征的酶蛋白。
总的来说,作者的分析强调了结构域是如何不同的,并加强了已知的某些结构域是如何与RNA形成氢键,为其特定的生物学服务的。未来,按结构域评估堆叠、疏水和VdW相互作用还有助于定义结构域的特定结合策略。以这种方式量化结合策略将有助于预测和设计旨在控制RBPs生物学的努力。
调控机制虽然RNA结合域直接负责与RNA的相互作用,但必须考虑调控这种相互作用的动态细胞环境。那么决定RBP如何找到目标的因素,它们与目标的组合功能,以及前两个功能是如何调节的?
图5:控制RBP结合、与RNA相互作用及其调控机制的实例
蛋白质-核糖核酸组装:一个给定的红细胞蛋白如何找到它的目标?蛋白质和核糖核酸之间的分子间相互作用是决定它们亲和力的原材料,其中与“适合”核糖核酸底物的特定部分和/或结合囊的相互作用是高效结合的常见策略。在IRP1的情况下,其“L形”结合囊和与选择碱基的接触对铁反应元素产生了难以置信的特异性和强的微极亲和力(图5)。另一方面,eIF4E缺乏对IRP1等RNA元素的特异性,相反,它通常通过识别所有ma的50个帽来结合它们。这种相互作用很强(纳摩尔亲和力),由与m7Gppp结构的稳定堆积相互作用促进(图5)。最后,许多RBP既不表现出特异性也不表现出高亲和力结合,以实现与RNA的功能瞬时关联。RBP(或RNA)的丰度也会影响结合的自由能,高丰度推动了有利于结合的方程。因此,难怪IRP1与铁反应元件的相互作用在高度丰富的FTL转录本是最可靠和研究良好的蛋白质RNA相互作用之一。其它蛋白的募集是许多RBP寻找靶点的主要方式,特别是在多组分RNP复合物的组装中。例如,eIF4E结合mRNA5’Caps作为eIF4F翻译起始复合物的一个亚单位,其传递复合物的其他成员,例如螺旋酶eIF4A,以作用于转录物(图5)。eIF4F复合物另外招募43S核糖体复合物开始扫描5’UTR。以招募RBPs的同样方式,它们也可以通过其他蛋白质的隔离或对其结合位点的修饰来阻止结合(如下所述)。
蛋白质和核糖核酸的结合功能蛋白质和核糖核酸的单个成分一旦结合,就具有不同的功能。这种功能可以由RNA结合域本身或同一RBP中的协同酶域引导,也可以需要多种蛋白质/RNA组分。作者可以将蛋白质RNA功能分为几个大类:静态结合、扫描/移位、重塑和修饰。许多RBP静态地结合特定的RNA元素(通常是小发夹);也就是说,一旦结合,它们不会进一步改变RNA。这种相互作用的方式经常阻碍通过阻断eIF4A的扫描作用而阻碍翻译起始的RNA的获取,如IRP1(图5)。沿着RNA底物的易位在RNA解旋酶中很常见,包括eIF4A和UPF1(图5)。UPF1以及其他一些解旋酶,通过过程性地移除其路径中的其他RBP,并且重塑其底物的RNP。最常见的是,解旋酶的作用是去除RNA二级结构,扫描和结构解旋可以同时发生,也可以独立发生。
不仅仅是解旋酶的作用,RNA结构的调控可以被认为是RNA修饰的一种非共价形式。重塑RNA除了去除结构外,还包括伴随RNA结构的形成。已在冷休克蛋白和解旋酶以及假尿苷合酶TruB中观察到RNA上的伴侣活性,其除了化学修饰RNA外,还修饰tRNA结构。RNA通过酶和RNA结合域进行化学修饰。在涉及所有碱基和2’OH的RNA中,已经鉴定出多种化学修饰。其中最著名的是甲基转移酶样(METTL)蛋白质,如双METTL3-METTL14复合物,它使用来自共基质S-腺苷蛋氨酸(SAM)的供体甲基化腺嘌呤的第六碳(m6a;图5)。一些化学修饰扭曲了其常驻RNAs的局部二级结构,报道了假尿苷修饰引起的碱基对稳定和肌苷和m6A引起的去稳定。最后,具有核溶解活性的RBPs以更极端的方式修饰RNA,例如Argonaute蛋白和RNaseDicer和RNaseII。
对结合和功能ppi的调节使合作和竞争控制RBP结合成为可能。翻译起始复合物的情况就是这样:与mRNA5’Caps结合的eIF4E通过其与亚单位eIF4G的结合而增强;然而,eIF4E与eIF4EBP的相互作用阻止其与eIF4F复合物的结合。PPIs还可以调节RBP功能或其效率。外显子连接复合物(EJC)相互作用体UPF2和SMG1结合UPF1后诱导构象变化,从而抑制其螺旋酶活性(图5)。m6AMETTL3和METTL14都能修饰RNA,但它们的活性因相互作用而显著增强。非蛋白配体也可影响RBP结合,如IRP1结合4Fe-4S,IRP1激活其附子酶活性,并相互排斥铁反应元件结合(图5)。类似地,由解旋酶结合的ATP通常诱导解旋酶结构域的“钳制”,从而增加其对RNA的亲和力。RBPs残基的翻译后修饰(PTMs)直接调控其相互作用位点和功能。RBPs通常包含PTMs的多个位点,其中最常见的是磷酸化(通常是丝氨酸)、乙酰化(通常为赖氨酸)和精氨酸甲基化。在分子水平上,PTMs引入静电电荷,可影响结合区的结构稳定性或其与RNA或其他蛋白质相互作用的能力。磷酸化修饰和乙酰化修饰分别引入负电荷或中和正电荷。例如,PTBP1/2的RRMs中至少两个赖氨酸残基的乙酰化可能通过消除正赖氨酸残基和带负电荷的RNA骨干之间的静电吸引而破坏其与RNA骨干的氢键能力。另一方面,精氨酸甲基化已被证明降低了阳离子-磷相互作用的有利性,例如驱动相分离的IDR之间的RGG介导的相互作用。PTMs是最常见的ppi调节因子,如eIF4E和eIF4EBP之间的联系,其依赖于eif4bp的低磷酸化。eIF4E-BP中至少两个苏氨酸残基的磷酸化诱导了一种结构变化,这种变化埋葬了其eIF4E结合位点,从而允许eIF4E诱导进入eIF4F复合物(图5)。
从较少以蛋白质为中心的观点来看,RNA相互作用和RNA修饰也调节RBP结合。m6A的修改最终决定了hnRNPC是否有结合位点(图5)。小的非编码RNABC1抑制eIF4A螺旋酶活性,而长的非编码RNA已被证明有效地降低了RBP的丰度以进行功能性结合。
结论RBPs的研究现状迅速发展,包括RNA结合位点检测技术、RBP合成设计、RBPs在应激颗粒和神经退行性疾病中的作用等。所有这些领域都得益于对蛋白质-核糖核酸靶相互作用的坚实的机制理解。
在这篇综述中,作者从分子水平和鸟瞰的角度对RBPs如何与RNA相互作用进行了一个机制性的研究。作者反复观察到,详细的分子结构解释了RBPs的结合行为和功能,如螺旋酶结构域倾向于与RNA骨架或YTHm6a阅读蛋白甲基化碱基“锁定”中特定残基的相互作用。同样,作者对不同RNA结合区与RNA形成氢键的分析,加强了已知的几个结构域的结构功能,但也显示了一些结构域与其他结构域有何不同。随着更多蛋白质RNA复合物的结构被确定,这种分析可以扩展到包括更多的结构域类型,确定将结构域分开的特征或定义其结合机制。此外,研究RBP底物动力学以及更大的多蛋白复合物是理解蛋白质RNA调控相互作用过程的关键。用于研究RNA结合域的结构技术不太能够捕获RBPs结合的全RNA底物。研究RBPs复合物中RNA分子的其他方法是必要的。
原文链接: