首页 > 多肽文献 > 分裂内含肽: 一种高效的无痕多肽片段连接工具
分裂内含肽: 一种高效的无痕多肽片段连接工具
浏览量:1858 | 2023/12/19 16:28:43


摘要:分裂内含肽通过剪接反应实现多肽片段的连接, 具有高效且无痕的特点, 受到了广泛关注. 本文基于分裂内含肽的结构特征与剪接反应过程, 结合近年来关于分裂内含肽性能优化和应用研究进展进行了综合评述, 揭示其作为一种日渐成熟的蛋白质工程化技术在蛋白质化学合成领域的前景, 并简要分析了目前分裂内含肽工具面临的问题与挑战, 并对可能的解决方案进行了展望.


翻译后修饰极大地丰富了蛋白质的结构与功能的多样性[1]. 这些修饰蛋白在药物开发[2]、 蛋白质组学[3]以及蛋白质结构-功能关系解析[4~8]等方面具有重要的应用. 目前, 翻译后修饰蛋白可以通过天然提取和生物表达等方法获取. 但这些方法仍存在一系列问题, 例如, 天然提取难以获得均一修饰的蛋白样品, 而生物表达获取含多种翻译后修饰的蛋白样品依然存在困难等. 蛋白质化学合成技术是获得翻译后修饰蛋白的一种新兴技术, 该技术基于固相多肽合成技术和多肽片段连接技术. 固相多肽合成技术[9]可以直接将各种非天然氨基酸及带有修饰基团的氨基酸方便地引入多肽链中特定的位点. 尽管固相多肽合成技术的合成能力上限一直在不断提高[10], 但大部分蛋白仍然难以通过固相合成一次性获取. 因此, 使用多肽片段连接技术能够将含特定修饰的多肽片段进行连接, 极大地扩展了蛋白样品的获取范围(图1). 通过多肽片段连接, 研究者们已经合成了带有荧光标记[11], C13和N15等同位素标记[12], 磷酸化、 甲基化及泛素化等翻译后修饰[13], 以及含非天然氨基酸[14]等功能的蛋白质.


目前, 应用最广泛的化学连接技术是自然化学连接(NCL). 该技术由芝加哥大学的Kent等[15]于1994年提出, 通过一个多肽片段的C-端硫酯与另一个N-端Cys多肽片段的选择性化学反应, 在连接位点处形成天然酰胺键. 早期, C-端硫酯的合成受到稳定性差的困扰;近年来通过酰肼氧化的C-端硫酯原位合成及连接策略极大地促进了这一方法的应用[16~20]. 然而, 由于NCL反应依靠随机碰撞, 其连接效率受底物浓度的制约, NCL通常需要mmol/L级别的底物浓度. 当底物浓度低于1 mmol/L时连接效率低, 使得NCL在脂蛋白、 膜蛋白等难溶蛋白片段连接时产生困难. 为增加NCL在低浓度条件下的反应效率, 研究者们提出了多种解决方案, 主要有:向反应体系加入有机溶剂或者去垢剂以增加片段溶解度[21];在主链上引入可移除的增溶修饰以打破氢键网络、 削弱聚集倾向[22,23];通过DNA-DNA、 蛋白-蛋白/小分子等强相互作用模板辅助片段连接, 使片段连接在近似分子内反应的条件下进行[24]等. 此外, 使用活性更高的硒酯代替硫酯作为酰基供体的方案也能使得反应在更低浓度下进行[25]. 虽然这些策略有助于合成具有挑战性的目标, 但也存在增加安装和移除标签或模板的额外操作、 标签最佳安装位置难以预测及硒酯的稳定性较低等固有问题, 导致这些方法在稳健性和操作便捷性方面存在不足.


另一方面, 化学酶法因其能够在低浓度下高效反应, 在蛋白质合成中也被广泛应用[26~28]. 但这类连接反应通常需要在底物中引入酶特异性识别序列, 这些识别序列在反应后往往会保留在产物蛋白的序列中, 留下序列“疤痕”, 如Sortase A酶的残留序列LPXTG[29]. 虽然可以通过选择目标蛋白质固有存在的酶的识别序列作为连接位点, 但这些情况是极其偶然的;通过高通量筛选技术对Sortase A进行序列进化[30~33], 以及使用预先制备成硫酯的蛋白片段作为连接底物[34]等策略可以减少Sortase A酶的序列依赖性, 并减少反应的可逆性[35], 但要实现完全无痕的片段连接仍然困难.


因此, 寻找一种能够高效连接蛋白片段且连接后无痕的蛋白连接工具, 成为研究者关注的方向. NCL反应和Sortase A酶连接过程中都经历了硫酯和酰基S-N迁移过程;在生命进化过程中, 泛素化酶级联反应等过程中也观察到硫酯中间体和酰基S-N迁移过程[36], 由此可见这是生成新的肽键的一种有效途径. 事实上, 人们已经发现了一类能够通过硫酯中间体和酰基迁移路径实现对蛋白质片段的高效无痕连接的蛋白:内含肽(Intein). 内含肽可以分为顺式内含肽(Cis-intein)与分裂内含肽(Split intein)两大类. 其中, 分裂内含肽可以与需要进行连接的蛋白片段分别相连, 已经在大量蛋白质连接与合成中展现出应用价值, 受到了研究者的广泛关注. 本文主要介绍分裂内含肽作为一种蛋白质合成工具, 结合分裂内含肽在蛋白质合成修饰领域的应用案例, 分析了分裂内含肽相比其它方法的优势, 总结分裂内含肽的发展现状, 并展望了其未来的发展前景.


1 分裂内含肽的发现


1.1 内含肽的发现
1990年, Stevens等发现酿酒酵母(Saccharomy cescerevisiae)TFP1基因的翻译产物会在翻译后被切割成2个蛋白, 中央的序列剪切产生分子量为50000的蛋白, 两端的片段拼接形成分子量为69000的蛋白. 此后研究者在更多物种中发现了类似的现象[37,38]. 后续研究发现, 这种插入宿主蛋白序列的蛋白可以催化自身从宿主蛋白中断裂, 同时使两侧的宿主蛋白片段通过肽键连接起来形成成熟蛋白[39]. 这种具有剪接两侧蛋白片段能力的蛋白被命名为内含肽(Intein), 而两端被剪接的蛋白片段被命名为外显肽(Extein)(图2).

1.2 分裂内含肽的发现
分裂内含肽是分裂为2个独立存在的前体片段的内含肽, 每个片段分别与1个外显肽融合(图3). 2个前体片段非共价结合并组装成典型的内含肽结构, 从而恢复分裂内含肽的剪接活性, 催化两侧的外显肽发生蛋白质反式剪接(PTS). 其可以来源于天然连续内含肽的人工分裂, 也在自然进化中存在.

1969年, Anfinsen等[40]发现在特定的条件下, 分裂成2个片段的酶能够非共价结合并恢复完整酶的催化功能. 1998年, Perler等[41]将这一思想运用到内含肽的设计改造中. 他们将Psp Pol-1内含肽中的一个肽键切断, 将其分裂为N-端片段(IntN)和C-端片段(IntC), 将2个片段分别表达纯化后在体外共复性, 结果表明2个片段通过非共价作用形成复合物并恢复剪接活性.


同年, Paulus等[42]将Mtu RecA内含肽分裂为N-端和C-端2个片段, 并各自融合到相应的外显肽上, 分别表达纯化后共复性, 2个片段结合形成了具有剪接功能的复合物. 探究了剪接反应过程对氧化还原环境和pH值的依赖性, 并指出这种剪接系统是一种有潜力的蛋白质连接工具. 此后, 研究者对天然连续内含肽进行了大量的人工断裂尝试, 发展出多种人工分裂内含肽(表1).

1998年, Liu等[49]在Ssp DnaE(蓝藻的DNA聚合酶Ⅲ的催化亚基A)蛋白中鉴定出首个天然的分裂内含肽. DnaE的N-端和C-端部分由2个单独的基因DnaE-N和DnaE-C分别编码. 在大肠杆菌中测试时, 2个分裂内含肽片段通过非共价作用结合形成内含肽复合物. 该复合物不仅具有类似内含肽的序列特征, 而且表现出蛋白质反式剪接活性, 剪接后得到完整的DNA聚合酶Ⅲ亚基A. 这一发现表明, 分裂内含肽是天然存在的. 与人工分裂内含肽相比, 天然分裂内含肽具有可在非变性条件下组装及剪接效率更高等优势.


2009年, Mootz等[50]发现了另一种新的天然分裂内含肽Npu DnaE. Npu DnaE具有极高的剪接反应活性, 在37 ℃下反式剪接反应的半衰期(即反应物的浓度消耗一半时所需的时间t1/2, s)仅为63 s, 剪接反应速率常数k(s-1)>3.5×10-3 s-1. 此后, 研究者们通过基因数据比对和实验验证等手段, 发现了更多来自不同物种的天然分裂内含肽(表2), 进一步扩大了分裂内含肽作为蛋白质连接工具的可行性与应用前景.

1.3 分裂内含肽的分类

分裂内含肽可以根据其寄主基因归类为具有遗传同源关系的家族类. 此外, 不同的分裂内含肽在反应过程中中间体存在差异, 也可以据此对分裂内含肽进行类别划分. 在结构上, 内含肽一般呈现多个β片层的结构, 分裂的位点一般在β片层之间的Loop区, 从不同区域断裂的内含肽具有不同的特性, 能够丰富分裂内含肽的应用场景, 因此研究者也根据分裂内含肽的分裂位点对其进行归纳.


约70%的内含肽的宿主蛋白与DNA复制和DNA修复有关[60], 并且在进化发展过程中表现出基因水平迁移的特征[61]. 因此分裂内含肽可以按照其来源的宿主基因进行分类, 来源于同类基因的分裂内含肽的序列同源性较高, 并且具有类似的特征. 来源于不同物种的Dna E分裂内含肽都能在相同的外显肽序列进行切割, 并且研究也发现其间存在交叉反应性, 如Npu DnaE的IntN片段和Ssp DnaE的IntC片段也可以非共价结合并形成具有剪接反应活性的复合体[62]. 研究者对于源于DnaE, GyrB和DnaB等家族的分裂内含肽已经进行了系统的研究, 并且开发了多种应用.

分裂内含肽催化的剪接反应过程涉及多步关键的酰基转移反应, 关键氨基酸残基在这些酰基转移过程中形成硫酯或者氧酯中间体, 对反应性质产生显著影响. 一般而言, 硫酯中间体稳定性较差, 在体外应用中经常观察到中间体硫酯键水解导致的副产物, 而采用氧酯中间体的分裂内含肽则反应速率较慢. 因此研究者根据分裂内含肽1位和C端外显肽+1位的氨基酸, 将其分为CC和CS(T)两类. CC类分裂内含肽(如Ssp DnaE及Sce VMA等)1位和C端外显肽+1位的氨基酸均为半胱氨酸, 反应经历2个硫酯中间体过程. CS(T)类分裂内含肽(如Ssp DnaB, gp41等)1位为半胱氨酸, C端外显肽+1位为丝氨酸或苏氨酸, 反应中经历1个硫酯中间体和1个氧酯中间体过程. 除此两大类外, 还有少数分裂内含肽在反应中经历2个氧酯中间体过程, 如Neq DNA polymerase分裂内含肽[55].


分裂内含肽一般分为2个片段, 2个片段非共价结合后在结构和功能上接近于连续的内含肽. 无论是人工分裂的内含肽还是天然来源的分裂内含肽, 其分裂位点均位于结构上的环区(Loop), 从而避免影响结合和剪接反应活性. 根据分裂位点不同, 内含肽可以被分为S0, S1和S11内含肽[63]. S0内含肽从原始内含肽中归巢核酸内切区域位点切割, 如Ssp DnaE和Npu DnaE等. S1内含肽从接近N端的位置切割, 如Ssp DnaB和M86 DnaB等. S11内含肽从接近C端的位置切割, 如Ssp GyrB S11和Ssp DnaB S11等. 此外, Liu等[63]将DnaB从S1和S0位点分为3段, 依然保留结合及剪接功能.


2 分裂内含肽的反应原理


2.1 分裂内含肽的结构
分裂内含肽可以看作是完整内含肽的分裂形式, 其复合物的结构与完整内含肽相似[64], 是伪C2对称性的马蹄形蛋白, 主要由β折叠组成. 两组反平行的β折叠成马蹄的平面, 平面上下各有一组2个β折叠和一条α螺旋形成的结构域(ββα motif), 其中一侧的β折叠延伸并垂直穿过马蹄中央的loop, 与N端外显肽相连. 马蹄中央另一对垂直于平面的β折叠与C端外显肽相连. 两段外显肽位于平面的同一侧[图4(A)和(C)][65].

分裂内含肽有多种可能的分裂方式, 多数分裂内含肽分裂成一大一小2个片段, 分裂位点可能在靠近C端的一侧, 也可能在靠近N端的一侧. 其中, 靠近C端的分裂被称为经典(Typical)分裂, 其小片段一般包括中央垂直的一组β折叠和绕平面β折叠的一部分. 靠近N端的分裂被称为非经典(Atypical)分裂, 其小片段一般包括中央垂直的loop和平面一侧ββα motif的一部分. 此外, Liu等[63]通过人工筛选Ssp DnaB可能的分裂位点, 实现了3段分裂内含肽的剪切反应. 已经在Npu DnaE上实现类似的3片段分裂内含肽剪切反应, 说明通过改造得到多于2片段的分裂内含肽是可能的[图4(B)和(C)].


分裂内含肽需要各组分结合后才能折叠成正确的构象. 2013年, Muir等[66]通过核磁共振波谱(NMR)观测了溶液中Npu DnaE分裂内含肽结合前后的构象, 发现分裂内含肽片段结合前, 小片段处于无序状态, 大片段处于构象动态变化的状态. 两片段的相互作用诱导小片段从无序结构折叠为稳定构象, 并诱导大片段形成更加稳定的结构. 类似的NMR信号特征也在Ssp DnaE和Cat两种分裂内含肽上被验证[67,68]. 2018年, Ribó等[64]解析了Neq B-type DNA polymerase1(Neq Pol1) N端大片段和两片段复合物的晶体结构, 发现IntC单独存在的结构与形成复合物后的结构有明显区别. 这些结果说明分裂内含肽各组分无法独立稳定折叠成正确的构象.


2.2 分裂内含肽的结合模式
静电相互作用被认为是分裂内含肽两片段识别和结合的重要动力. 2007年, Muir等[69]通过序列比对发现不同物种DnaE分裂内含肽显示出保守的电荷分离特征:C端小片段含有碱性残基集中片段, N端大片段含有酸性残基集中片段. 2个电性相反的片段介导的静电相互作用模式在Ssp DnaE及 Neq Pol1的晶体结构中都得到了验证[52,64].
非经典分裂内含肽两片段的结合面与经典分裂内含肽不同. 2018年, Muir等[67]通过NMR解析了一种非经典分裂内含肽Cat的结构, 发现2个内含肽片段的相互作用界面主要是疏水残基, 多数带电残基暴露在溶剂中. 生化实验结果也表明, Cat两个片段的结合强度受溶液离子强度的影响很小, 表明疏水相互作用在一些非经典分裂内含肽的结合中起更主要的作用(图5)

2.3 分裂内含肽的剪切机理
分裂内含肽的剪接是自发过程, 不需要其它的活化能来源. 整个反应包括N-S酰基迁移、 硫酯交换、 天冬酰胺环化及S-N酰基迁移等4个过程(图6).

第一步, 内含肽N-端的Cys侧链巯基进攻主链酰胺键, 发生N-S酰基迁移, 使N-端外显肽通过硫酯键连接在内含肽上. 在此过程中, 分裂内含肽中至少有3个氨基酸起到催化作用, 包括与巯基相互作用的F-Block Asp以及与酰胺键相互作用的B-Block His和B-Block Thr. F-Block Asp起到碱催化作用, 促进Cys侧链巯基的去质子化, 增强了巯基亲核性, 点突变实验表明该氨基酸对N-S酰基迁移是必要的[70]. 上述机理与NMR观测到的巯基pKa变化以及理论计算的结果相吻合[71,72]. 质子化的B-Block His起到酸催化作用, 在质子化后成为氢键供体, 与酰胺键羰基氧相互作用, 增强了羰基的亲电性. 这一相互作用得到了理论计算的支持[72], 并进一步在Ssp DnaB M86内含肽的晶体结构中得到了确认[73]. B-Block Thr起到碱催化作用, 与酰胺键的氨基氢相互作用, 使酰胺键偏离理想键参数, 通过提升底物能量降低了活化能. 这一机理得到了Ssp DnaE内含肽晶体结构的支持[74], 点突变实验表明该氨基酸对N-S酰基迁移是必要的[图7(A)][75].

第二步, C-端外显肽的Cys侧链巯基进攻N-端外显肽与N-端内含肽之间的硫酯键, 通过硫酯交换使两段外显肽通过硫酯键相连, 从线性硫酯中间体转化为支链硫酯中间体. QM/MM计算结果表明, F-Block Asp在此过程中同样起到碱催化的作用, 促进了C-端外显肽的Cys的去质子化. 点突变实验表明, 将这个Asp突变为Glu, Asn, Ala或Gly都会显著抑制支链中间体的形成[图7(B)][76].


第三步, C-端内含肽的C-端Asn侧链酰胺进攻C-端内含肽与C-端外显肽之间连接的酰胺键, 形成二酰亚胺五元环, 内含肽与外显肽脱离. F-Block和G-Block中的2个His起到了催化作用. 其中, F-Block His促进了C-端Asn侧链酰胺的去质子化, 起到碱催化作用. 质子化后的G-Block His与酰胺键羰基氧相互作用, 起到了增强羰基亲电性的酸催化作用. 上述相互作用在Ssp DnaB的晶体结构中得到了观测[77], 也得到了计算结果的支持[78]. 此外, Muir等[79]发现对于Npu DnaE内含肽, 在无法形成支链中间体的C1A突变体中, Asn环化速率会降低至突变前的1/200, 说明支链中间体的形成促进了Asn的环化[图7(C)].


最后, 在内含肽从体系中脱离后, 两段外显肽间的硫酯键通过S-N酰基迁移形成天然肽键, 进而得到剪切产物. 该过程不需要其它辅助, 在中性条件下能够自发进行[80].


在一些分裂内含肽中, 上述机理中的Cys被Ser和Thr替代, 反应过程中形成相应的氧酯中间体 (表1和表2). 此外, 部分内含肽第一步剪切的亲核氨基酸位于内含肽内部而不是N端, Mootz等[58]报道了第一个遵循这种机理的天然分裂内含肽NrdHF, NrdHF参与第一步N-S酰基迁移的Cys位于IntC序列的中间部位.


除了内含肽序列内部氨基酸的催化作用, 分裂内含肽还表现出对外显肽序列的敏感性:靠近剪接位点的外显氨基酸突变对反应效率和产率有明显影响, 暗示外显序列可能与关键氨基酸存在相互作用. Muir等[81]将Npu*内含肽(Ssp DnaE-N和Npu DnaE-C的组合)C-端外显肽从天然的CFN改为SGV, 发现C端剪接效率明显下降. 通过定向进化, 得到了可以更有效剪接SGV作为C-端外显肽的mNpu*, 其中包括F-Block D124Y突变. 晶体结构研究显示, C端外显肽CFN中的Phe与促进Asn环化的F-Block His125存在π-π堆叠作用, 使His125处于有利于催化的取向, 而D124Y突变使Tyr代替了Phe的作用, 从而减轻了分裂内含肽对C-端外显肽的敏感性. Mootz等[82]发现将Ssp DnaB N-端外显肽的Gly改变为L-Ala会导致剪接效率明显下降, 而改变为D-Ala的效率下降幅度较小. 通过观察晶体结构, 认为N-外显肽的氨基酸侧链可能与B-Block His侧链产生位阻冲突, 干扰His的催化功能, 而其它朝向的侧链(如D-Ala)产生的位阻冲突较小. 这些实验结果说明外显肽与内含肽之间存在互作, 可能是外显序列敏感性的重要原因.


3 分裂内含肽的工程化改造与性能优化


分裂内含肽已经成为一种广泛应用的蛋白质连接工具, 但在其应用过程中依然存在一些挑战, 因此研究者希望能获得具有更优性能的内含肽, 包括剪切活性和稳定性高、 对外显肽剪接位点附近氨基酸序列的耐受性强, 不同分裂内含肽间的反应正交, 分裂内含肽序列短, C-端或N-端长度在固相合成范围内等. 为获得具有上述特性的分裂内含肽, 研究者们进行了广泛的探究与尝试.


3.1 分裂内含肽的剪切活性和稳定性

2016年, Muir等[83]使用理性设计方法获得了具有强稳定性和高剪切活性的分裂内含肽. 通过分析DnaE家族的Npu(快)和Ssp(慢)分裂内含肽之间剪接效率的差异发现, 大多数关键残基在空间结构上与活性位点直接邻近. 以这些关键氨基酸残基作为对齐位点, 对73个DnaE家族的内含肽进行比对, 最终得到了一个新型分裂内含肽Cfa. Cfa显示出快速的蛋白质剪接活性以及高的热稳定性和变性稳定性. 在30 ℃下, Cfa的剪切速率比此前报道的DnaE家族中最快的Npu DnaE快2.5倍, 其t1/2仅为20 s. 同时, Cfa对变性条件具有很强的耐受性, 在3~4 mol/L Gn·HCl或8 mol/L尿素等强变性体系中都保持良好的剪接活性, 剪接反应平衡常数K>1×10-2 s-1.


3.2 分裂内含肽对剪接位点的兼容性
2011年, Liu等[84]通过定向进化技术, 得到了具有高外显肽剪接位点兼容性的内含肽. 将Ssp DnaB内含肽基因插入到卡那霉素抗性蛋白质(KanR)的基因中, 使得含内含肽的KanR蛋白前体没有卡那霉素抗性, 只有发生了蛋白剪接反应得到完整KanR蛋白, 卡那霉素抗性恢复的菌株才能在含卡那霉素的培养基中存活. 对存活菌株的质粒进行测序, 即可获得能够在该插入位点发生剪接反应的内含肽基因序列(图8). 经过多个筛选循环, 进化得到了多个新型内含肽, 能够在多个不同的外显肽剪接位点和不同的蛋白质中都显示出高剪接活性. 其中, M86突变体内含肽具有最好的剪接反应性能. 将M86通过人工分裂为N端由11个氨基酸组成的分裂内含肽. 与突变前的分裂DnaB内含肽相比, M86催化蛋白质反式剪接反应的速率增加了60倍, 反应常数kM86=2.5×10-3 s-1, 并且分裂内含肽片段的Kd值提高了一个数量级.

2017年, Muir等[85]报道了外显肽序列耐受性明显提高的自然分裂内含肽. His125是蛋白质剪接最后一步中Asn137环化的关键催化残基, 通过设计His125所在的环(残基122~124), 可以有效地改变His125构象动力学, 从而显著增加剪切反应对+2与+3位置的外显肽序列耐受性, 并提高了剪切速率. 基于对蛋白质剪接关键的催化位点的理解, Muir等对分裂内含肽His125所在的环进行了饱和突变, 然后使用基于细胞的选择系统来鉴定能够在不同外显肽剪接位点下催化有效剪接的突变体, 发现大多数菌落在残基122~124处含有GXP基序(GRP, GEP或GPP, 代替天然ERD序), 其中GEP序列具有最高的剪接活性(图9).

研究表明, Npu DnaE内含肽的外显肽序列偏好主要局限于C端外显肽+1位的催化半胱氨酸和+2位的大位阻疏水残基, 将天然+2位Phe外显肽序列残基突变为体积较小的残基(例如Ala)会导致剪接率显著降低[79]. Muir等[85]以GFP蛋白作为模型, 表征了对于不同外显肽位点的剪接活性. 经过GEP序列改造的Npu DnaE内含肽与未改造的Npu DnaE内含肽相比, 对不同的+2和+3位外显肽序列的剪接产率均有显著提高(图10).

3.3 分裂内含肽的反应正交性
分裂内含肽的N端和C端片段之间具有强烈的电荷-电荷相互作用. 2019年, Iwaï等[86]基于对分裂内含肽2个片段结合过程“捕获和折叠机制”中的静电相互作用, 将2个分裂内含肽片段结合关键位置的氨基酸电荷网络进行改造, 实现了2种DnaB家族分裂内含肽结合的正交性. 这一策略也适用于从其它顺式剪接内含肽中产生新的分裂内含肽.
2020年, Wang等[87]筛选检测了天然存在的分裂内含肽的剪接反应, 建立了包含15种分裂内含肽的正交分裂内含肽库. 研究结果表明, 正交分裂内含肽可以与多个分裂转录因子结合, 以在活生物体中实现复杂的逻辑表达过程, 还可以用于多片段蛋白的体外连接. 作者以SasG蛋白重复片段进行展示, 使用正交分裂内含肽组合, 一锅完成了6个片段的拼接(图11), 证明了正交分裂内含肽扩展库的多功能性和巨大潜力.

尽管分裂内含肽介导的PTS在蛋白质半合成上取得了一定的成功, 但也存在一些局限, 如修饰基团的选择性引入位点通常只能位于目标蛋白的N端或C端. 随着越来越多的分裂内含肽被鉴定或设计出来, 分裂内含肽工具箱逐渐丰富, 在同一目标蛋白的半合成中同时利用2种相互正交的分裂内含肽进行多次PTS的策略成为可能.
Muir等[88]首次开发了通过2种正交分裂内含肽实现一锅三片段反式剪接的策略, 该方法被称为串联蛋白反式剪接(tPTS). 目标蛋白分为3个片段, 即POIN和POIC以及一个通过表达或化学合成获取的带有所需修饰基团的较短中心多肽片段X(图12). 所使用的2个正交分裂内含肽(A和B)与POIN和 POIC融合表达(POIN+IntN-A及IntC-B+POIC), 而X与A和B的另外2个片段融合(IntC-A+X+IntN-B). 这种新颖的系统可以实现3个多肽片段的一锅化组装, 合成了304个残基大小的c-CrkII蛋白, 其由一个SH2结构域和2个SH3结构域组成, 每个结构域分别与相应分裂内含肽构成tPTS的前体片段. 反应在22 ℃下进行了48 h, 以约48%的收率完成了三片段剪接. 该方法为较大的多结构域蛋白的半合成及蛋白序列中央特定位点引入化学修饰提供了一种方便的方法.

3.4 分裂内含肽的使用便捷性

天然断裂的gp41-1内含肽是目前报道的最小的分裂内含肽之一, 具有非常高的反式剪接活性[56], gp41-1内含肽由88个残基的IntN和37个残基的IntC组成. 为了使内含肽对外显肽性质的干扰更小, 人们通常希望使内含肽尽可能小. Iwaï等[86]尝试从gp41-1内含肽的自然分裂位点处截短2个残基, 从而获得更小的分裂内含肽. 然而, 这种缺失使内含肽的蛋白质剪接效率降低了约40%, 作者后续试图优化内含肽的氨基酸序列以恢复截短的gp41-1内含肽的剪接活性到原有水平, 但没有成功. 这表明gp41-1内含肽的大小可能已达到实现功能的最小值.


Neq, Npu和Ssp DnaE等大部分天然分裂内含肽都在常规的内含肽分裂位点S0处断裂, 该位点也充当归巢核酸内切酶插入的标准位置. 该位点靠近内含肽C端, 断裂产生约100个氨基酸残基的IntN和35个氨基酸残基的IntC. IntC较短, 便于与C端外显肽片段共同固相合成, 因此这样的分裂内含肽为蛋白质C端半合成以及标记提供了方便. 然而, 由于蛋白质固相合成能力的限制, 通过固相合成与N-内含肽相连的蛋白是相对困难的, 这也限制了分裂内含肽在N端半合成蛋白质或者蛋白质N端修饰等场景的应用. 因此, 研究者们希望寻找或开发具有更短N端片段的分裂内含肽.
2004年, Liu等[63]将Ssp DnaB迷你内含肽从非常规的分裂位点切割, 报道了3个新的分裂位点S1, S8和S11, 从这3种位点切断, 都产生了能够进行蛋白质反式剪接的两段式分裂内含肽(图13). 其中S1分裂内含肽的N端仅有11个氨基酸. 由于不同的内含肽具有相似的结构, 这些新的分裂位点可以推广到其它内含肽. Liu等[63]还首次证明了分裂为3段的分裂的内含肽依然可以组成复合物并恢复蛋白质剪接活性.

2014年, Mootz等[59]从宏基因组数据中鉴定并表征了新的分裂内含肽AceL-TerL. 这是首次发现存在天然非典型分裂的内含肽. 只有25个氨基酸的N端片段是迄今为止最短的天然IntN片段, 易于通过固相合成获取. 在8 ℃的低温下, 该内含肽具有最高达90%的蛋白质反式剪接效率. 作者通过定向蛋白质进化选择了进一步改进的突变体. 工程化的内含肽突变体在37 ℃下具有更高的剪接效率, 反应速率常数k>1.8×10-3 s-1, 并在化学标记多种蛋白质应用中展现出天然序列最高50倍的效率.


4 分裂内含肽在蛋白质离体与在体合成中的应用


4.1 离体蛋白质半合成
分裂内含肽介导的PTS为蛋白质半合成提供了一种新途径. 不同于NCL[15]和表达蛋白连接 (EPL)[89~92]等标准蛋白质化学连接反应需要较高浓度(因其依赖于多肽片段的随机碰撞), PTS能够在μmol/L浓度条件下反应, 显示出较低浓度依赖性(因其由2个片段之间紧密的蛋白质-蛋白质相互作用促成)[69], 这使得分裂内含肽成为蛋白质半合成的有吸引力的工具.

通过PTS完成半合成的目标蛋白(POI)将被拆分为N端(POIN)与C端(POIC)2个前体片段, 其作为外显肽分别与相应的分裂内含肽片段相连接, 由此组成的融合体片段分别都可以在PTS反应之前单独制备并将所需的修饰引入相应的片段中. 由于许多经过优化的分裂内含肽片段较小, 故含有较小分裂内含肽片段的目标蛋白前体片段(POIN⁃IntN或 IntC⁃POIC)可通过固相多肽合成获得, 从而可以容易地将修饰基团选择性引入目标蛋白的N-端或C-端.


Mootz等[11]将Ssp DnaB分裂内含肽用于蛋白质半合成以实现N端修饰. 该IntN片段仅含11个氨基酸, 便于通过固相多肽合成同时制备IntN与含修饰基团的目标蛋白片段[图14(A)]. 为证明PTS在N-端修饰蛋白质半合成中的效果, 对2种蛋白质底物进行了N-端荧光素标记. 合成肽5-Fl-SEFSG-IntN与融合表达的蛋白片段IntC-Trx-His6以等摩尔浓度(62 μmol/L)在25 ℃下反应22 h, 经纯化后的半合成产物Fl-Trx-His6总收率约为30%. 第二个例子是分子量30700的β-内酰胺酶(βLac). 融合表达蛋白片段IntC-βLac-His6与5-Fl-SEFSG-IntN在25 ℃, 12 μmol/L浓度下共孵育42 h, 以约30%的收率得到剪接产物 Fl-βLac-His6.

Liu等[93]报道了一种新型工程化S11 Ssp GyrB分裂内含肽. 其分裂位点在C-端附近, 产生长度约150个氨基酸残基的IntN片段和长度仅为6个氨基酸残基的IntC片段, 可用于将合成肽连接到表达蛋白的C端[图14(B)][94]. 这些新颖的包含非常短的N端或C端片段的分裂内含肽显著扩展了其在蛋白质半合成中的应用, 使得将修饰基团添加到目标蛋白的N端或C端更加方便.


利用分裂内含肽还可以实现蛋白质的位点选择性修饰. 为了克服对含有多个半胱氨酸的目标蛋白难以实现选择性修饰的限制, 即在其中一个特定半胱氨酸位点的侧链巯基引入修饰而不影响其余半胱氨酸残基, Mootz等[13]将半胱氨酸修饰与PTS结合使用. 具体来说, 人工分裂的Ssp DnaB和Mxe GyrA的IntC片段的外显肽+1位点分别由丝氨酸或苏氨酸而非半胱氨酸来介导PTS. 将这些分裂内含肽片段与具有单个半胱氨酸的短肽序列(称为CysTag)融合表达, 在该片段中引入荧光团、 生物素及聚乙二醇(PEG)等修饰后, 经PTS获得全长的目标蛋白. 该方法实现了在含有多个半胱氨酸的目标蛋白, 如硫氧还蛋白[13]、 β-内酰胺酶[13]、 人生长激素和非核糖体肽合成酶TycA[95]等蛋白质中的单一半胱氨酸位点的选择性修饰.


近期, Pless等[96]将该策略应用于体内蛋白质修饰, 允许将多种修饰(包括磷酸化、 乙酰化模拟物和非天然氨基酸等)同时引入活的真核细胞中. 通过体内tPTS策略, 在NaV1.5离子通道的胞内域和P2X2受体的胞外域中引入了修饰, 研究了翻译后修饰在离子通道功能以及受体与配体结合中的作用. 正交分裂内含肽介导的串联蛋白反式剪接在体外和体内的蛋白多片段剪接都展现了良好的效果, 有望在蛋白质半合成中得到更多的应用.


4.2 片段同位素标记

在目标蛋白质中引入具有NMR效应的15N及13C等重原子核的同位素标记可看作是上述通过PTS将化学修饰引入蛋白质的一个具体例子, 这一技术最重要的应用是用于核磁共振波谱研究来表征蛋白质的结构和动力学. 然而对于较大蛋白质来说, 全长同位素标记的样品中显著的峰重叠使得核磁共振谱的解析变得困难.


使用分裂内含肽介导的PTS可以将具有重同位素标记的蛋白质片段与无标记的片段连接起来, 生成部分片段标记的全长蛋白质样品, 显著简化核磁共振波谱. Nakamura等[46]于1998年使用了来自古菌Pyrococcus furiosus的内含肽(PI-PfuI), 并将其人为分为2个片段, 分别与作为核磁共振表征的靶蛋白RNA聚合酶α亚基的C端结构域(αC)的2个片段融合(图15). 经同位素标记的片段与另一未标记片段在体外混合并发生反式剪接反应, 首次获得了用于核磁共振表征的部分片段同位素标记的蛋白质样品.

尽管最初标记的目标蛋白质仅有约9000 Da, 但该系统后来成功地用于制备分段同位素标记的麦芽糖结合蛋白(42000 Da)[97]及F0F1ATP酶β亚基(52000 Da)[98], 证明了通过分裂内含肽实现的分段同位素标记可用于更大目标蛋白质的NMR结构分析.


Iwaï等[12]开发了一种通过三片段蛋白质剪接来实现片段同位素标记的新策略. 利用具有相同序列但分裂位点不同的NpuDnaE工程化分裂内含肽, 对来自Lyngbya majuscula的Curacin A(CurA)蛋白通过三片段蛋白剪接来实现部分片段同位素标记. 该蛋白包含3个顺序的酰基载体蛋白(ACP)结构域. 这 3个结构域之间高度的序列同一性(93%~100%)导致其所有3个结构域均被同位素标记的样品的NMR信号严重重叠. 因此, 选择性地对该三结构域蛋白质的中心结构域进行了同位素标记, 通过分裂内含肽介导的PTS, 以约40%的收率获取了用于NMR分析的部分片段同位素标记的全长CurA蛋白. 该方法将部分片段同位素标记策略在核磁共振研究中的应用拓展到了多结构域蛋白中的结构域-结构域相互作用研究.


Iwaï等[99]还开发了将同位素标记的片段与未标记的片段在同一细菌培养物中一次生成, 随后直接发生剪接反应来体内获取分段同位素标记的全长蛋白的策略. 其基本原理是在单个细胞培养过程中的不同时间表达含分裂内含肽的蛋白片段前体, 并在各个表达步骤之间更换未标记或同位素标记条件的培养基. 这样, 只有一种前体蛋白片段是被同位素标记的, 剪接反应后得到的即是只有一个片段被同位素标记的目标蛋白, 实现了分段同位素标记蛋白质的直接体内获取[98].


4.3 多肽和蛋白质的环化
基于细胞的环肽筛选方法相对于噬菌体展示等体外筛选方法, 可以更为稳健地得到具有体内活性的环肽, 并兼具较低的细胞毒性、 较好的溶解度等性质. 分裂内含肽介导的PTS因其片段可以直接通过表达获取并且可以将两侧的多肽片段连接起来的特性, 可被用来在细胞内生成环肽. 即通过2个分裂内含肽片段的结合, 迫使其两侧连接的线性多肽的N端和C端通过肽键头-尾连接, 完成环化(图16).

为此, Benkovic等[2]开发了分裂内含肽介导的多肽和蛋白质环状连接(SICLOPPS)技术. 这项技术可以实现体内的环肽文库构建, 并结合功能筛选, 得到了许多具有生物活性的环肽, 如酪氨酸酶抑制剂pseudostellarin F[2]及甲基转移酶抑制剂等[100].


为了增加生成环肽的功能基团多样性, Schultz等[101]通过与遗传密码扩展技术将非天然氨基酸插入到系统生成的环肽中, 丰富了可生成环肽文库的多样性, 且筛选出了HIV蛋白酶环肽抑制剂. Lindquist等[102]构建了第一个酵母兼容的环肽文库, 并筛选出了可在酵母及动物模型中特异性降低 α-synuclein毒性的环肽分子.

为了开发可以调控蛋白质-蛋白质相互作用的环肽分子, Benkovic等[103]整合了SICLOPPS与反向双杂交系统(RTHS)2种技术. 在宿主细胞中经SICLOPPS技术产生的环肽文库通过RTHS系统直接进行筛选, 鉴定出了调节FKBP12-雷帕霉素-FRAP相互作用和HIV-1蛋白酶和核糖核苷酸还原酶相互作用的环肽分子, 展示了SICLOPPS技术构建环肽文库并用于获取可调控蛋白质-蛋白质相互作用的环肽的潜力.


另外, 研究者们还开发了将分裂内含肽与连续内含肽联用来构建环肽的方法[104], 以及通过PTS形成肽键完成肽环化后, 再利用半胱氨酸残基形成大环肽内部的二硫键来构建双环肽产物的策略[105], 这体现了分裂内含肽相关方法用于构建环肽类分子的良好效果及广泛应用.


基于分裂内含肽的多肽环化还可与其他新兴筛选技术结合, Park等[106]开发了一种称为CWCPS(Custom-designed warhead-armed cyclic peptide screening)的策略, 将可与靶蛋白活性位点结合的弹头化学基团引入由分裂内含肽介导的PTS生成的环肽抑制剂, 再通过酵母双杂交进行细胞内筛选. 构象稳定的环肽中的弹头化学基团与活性位点结合后的的解离更慢, 亲和力显著增强. 通过该方法发现了一种针对癌症靶点HDAC8有效的抑制剂CY5-6Q, 其表现出很强的结合亲和力(KD=15.1 nmol/L)和抑制作用(IC50=0.61 μmol/L). 这表明基于分裂内含肽的方法是细胞内构建环肽的一个相对稳健的策略, 在有前途的环肽药物前体的发现中发挥作用.


4.4 条件性蛋白剪接
条件性蛋白剪接(CPS)即通过一个外源调节器来激活或抑制蛋白剪接.基于分裂内含肽的CPS系统的基本原理是将人工设计的不能自发结合的分裂内含肽融合到目标蛋白的2个片段中, 通过引入特定外源分子或光照等方式重建其剪接活性;或是在活性位点残基处或附近进行化学修饰, 随后通过光诱导、 酶切等方式去除修饰, 从而使其恢复剪接活性. 因此, 可以通过控制内含肽的活性, 来得到一种随意“激活”任何蛋白质的方法, 甚至在体内也可以适用.
人工分裂的Sce VMA 内含肽在IntN和 IntC片段之间仅表现出非常低的亲和力, 在蛋白质剪接中几乎无活性. Muir等[107]将雷帕霉素结合结构域FKBP12和FRB融合到2个分裂内含肽片段后, 加入雷帕霉素, 可诱导2个片段相互靠近并结合, 进而导致分裂内含肽片段相互靠近并折叠成具有PTS活性的复合物[图17(A)]. 通过实现模型蛋白MBP和His-tag的CPS, 首次完成了蛋白质反式剪接反应的小分子激活调控. Mootz等[108]利用类似的思路, 将分裂内含肽片段分别与FKBP12的F36M突变体融合, 该突变体无需外加小分子即可发生同源二聚化, 进而介导分裂内含肽发生PTS. 而此时再加入雷帕霉素等小分子, 会通过与该结构域结合而阻断其二聚化, 进而实现PTS反应的条件性抑制, 提供了一种潜在的较为通用的手段用于翻译后的蛋白质功能调控. 除小分子响应的CPS系统外, Muir等[109]还开发了光响应性CPS体系, 将源于拟南芥的会在光照下发生二聚的光敏色素B(PhyB)与光敏色素相互作用因子3(PIF3)与Sce VMA分裂内含肽两端片段分别融合[图17(B)]. 类似于FKBP12与FRB对雷帕霉素的响应, PhyB与PIF3在光照下发生二聚, 使得VMA分裂内含肽也相互靠近并恢复剪接活性. 利用这一体系, 以MBP-Flag tag作为模型剪接产物在酵母中实现了光响应性CPS. 此外, Silver等[110]还将人工设计的互相之间具有较强亲和力的卷曲螺旋(Coiled coil, CC)引入VMA分裂内含肽, 实现了荧光素酶的CPS.

上述CPS系统都是通过将具有在一定条件下具有较高结合力的外加结构域与本身结合力较低的VMA分裂内含肽融合实现的. 而Muir等[111]报道了通过引入其它基团, 抑制本身就具有较高结合力的分裂内含肽的活性, 再在一定条件下移除抑制基团完成脱笼, 从而实现CPS的新策略(图18). 合成了在PTS的关键丝氨酸残基上通过β-羟基形成的酯键而非常规的通过α-氨基的酰胺键连接后续片段的Ssp DnaE内含肽片段类似物, 且其α-氨基基团被外加的保护基团修饰. 这阻断了该片段的O-N酰基转移过程, 使得剪接反应无法发生. 保护基团可以通过紫外线照射或蛋白酶剪切去除, 从而恢复该片段的剪接反应活性. 通过制备抗菌肽magainin的类似物展示了该CPS系统的潜在应用. Mootz等[112]将迄今已知剪接反应速率最快的gp41-1分裂内含肽N端片段中保守的苯丙氨酸通过遗传密码扩展技术突变为可光活化的邻硝基苄基酪氨酸[O-(2-Nitrobenzyl)-L-tyrosine, ONBY]. 在365 nm的紫外线照射下, 邻硝基苄基保护基被脱除, 剪接反应以与野生型gp41-1分裂内含肽几乎相同的速率发生. 越来越多的CPS策略的出现, 使得该方法有望成为可以在时空层面上调控体内蛋白质功能的手段.

5 总结与展望


经过研究者的持续探索, 分裂内含肽介导的蛋白质反式剪接已经由一种有趣的蛋白质翻译后现象发展成为一种应用广泛的高效连接方法. 对蛋白质反式剪接的化学过程的解析, 使人们更好地理解分裂内含肽结构与功能之间的关系. 快速反式剪接分裂内含肽的发现、 内含肽的序列进化、 内含肽无痕剪接策略的开发、 正交内含肽库的建立等, 都大大改进了基于内含肽的连接技术, 使其成为日渐成熟的蛋白质连接工具, 分裂内含肽介导的蛋白质反式剪接技术的应用已经蓬勃发展. 分裂内含肽系统促进了结构生物学的发展, 特别是核磁共振波谱结构解析中的应用;分裂内含肽系统也促进了合成或半合成更大、 更复杂、 带有多种修饰的蛋白质;此外, 基于分裂内含肽技术的环状肽库也已成为药物发现的有效策略.


然而, 人们也必须认识到目前对分裂内含肽的理解和研究尚不完善. 虽然对于分裂内含肽结合以及后续反应过程已经进行了研究, 但是对于反应过程中更细致的结构变构与催化功能变化的分析还比较粗糙. 更好地理解硫酯交换过程中2个巯基如何靠近, 支链硫酯如何对天冬酰胺环化过程产生促进, 都有助于更好地协调剪接反应的各个步骤的动力学, 从而提高整体的连接效率, 避免C-端或N-端水解副产物的出现. 此外, 目前对分裂内含肽在强变性、 高温、 氧化性等条件下的稳健性研究尚不充足, 可能在与其它化学反应联用时带来不确定性.


随着更多的微生物基因组被测序, 分裂内含肽的数量将迅速增长, 未来有望发现具有独特性质(例如能够耐受高温、 高盐等极端条件)的新型分裂内含肽, 丰富人类对分裂内含肽的认识, 揭示现今尚未认识到的潜力, 为分裂内含肽技术的发展带来新的机遇, 并最终获得通用型内含肽, 能够对任何外显肽序列均具有剪快速接动力学, 产率高, 分裂片段易于通过化学合成技术获取, 且连接活性易于通过外源刺激控制等.


免责声明:本文为行业交流学习,版权归原作者及原杂志所有,如有侵权,可联系删除。文章标注有作者及文章出处,如需阅读原文及参考文献,可阅读原杂志。

上篇: 用于软组织修复的肽基功能生物材料
下篇: 弹性肽在超分子组装中的应用
返回列表
全:种类繁多,修饰齐全
快:快速发货,顺丰包邮
优:专业团队,品质保证
24:客服在线,高效快捷

微信扫码联系客服
电话:0551-65177703  邮箱:pb@peptidesbank.com   地址:安徽省合肥市四川路868号云谷创新园A6栋3层
皖ICP备2024046425号-1