识别小分子药物的靶点
——基于生物素的光亲和标记技术
1. 背景知识
1.1 生物素与亲和素
生物素(biotin)又称维生素H、维生素B7,是一个含环脲基团的亲水小分子,少量存在于所有的活细胞中。亲和素(Avidin)是一个大小约67 kD的四聚体蛋白质,每一个单体可以结合一个生物素分子。生物素与亲和素的结合是已知的自然界最强的非共价键相互作用,其解离常数KD约为1×10-15 M。并且,这种结合一旦形成,其对有机溶剂、变性剂(如盐酸胍)、洗涤剂(如SDS、Triton X-100)、蛋白水解酶,以及在较高的温度和pH范围内都很稳定(解离通常使用pH = 1.5的8 M盐酸胍,或在SDS-PAGE缓冲液中煮沸进行)。因此,这种结合被用于亲和分离领域。
亲和素和生物素之间的强亲和力来源于:1)结合口袋与生物素的形状高度互补;2)在结合部分形成广泛的氢键网络,八个残基(包括Asn23、Ser27、Ser45、Tyr43、Asn49和Asp128等)直接与生物素形成第一层氢键,多个残基又与第一层的残基形成第二层氢键;3)结合口袋是疏水的,特别是其中存在多个色氨酸残基,与生物素有许多范德华力接触和疏水相互作用;4)最后,连接第3和第4 β链(L3/4)的柔性环在结合后也会稳定下来,该环就像一个结合口袋上的“盖子”,在结合后关闭,使得生物素解离非常缓慢。(PDB号1STP)
亲和素是糖基化的、带正电荷(等电点pL约为10)的,以及具有假催化活性(例如,亲和素会促进生物素-硝基苯酯的碱性水解过程),并且会产生较多的非特异性结合。因此,研究人员开发了去糖基化的亲和素用于分离领域,被称为中性亲和素(NeutrAvidin),能获得更好的专一性和适用性。亲和素最初从鸡蛋清中分离,与它相似的蛋白质还有来源于亲和链霉菌(Streptomyces avidinii)的链霉亲和素(Streptavidin),它们的区别如下表所示:
1.2 生物素化试剂
通常在生物素分子的戊酸侧链进行衍生化,加入各种活性基团,用于将生物素连接到其他分子上。这些生物素化试剂(biotinylation reagents)可针对各种官能团,例如伯胺、巯基、羧基和羧基。常见类型包括:1)用于修饰伯氨(赖氨酸)的生物素-NHS /Sulfo-NHS酯;2)用于与巯基(半胱氨酸)形成硫醚键的生物素-马来西酰亚胺、碘乙酰试剂;3)用于与巯基(半胱氨酸)形成二硫键的生物素-二硫代吡啶试剂;4)通过酸胺缩合反应,用于修饰羧基(谷氨酸、天冬氨酸)的生物素-伯胺试剂;5)能够与醛基反应的生物素-酰肼试剂,以及6)用于点击化学/光催化反应的生物素-叠氮试剂。
1.3. 基于亲和力的小分子靶点识别技术
靶点识别是新药开发的关键步骤,因为它能够让研究人员了解药物的作用模式,可以更好地优化药物,使药物达到更好的治疗效果。常见的生物大分子靶点包括酶、细胞受体、离子通道、转录因子和DNA等,由于它们种类繁多,确定一个药物的精确靶点十分困难。基于亲和力的靶点识别技术要求使用带标签的小分子探针(ABP, activity based probe),用它与细胞裂解液或蛋白质混合物孵育。然后,利用亲和标签纯化出伴侣蛋白,纯化后的蛋白可通过SDS-PAGE和MS进行分析鉴定。
ABP中常用的标签是生物素或荧光染料。生物素标记具有很多优点,例如成本低、纯化过程简单。但是,生物素-亲和素复合物需要在苛刻的条件下(例如在SDS-PAGE缓冲溶液中煮沸)才能打破它们之间的相互作用,使结合蛋白从树脂中释放出来。这种变性条件可能会改变所分离蛋白质的结构或活性。并且,生物素附着在小分子上还会影响细胞的通透性和表型结果,这在处理活细胞时可能是一个缺点。例如,用生物素化化合物处理细胞会减少 IL-2 的产生,限制免疫细胞的活化和增殖,从而可能影响它们对免疫刺激的响应。此外,生物素标签还可能改变活性分子在体内的性质及其与靶蛋白的作用模式,限制了探针分子在体内细胞的吸收与分布。因此,实验一般都是在体外进行的,而体外的功能蛋白质组学研究只能大致地揭示活细胞或动物体内组织中蛋白质的功能状态。
近年来,发展出了不带标签的探针分子,生物素或荧光染料标签是在探针分子共价标记了靶蛋白后,通过Huisgen 1,3偶极环加成反应(叠氮与炔基形成三氮唑)连接到探针分子上。无论是否带标签,运用基于亲和力的小分子靶点识别技术的前提是:活性小分子能够与靶蛋白不可逆共价结合。但是,在大多数情况下,活性小分子与靶点蛋白之间的作用是可逆的、不牢固的。此时,探针分子的设计就需要引入光反应性基团,其作用是在探针分子与靶蛋白(可逆)结合后,通过光解作用在探针分子与靶蛋白之间引入共价键;这一技术被称作光亲和标记(PAL,photoaffinity labeling)。
1.4 肽图法鉴定蛋白质
利用蛋白水解酶作用于特定的氨基酸残基将肽键断开,从而将蛋白质或大的多肽裂解成小的多肽片段(一般包含10个左右的氨基酸),然后用高效液相对肽段进行分析,得到的色谱图即为肽图;通过比较样品与标准品的肽图,能够得出蛋白质的纯度和表达准确性等信息。通过与质谱联用,可以获得每个片段或其碎片更精确的分子量信息,进而鉴定未知蛋白质的初级结构。
为获得理想的肽图谱,在进行特异性裂解之前,需要对待测蛋白质样品进行预处理。对于复杂的大分子蛋白,其高级结构形成的空间位阻可能阻碍裂解剂到达裂解位点发挥作用,需要进行必要的变性剂处理、二硫键还原以及随后的游离巯基烷基化保护等步骤。变性可在37 ℃下,6 M盐酸胍或8 M尿素溶液中进行;二硫键还原通常在变性过程中加入DTT等还原剂实现。如果还原后的半胱氨酸巯基保持游离状态,则可能以错误的方式重新形成二硫键,因此通常加入碘乙酸等试剂,使游离巯基烷基化。经过上述处理后,应当进行脱盐和缓冲溶液交换步骤,然后进入蛋白酶裂解过程。
根据待测蛋白质的结构特性选择特定裂解方法。几种通用的化学或酶裂解试剂见下表。
影响蛋白质裂解效率和重现性的因素包括反应体系pH、缓冲液类型、反应温度、反应时间以及裂解剂用量等。应当根据经验或者预实验确定最佳的反应条件。有许多商品化的蛋白质裂解试剂盒,可以得到较好的结果。
对于多肽分离,首选的色谱柱孔径范围为100 Å至120 Å,而固定相通常选择C18填料。肽谱分析中最常用的溶剂为水(磷酸盐缓冲溶液)和乙腈(用作有机改性剂),某些情况下,会加入丙醇或异丙醇用以溶解酶解成分。还需要加入必要的离子对试剂(不超过0.1%),一般为TFA,这种成分可与多肽的带电基团形成离子对,增加多肽的疏水性,从而增加保留、改善分离。UV检测波长则通常为210~220 nm和/或280 nm。
多肽的质谱分析可用于结构鉴定。一般情况下,质谱分析类型包括电喷雾(ESI)和MALDI-TOF-MS,以及快速原子轰击(FAB)。使用ESI或MALDI时,蛋白质水解多肽可完整电离为气相,并可测量它们的精确质量。因为易于与液相色谱连接,大多数多肽质谱分析在ESI-MS仪器上进行。在质谱中被识别的肽段,可选中用于二级质谱检测。被选中的肽段在高能惰性气体撞击下断裂成若干个碎片,这些碎片的离子峰谱图与分子离子峰谱图构成MS/MS谱图,能够为蛋白质鉴定提供更为丰富的信息。
单个肽段的断裂是随机的,一次断裂产生一对离子峰;常见的断裂方式为β断裂,即在肽键的C-N键处断裂,产生一系列b离子和对应的y离子。MS/MS谱图创建完成后,需要对二级谱图中的离子峰进行仔细辨别,这一过程过去是手动完成的,需要剔除干扰峰,需要计算各个峰之间的差值,耗时费力。如今已经有非常多的质谱图处理软件,并且能够检索离子峰数据库,可以大大简化这一过程。Comet是一款常用的基于SEQUEST算法的开源软件;SEQUEST HT在蛋白组学(Proteome)研究和TMT(Tandem Mass Tag)分析中更有用;整合在MassQC中的Andromeda程序可用于SILAC(细胞培养氨基酸稳定同位素标记)样品。Byonic程序则适合不严格的氨基酸翻译后修饰(PTM)研究。每种软件都有各自的特点和缺点,但它们在鉴定多肽方面遵循相似的逻辑。
2. 光亲和标记技术
2.1 光亲和标记探针的设计
光亲和标记探针分子应具有适当的生物活性,与靶点的作用机制应与其母体化合物(parent compound)保持一致。光亲和标记探针分子的活性越高,就越容易对其受体进行特异性标记。但是当探针分子活性过高时,它与受体的结合是静态的,所得到的受体活性部位的结构信息通常是局部的、不完整的。探针分子活性适中时,它与受体的结合是动态的,所得到的受体活性部位的结构信息通常是比较丰富的、完整的。
通常,光亲和标记探针包含四个组成部分:活性部位(activity site)、光反应性基团(photoreactive group)、报告基团(reporter tag)以及连接子(linker)。活性部位即活性小分子,负责与靶点蛋白可逆结合;光反应性基团负责与靶点蛋白形成共价结合;报告基团用于探针-靶点蛋白复合物的检测与分离;各部分通过连接子连接到一起。连接子应具有合适的长度,太短可能发生探针自身的交联,太长则可能导致光反应性基团与靶点蛋白距离不够而损失标记效率。光反应基团可以位于在连接子上(下图A),也可以插入到活性部位(下图B);具体方案取决于构效关系(SAR)研究。如果活性小分子的结构来源于SAR研究,那么连接子可以附着在那些对活性影响较小的位点,在此基础上,往往需要合成10~50个不同取代位置和连接子长度的类似物用于筛选。需要注意的是,具有较长连接子的完整光亲和标记探针很少能够穿透细胞,因此基于细胞的活性评估往往是不充分的。
针对靶点已知的小分子化合物,在设计寻找其它靶点的探针时,可以将已知靶点蛋白作为结合专一性的替代对照(surrogate control)。针对有明显体外细胞活性甚至体内活性,但是作用靶点不明的小分子化合物,设计探针分子时,必须在标记实验中加入相对于探针分子的大大过量的母体化合物(一般相当于探针分子的100~1000倍),考察其是否与母体化合物竞争同一活性位点,以确证其与母体化合物具有相同的作用机制。
细胞穿透型探针在捕获活细胞靶点时非常有用。但是,由于包含光反应性基团和报告基团,以及连接子往往含有较长的PEG链,较大的光亲和标记探针分子很难穿透细胞。为克服这一局限,可以设计较小的(截短的,truncated)光亲和标记探针,在其进入细胞后,通过点击化学方法,再引入报告基团(如上图C)。如前所述,通常使用铜(I)催化的Huisgen 1,3偶极环加成反应,叠氮基手柄与炔基手柄的所属单元可以互换。
2.2 光亲和基团/光反应性基团
理想的光亲合基团具有以下特点:1)具有一定的化学稳定性,能耐受普通的化学反应;2)在自然光中合理的稳定性;3)在黑暗中稳定,在不对生物样品造成损伤(>300 nm)的紫外光照下很容易光解;4)光解后的活性中间体既能与亲核的X-H(X=N, S, O)官能团反应,也能与C-H 键反应;5)得到的产物比较稳定,能够耐受分离分析处理过程。
常用的光亲和基团包括叠氮苯类、(苯基)双吖丙啶类和二苯甲酮类(下图A),分别在特定波长光照下产生氮宾(nitrene)、卡宾(carbene)和双自由基(diradical)活性中间体。其他可用于光亲和标记的基团有重氮基团、重氮羰基、烯酮、硫自由基和硝基苯类等。
叠氮苯基的引入相对方便,因此这类光亲和基团最常用。但是必需考虑到它存在一些缺点:1)一般的叠氮苯基有效光解时需要较短波长的光照,这样的波长将对活性大分子造成严重损伤;2)产生的氮卡宾通常也不如卡宾活泼;3)高活性的苯基氮卡宾将迅速重排生成比较稳定的烯亚胺(ketenimine)结构,这种结构只能与亲核性X-H官能团反应(X=O, N, S等),如果活性位点部分没有亲核性官能团,那就可能迁移到离活性位点较远区域标记,产生非特异性标记;4)光解产生的氮卡宾与受体作用时形成不太稳定的C-N键,或很不稳定的N-杂原子键。
据报道,多氟取代的叠氮苯由于提高了反应能垒,可以阻止单线态氮卡宾中间体向烯亚胺结构转变。而且邻位被氟取代的叠氮苯,可以大大延长活性中间体氮卡宾的存在时间,保证有充分的时间使其与受体发生分子间反应。多氟取代叠氮苯比较容易制备,而且表现出较高的热稳定性。叠氮苯基光亲和基团的标记效率通常不高(约30%)。
二苯甲酮类光亲和基团光解时形成的三线态双自由基分子不发生重排反应,主要与蛋白质分子中的C-H键反应,在质子性溶剂中稳定,几乎不与水反应,使得其激发态只能与靶蛋白作用,通常其标记效率较高。然而,由于其双自由基分子不能被缓冲液萃灭,也可能导致一些非特异性标记,其光解时需要长时间紫外光照,这可能导致蛋白质损伤或实验细胞死亡。
三氟甲基苯基双吖丙啶是最接近理想的光亲和基团。它具有以下优点:1)很好的化学稳定性,能耐酸碱;2)光解波长约360 nm,大于蛋白质的紫外吸收波长,因此对蛋白质的损伤很小;3)光解后产生卡宾活性中间体,不仅能与X-H(X=O, N, S等)反应,也能以较高效率完成对C-H键进行插入反应;4)卡宾与受体形成的产物比氮宾的产物更稳定。5)卡宾中间体十分活泼,因此会很快被水淬灭,这对于标记产率来说是不利的,但是另一方面,由于其半衰期很短,能够最大程度减少非特异性标记。在光照下,双吖丙啶可以转化成单线态卡宾,也有约30%转化为重氮化合物。主要形成的加成产物如下图所示:
2.3 报告基团
放射性同位素、亲和性标签以及荧光染料都可以作为报告基团。其中生物素是最常见的亲和性标签,抗体(抗原)表位也可以作为亲和性标签。后者的优势是,抗原表位标签很容易从对应抗体固定树脂上系脱下来,这对于生物素-亲和素系统来说是困难的。亲和性标签通常不利于探针穿透细胞,而且由于空间位阻可能影响探针对靶点的亲和力,其处在探针上的位置十分关键。
荧光染料标签通常用于基于活性的蛋白组学分析(ABPP,activity based proteomics profiling)。而且是成员种类最为丰富的一类标签。常用的包括荧光素、常用的包括荧光素、BODIPY(二吡咯烷酮二氟化硼)、罗丹明、氰蓝染料(Cy-5和Cy-3)和 NBD(硝基苯-2-氧杂-1,3-二唑)。每一类染料都有自己的优缺点;总的优点是标签具有疏水性,通常可以穿透细胞膜。与其他替代品相比,荧光素和罗丹明价格低廉,但它们存在光漂白现象。BODIPY和氰基染料具有吸收系数高、吸收峰窄、量子产率高等特点,可提供更清晰的检测和识别。
2.4 光亲和标记技术工作流
在大多数操作规程中,细胞或细胞裂解液都要经过光亲和探针处理,并留出时间让探针与受体结合。然后用特定波长的光照射样品,激活光亲和探针与临近的生物分子共价交联。如果在活细胞上进行,则需要裂解细胞后,样品与报告标签进行点击化学偶联。通过亲和标签对应的亲和纯化系统,将被标记的蛋白质从的混合物物中分离。通过SDS-PAGE分析,使用针对报告标签的专用设备和试剂,对标记蛋白质的范围进行可视化。蛋白质从凝胶中分离出来,经过多种蛋白酶消化,产生多肽片段。这些片段可通过MS测序来确定分离蛋白质的特征。还可以得出与光亲和探针反应的氨基酸序列,这可能会提供有关结合位点的额外信息。PAL技术的一个局限是可能的非特异性标记。由于样品蛋白质分子不易获得,在光亲和标记实验中,人们倾向于加入大大过量的探针分子(相对于蛋白质分子),导致在标记实验中产生大量的非特异性标记。此外,光亲和探针通常会与含量较高的或“粘性”蛋白质发生交联。为了区分本底标记和特异性标记,可以进行一些对照实验。例如,评估在没有光亲和探针和没有紫外线辐射的情况下产生的标记量。此外,进行竞争实验也特别有用,它可以突出蛋白质的特异性交联。通常情况下,未修饰的母体化合物比光亲和性探针对受体的亲和力更大。竞争实验的方法是用过量的母体化合物或另一种光稳定性类似物,一起对样品进行孵育,蛋白质的特异性标记可通过报告标签信号的剂量依赖性下降来识别。
转载自明日药物