摘要 :整合蛋白是一类重要的细胞表面黏附分子,由 α 和 β 亚基以非共价键结合而形成的异二聚体糖蛋白,对免疫反应、免疫细胞的组织定位、凝血、组织愈伤、癌细胞转移和新血管生成以及骨重塑等都至关重要。整合蛋白的功能依赖于对其配体结合的亲和性,以及所介导的下游信号通路。目前,对整合蛋白构象调节及亲和力调控机制已有深入了解。人类 24 种整合蛋白中,已有 3 种整合蛋白作为临床治疗靶点。这些药物以单克隆抗体、多肽和小分子化合物为主,均针对配体识别序列而设计。该类抑制剂往往具有部分激活的作用,直接导致药物的副反应和毒性。为了改善第一代整合蛋白药物的不足,目前基于晶体结构研究、虚拟筛选、高通量筛选以及基于结构设计的新型整合蛋白抑制剂,已经有许多进入临床试验。本文综述了一系列晶体结构中蛋白质与抑制剂的相互作用,以及借助晶体结构获得纯抑制剂为目的的实例,这些策略将会对开发新型有效的整合蛋白抑制剂提供很好的参考。
整合蛋白( integrin) 是一类重要的细胞表面黏附分子( cell adhesion molecule,CAM) ,由 α 和 β 亚基以非共价键结合而形成异二聚体糖蛋白。迄今,已发现 18 种不同的 α 亚单位和 8 种 β 亚单位,组成至少 24 种整合蛋白。根据整合蛋白分子中 β 亚基的不同,可将其分为8 个亚家族。如含有 β1 亚基的 VLA( very late appearing antigen) 亚家族; 含 β2 亚基的白细胞整合蛋白( leukocyte integrin) 亚家族; 以及细胞黏附素( cytoadhesin) 亚家族。此外,整合蛋白按识别配体不同可分为 3 大类,第 1 类识别血管中纤维蛋白原( fibrinogen) 的受体,如 aIIbβ3; 第 2 类识别细胞外基质( extracellular matrix,ECM) 的受体,如 αvβ3、α4β7; 第 3 类识别白细胞的受体,如 αLβ2( lymphocyte function associated antigen-1,LFA-1 又称CD11a /CD18) [1]。整合蛋白种类的多样性和结构复杂性,决定其生理功能的多样性和重要性。作为联系细胞内外的桥梁,一方面负责细胞与细胞、细胞与细胞外基质以及细胞与病原体之间的相互作用,另一方面通过双向信号转导作用,对免疫反应、免疫细胞的组织定位、凝血、组织愈伤、癌细胞转移和新血管生成以及骨重塑等都至关重要[2]。因此,在药物研发以及临床治疗上,整合蛋白抑制剂的研发一直以来都是各大制药公司和科研工作者的主要研究热点。目前临床上使用的药物以单克隆抗体、多肽和小分子化合物为主,均针对配体识别序列而设计[3]。自从 2001 年第一个整合蛋白与配体复合物的晶体结构被报道以来,已经有近 500 个 X 射线晶体结构在蛋白质结构数据库 ( Protein StructureDatabase,PDB) 中被报道,其中大多数晶体结构是高分辨率的。众多整合蛋白抑制剂复合晶体结构的获得,为科研工作者更深刻认识整合蛋白与抑制剂或生理状态配体结合的胞外域构象重排,以及金属离子对整合蛋白构象的调控机制提供重要的分子水平信息,对于优化第一代抑制剂的活性及选择性,探究新一代整合蛋白抑制剂的临床药物开发提供重要的理论支持。
1 整合蛋白的构象调节和亲和力调控机制
整合蛋白包含 2 个非共价结合的Ⅰ型跨膜糖蛋白 α 亚基和 β 亚基,如 Fig. 1 和 Fig. 2A 所示。α 亚基含 1 000 个氨基酸残基,包括头部 β-propeller 结构域、有些还含有 αⅠ-结构域,腿部的 thigh、genu、calf-1 和 calf-2 等 4 个结构域、跨膜域和尾部胞内域。β 亚基由 700 个氨基酸残基组成,包括头部的βⅠ结构域,腿部的 hybird、PSI、EGF-1、EGF-2、EGF-3、EGF-4、β-tail 结构域、跨膜域和尾部胞内域( β4除外) [4]。βⅠ结构域可与 α 亚基的 β-propeller 结构域一起组成配体的活性口袋,对于 α 亚基不含Ⅰ结构域的整合蛋白,βⅠ结构域是整合蛋白与配体的结合区域。βⅠ结构域插入在 hybrid 结构域中,其中含有 1 条 20 ~ 30 个氨基酸残基组成的,能识别底物的特异性识别环( specificity-determining loop,SDL) ,负责调控整合蛋白的配体特异性结合。
1. 1 整合蛋白构象调节
整合蛋白为多个结构域构成的大型跨膜受体蛋白质,是目前发现的构象变化最复杂,变化范围最大的细胞表面受体。在生理状态下,细胞膜上的整合蛋白不 是 完 全 处 于 低 亲 和 性 ( low affinity,bentclosed) 构象或高亲和性 ( high affinity,extendedopen) 构象或中间亲和性( intermediate affinity) 构象,而是处于各种亲和性构象之间的动态平衡中。整合蛋白 α 亚基的 genu 结构域和 β 亚基的 EGF-1-2 部位弯曲并紧密排列,使头部结构域朝向细胞膜呈倒 V 字型结构,处于弯曲低亲和性构象。β 亚基的腿部结构域在弯曲构象时也可以外摆,这有助于构象平衡( Fig. 1) 。因为 β 亚基的腿部结构如果是刚性的移动,往往会同 α 亚基发生冲突。尽管两亚基的膝盖结构域离开 70A,但其胞外域的羧基末端却只分开了 15A[5,6]。如 Fig. 1 所示,在弯曲构象中,当大腿结构域外摆时,具有柔性的 β 亚基的小腿结构会做出调整,使 α、β 亚基的跨膜域保持连接。当胞外配体与整合蛋白结合后,跨膜结构域就会分开,这是整合蛋白由细胞外到细胞内信号转导初期的重要步骤。配体中 RGD 序列的 D 侧链首先与 β1-α1 环骨架结构形成氢键,接着 R 侧链靠近 β-propeller 结构域的 D224,整个 RGD 骨架滑入配体结合巢中( Fig. 2A 和 2B,Fig. 3) 。此时处于高亲和状态的整合蛋白引起一系列的构象重构,首先始于β1-α1 环上带着 ADMIDAS 的配位残基朝左侧移动,引起 α1 /α1’螺旋合并,使 β1-α1 和 α1 螺旋朝向 α亚基移动,如 Fig. 2A 所示。α1 螺旋的内移,破坏M335 与 ADMIDAS 金属离子之间的相互作用。α7螺旋空间移位限制打破,推 动 β6-α7 和 α7 远 离hybrid 结构域,使其像活塞一样向下移动。α7 螺旋中的 333 ~ 352 残基平均移动 5. 3A,引起 hybrid 向外摆动。配体介导整合蛋白构象重排中,最终引起β1-α1 位移 2A,βⅠ位移 40A,α7 螺旋位移 10A,βⅠ / hybrid 结构域夹角增加 62°。整合蛋白 α 和 β亚基的跨膜区以及胞内区彼此分开,膝盖部位完全伸展引起腿部结构域直立并以大约 70A分离[6,7]。
整合蛋白作为金属蛋白质,与配体的结合必须依赖于二价金属阳离子的调控。β 亚基Ⅰ结构域顶部含一个由 3 个金属离子结合位点组成的金属离子结合点簇,如 Fig. 2A 和 C 所示。位于中间的金属离子 结 合 位 点 ( metal ion dependent adhesion site,MIDAS) 的金属离子直接参与结合配体蛋白。位于左边的正调控位点 SyMBS( synergistic metal-bindingsite,SyMBS; 又称 ligand-associated metal ion-bindingsite,LIMBS) 上的金属离子对整合蛋白活化是必需的。而位于右边的负调控位点( adjacent to MIDAS,ADMIDAS) 被钙离子占据后,可以使整合蛋白处于低亲和构象。在生理状态下,钙离子和镁离子以约1 mmol /L 同时存在。通常,镁离子对整合蛋白的活化具有促进作用,而钙离子可以抑制整合蛋白的活化。微摩尔水平低浓度钙离子可以与镁离子一起协同促进整合蛋白与配体的结合,而毫摩尔水平高浓度钙离子则会抑制整合蛋白与配体结合[8,9]。
MIDAS 与配体结合时,配体中带正电荷的 R或 K 结合到 αIIβ 的 D224 或 αv 的 D150、D218 上,如 Fig.2A 和 B 所示。尽管 Mg2 + 和 Ca2 + 离子有助于配体与 αⅡbβ3 结合,但是在 MIDAS 晶体结构上只找到 Mg2 + 。此时,Mg2 + 的结合状态比较弱,是由 4 个水分子和 S121 羟基氧及 E220 羧基氧参与形成 6 对氢键。整合蛋白处于低亲和状态,需要低摩尔浓度的 Mg2 + 来提高与配体的结合。β3结构域上的 MIDAS 处于较弱的结合状态,使其能留足更大的正电性与配体中的 D 上羧基氧作用。配体中的羧基氧不仅与 Mg2 + 作用,还能与 β3 亚基的Ⅰ结构域上的 β1-α1 环骨架结构上的 Y122和 S123 形成氢键。这些稳定的作用形式,为 β1-α1 环移动靠近 MIDAS,促发 hybrid 向外摆动提供基础[10-13]。
β3 亚基中的 E220 的一个羧基氧与 SyMBS 的Ca2 + 作用,另一个氧与 MIDAS 的 Mg2 + 作用,Fig. 2C所示。SyMBS 的金属离子对 E220 残基上羧基氧的配位 键 调 节,会 降 低 E220 的另一个羧基氧对MIDAS 金属离子的作用,最后增强了 MIDAS 金属离子的正电性,能促进与配体中 D 上羧基氧的结合。SyMBS 环 上 的 R216-D217-A218 与 α 亚 基 上 的propeller 结构域中的残基相互联系。将 α Ⅱ β-SyMBS 环对面的界面残基 F191 突变成 W,SyMBS上的金属离子失去稳定性,降低对 Mn2 + 的亲和作用; 然而将 αv-SyMBS 环面对的界面残基 W191 突变成 F,SyMBS 上的金属离子稳定性增加,但作用很弱。测量 αv 和 αIIb 亚基与对面 SyMBS 环上残基的作用能 量 时 发 现,αv 与 SyMBS 环的作用能量比αIIb 高出 2 ~ 3 倍。αvβ3 的 SyMBS 配位键口袋受到扭转成平面状,使 SyMBS 环朝着 αv 亚基移动,Ca2 + 在 SyMBS 上明显不稳定,在晶体结构中该位点的金属离子具有变动性[11,12]。β 亚基上 SyMBS 的金属离子的可变性,最终会改变受体对配体的结合能力。
在 αvβ3 和 αⅡbβ3 未结合配体的晶体结构中,ADMIDAS 的金属离子分别与 β1-α1 环上的 S123,α1 螺旋上的 D126 和 D127,及 β6-α7 环上的 M315的氧原子形成氢键[2,3]。纤维蛋白原 γ 亚基羧基端的十二肽( HHLGGAKQAGDV) 缬氨酸上的羧基氧通过水分子能与 ADMIDAS 间接作用,这对含 RGD 序列的配体在与受体结合过程中非常重要[14]。当把缬氨酸酰胺化后,其对受体的亲和能力下降 80% 。随着配体的结合,β3 亚基上 I 结构域 α1 螺旋内移和 ADMIDAS 的左移破坏了 M335 与 ADMIDAS 的作用,最 后 被 D251 取 代,使 β6-α7 环 进 一 步 远 离ADMIDAS。ADMIDAS 配位键口袋的重排,使 D251远离 MIDAS,增 强 了 MIDAS 金属离子的正电性[11,12]。α5β1 可以与含 RGD 序列的纤连蛋白结合,其中线性肽序列为 GRGDSP,环 肽 序 列 为ACRGDGWCG。α5β1 与 RGD 线形肽序列的晶体结构中,当去除 Ca2 + 时,S134 可直接与 MIDAS 上的Mg2 + 作 用; 当 Ca2 + 存 在 时,被 水 分 子 取 代[12]。ADMIDAS 上的 Ca2 + 能抑制 RGD 多肽介导构象重排。有趣的是,RGD 环肽在 Ca2 + 存在时的作用与RGD 线形肽去除 Ca2 + 时的结合状态一致,S123 能与 MIDAS 直接形成氢键,引起 β1-α1 环向 MIDAS移动。因 此,线 性 RGD 在 Ca2 + 缺失时以及环肽RGD 在 Ca2 + 存在时,都能提高配体与受体的结合能力。αvβ3 能识别纤维蛋白原中的 572RGD574 序列而不能识别 γ 亚基羧基端的十二肽序列[11,12,15]。当 αvβ3 中 Ca2 + 缺失时,能提高配体中 D 与 MIDAS的 结 合 能 力,但使羧基末端的缬氨酸不能与ADMIDAS 的 Ca2 + 形成氢键。
2 基于结合模式的整合蛋白抑制剂的性质
整合蛋白的功能依赖于对其配体结合的亲和性以及所介导的下游信号通路,整合蛋白构象的活化受阻或过度都会引起疾病。在药物研发以及临床治疗上,对整合蛋白抑制剂的设计策略主要是通过抑制整合蛋白与配体结合的亲和性。截止至 2016 年,已有5 种整合蛋白药物被 FDA 批准上市,分别是以 αⅡbβ3 为靶点的 abciximab( 阿昔单抗) 、eptifibatide( 依替巴 肽,PDB: 2VDN) 和 tirofiban ( 替 罗 非 班,PDB:2VDM) ; 以 α4β1 和 α4β7 为靶点的 natalizumab( 那他珠单抗) ; 以 α4β7 为靶点的 vedolizumab( 维多珠单抗) 。整合蛋白抑制剂可以根据其结合位点来进行划分[2,3]。第一代以配体识别序列设计的抑制剂,是整合蛋白生理性配体的竞争性抑制剂,这类抑制剂一般含有 RGD 序列,目前大部分 FDA 批准的药物都属于这一类型,如 Table 1 所示。由于这些抑制剂都结合于 RGD 结合口袋,而大部分整合蛋白的结合口袋都比较保守,所以绝大多数这类抑制剂都对同一家族的其他亚型有抑制作用。另外,抑制剂与整合蛋白的结合往往是快速可逆的,动力学数据指出,在抑制剂解离后,整合蛋白高亲和构象处于待发状态可以保持数小时,因此这类抑制剂往往都具有部分激活的作用[16]。选择性的缺失以及部分激活作用直接导致药物的副反应和毒性。为了改善第一代整合蛋白药物的不足,目前基于晶体结构研究、虚拟筛选、高通量筛选以及基于结构的设计的新型整合蛋白抑制剂,有许多已经进入临床试验[17-20]。
2. 1 配体识别序列抑制剂及其设计
第一个 FDA 批准的整合蛋白肽类药物依替巴肽,在其结构中仍保留 RGD 序列。RGD 肽类模拟抑制剂在体内代谢中常因分子量大、极性表面积高、clog P 低及结构柔性大而受到限制,如 Table 1所示。相比肽类抑制剂,小分子抑制剂往往半衰期长、特异性高和选择性强。依据 RGD 肽类抑制剂的结合模式,很快第一个非肽类 RGD 抑制剂替罗非班研发成功,1998 年首次在美国上市[21]。如Fig.3 所示,这类抑制剂往往含有能与 MIDAS 上Mg2 + 作用的酸性基团,周围的 N215、S121 和 S123通常也参与氢键的形成; 以 及 能 与 α 结 构 域 中D224 形成氢 键 的 碱 性 基 团( 如精氨酸和哌嗪) 。但在治疗中发现,第一代以配体识别序列设计的抑制剂需要静脉注射给药,引起患者血小板减少和出血等副作用。用于治疗侵袭性强的脑恶性胶质瘤西仑 吉 肽( cilengitide) 在三期临床试验中失败,该抑制剂反而提高患者肿瘤的发生率。另外,在对 αⅡbβ3 口服型抑制剂研发中也发现,口服型抑制剂使患者死亡率增加 30% ~ 35%[2,3,22]。为了解决上述问题,现今也已开发针对 αⅡbβ3的小分子非肽类 RGD 抑制剂 UR-2922,UR-2922 为单纯抑制剂,不会引起 β3 结构域的重排。同源建模数据分析表明,UR-2922 不直接与 MIDAS 作用,抑制剂的羧基同 Y166 形成氢键,与 R165 形成盐桥,同 F160 形成 π-π 芳香共轭键。又如,化合物 87与替罗非班结合模式基本一致,但其羧酸端只与S123 形成氢键,不与 Y122 和 N215 产生氢键,出血时间比替罗非班明显缩短[25]。化合物 38,与传统RGD 类 αvβ3 抑制剂的结合模式完全不同,抑制剂在结合口袋中取向相反,二甲氧基的 2 个氧原子与受体中的 S121、S123 及 MIDAS 中的 Mn2 + 结合,羧基氧与 R216,A149 及 Y166 形成 3 对氢键[26]。经过对整合蛋白构象调节和亲和力调控机制的研究发现,大部分配体识别序列设计的抑制剂能与整合蛋白快速可逆性结合,在抑制剂解离后,整合蛋白仍处于高亲和构象的待发状态,并能与生理性配体结合,引起构象重排,使构象表位暴露,如 LIBS ( ligandinduced binding sites) 的表达以及整合蛋白在细胞膜表面的聚簇( clustering) ,促发由外向内信号转导作用。尽管如此,在以 RGD 序列开发的抑制剂中,仍有超过 800 万的患者在使用,例如 αⅡbβ3 抑制剂依替巴肽[2,3]。第一代抑制剂具有部分激活作用的性质,往往引起毒副反应。因此,对于获取纯抑制效果和口服型抑制剂的开发,一直成为各类药物研究所和科研工作者们研究的热点。想要获得不引起整合蛋白部分激活的新型抑制剂,需要改变原来模拟天然配体的思路,从定量构效关系和药效团模型构建,筛选非 RGD 模拟抑制剂是当前科研工作者们的主要策略。2008 年,第一个非 RGD 模拟抑制剂 RUC-1,是通过高通量筛选 33 264 个小分子化合物而得到的。RUC-1 能高效且专一的作用于 αⅡbβ3,对 αvβ3 无 作 用。分子对接数据表明,RUC-1 只结合在 αⅡβ 结构域上,在骨架结构中,哌嗪上的氮能与 αⅡβ 亚基上的 D224 形成氢键,苯乙酰胺上的氮与 β3 亚基上的 N215 形 成 氢 键,稠 环 结 构 能 与 αⅡ β 亚 基 上Y190 形成 π-π 芳香堆积作用,稠环结构中的氧通过水 分 子 与 αⅡ β 亚 基 上 D232 形 成 氢 键( Fig.3) [25]。与配体识别序列设计的抑制剂相比,RUC-1 与 αⅡbβ3 的共结晶( PDB: 3NIF) 数据显示,整合蛋白的头部结构处于低亲和的构象,RUC-1 不与 MIDAS 的金属离子作用,因此不引起整合蛋白构象重 排。基于结构设计获得的 RUC-2 ( PDB:3T3M) ,其活性大约提高 100 倍。与 RUC-1 相比,两者的结合模式基本一致,但 RUC-2 上的伯胺能与 E220 竞争 MIDAS 上的 Mg2 + ,使 Mg2 + 缺失。当Mg2 + 浓度 在 20 mmol /L 时,RUC-2 缺 失 ( Fig.2,3) [25-27]。这是整合蛋白抑制剂中第一个取代离子的配体类抑制剂。
接着通过构效关系研究,在 RUC-2 的基础上获得 RUC-3 和 RUC-4,如 Fig.3 所 示。RUC-3 的IC50较 RUC-2 低,但化学稳定性差。与 RUC-2 相比,RUC-4 溶 解 性 高 出 500 倍,抑 制 效 果 高 出20% 。RUC-4 的结合模式 相 比 于 RUC-2,其 苯 环上额外的氮原子能通过水分子间接作用于 β3 亚基上 Y166[20,23,28]。药物动力学研究显示,相比于RUC-4,RUC-2 的线粒体稳定性分析数据更好( -1. 16 mL-1 min-1,human) 。目前,RUC-4 已获得专利,正处于院前治疗心肌梗塞的相关研究。通过对 ZINC 数据库中 25 万个先导化合物进行虚拟筛选,分别从药物结合模式、化合物结构特征和工业化应用进行考量,得到 500 个高得分的化合物,从中筛选得到 5 个具有潜在活性的抑制剂( MSSM-1~ 5) 。5 个化合物中 MSSM-1 对 αⅡbβ3 生物活性最高,MSSM-1 较于 RUC-2,不存在通过水分子与 αⅡβ 亚基上 D232 形成氢键,取而代之的是稠环上的 2 个氮与 D224 形成 2 个氢键[18]。另外,基于RUC-2 关键的结合模式进行虚拟筛选,通过分子对接获得化合物 14 和 15,其中化合物 14 抑制效果最好。当把化合物 14 骨架结构缩短一个碳原子而获得的化合物 15,其抑制 活 性 降 低 100 倍。研究发 现,化 合 物 14 的 2 个正离子中心距离为15. 8 A。
3 问题与展望
整合蛋白抑制剂从第一代基于配体识别序列设计的两亲性肽类和非肽类抑制剂,到目前开发的基于受体构象设计的纯抑制剂的跨越,然而应用于临床的药物并不多,也存在许多挑战性的问题。第一代部分激活的抑制剂通常具有以下特征: 针对 αvβ3 抑制剂两亲酸碱基团中的碳原子和氮原子中心距离为 12. 8 ~ 14. 5A,相当于 12 个键长度,而对 αⅡbβ3 作用的抑制剂两亲酸碱基团中的原子中心距离为 15. 5 ~ 16. 5A,相当于 15 个键长度; 亲脂片段需连接在抑制剂酸性基团端; 亲脂片段连接的酸性基团可与 R214 残基形成氢键18]。近些年,用于治疗不同疾病开发的整合蛋白抑制剂被设计合成出来,特别是针对整合蛋白构象与亲和力调节设计的抑制剂。这类以受体构象设计的抑制剂往往需要满足以下条件: 抑制剂碱性基团端( 特别是哌嗪) 能与 D224 残基作用; 抑制剂骨架结构中的杂环可与 Y190 形成 π-π 芳香堆积作用; 稠环上的氮原子与 D232 形成氢键; 另一个阳离子端能与 E220 竞争 MIDAS 上的 Mg2 + [18]。整合蛋白抑制剂的安全问题主要归咎于口服抑制剂的致死率问题,以及大部分抑制剂的部分激活作用。尽管整合蛋白在生理状态下的构象调节以及金属离子对其构象的调控机制越来越清晰,但在第一代整合蛋白抑制剂的基础上所开发的新一代抑制剂走上临床的有效案例尚未实现[29-31]。迄今为止,大量抑制剂的出现得益于抑制剂与整合蛋白的复合物晶体结构。目前对于获取纯抑制效果的整合蛋白抑制剂迫在眉睫,特别是口服型抑制剂的研发,以及通过绿色环保及温和条件合成新一代 整 合 蛋 白 抑 制剂将是未来的又一挑战[10,31-33]。