基于能量排序的抗体人源化和稳定性优化方法

目录

传统的人源化方法是将抗体的CDR移植到与亲本抗体同源性较高的人源框架区上,但是这个过程一般会降低抗体的稳定性和亲和力,需要通过返回突变来恢复抗体的特性。最近Nature Biomedical Engineering介绍了一种新的人源化方法,这种方法与传统的人源化方法相比无需返回突变,且人源化后的抗体能够保持亲和力的同时还能提高稳定性。学术用户可以去试试看CUMAB(http://CUMAb.weizmann.ac.il),没有学术邮箱但是喜欢捣腾的朋友也能自己部署一个服务器试试,只是需要的计算资源比较大,根据作者的思路我估计使用其他的替代CADD软件也能作出类似的结果。

CUMAb人源化流程

话不多说下面介绍下这篇文章的主要内容,首先根据抗体主要的主要结构示意图,抗体的主要包括可变区和恒定区,重链和轻链的可变区一起组成的Fv是抗体识别抗原的主要结构域,可变区的序列根据基因结构又可以分为CDR和FR。人源化的过程就是将动物源抗体的CDR移植到人源抗体的FR上,但是通常仅仅进行CDR移植的话会导致抗体表达水平、稳定性和亲和力大幅降低,所以人源化过程中需要返回突变来维持CDR的结构,这个过程不但会降低抗体的人源化程度而且还需要漫长的设计和实验迭代。

他们的大概流程如下:

alt text

  1. 作者定义CDR的方式比较奇特,是组合了kabat和AHO的方法 ,但是LCDR2和HCDR2的划分又有所区别,因此我看了一下bioinf的网页发现用的是contact注释;

alt text

  1. 从imgt获得人源抗体基因序列,排除掉包含NG、NXS/T(X≠P)以及游离C的序列,然后根据他们的CDR划分方式,构建了一个人源FR受体数据库,根据抗体的轻链类型kappa或者lambda的不同分别会获得63180或者48600个抗体组合;

  2. 将嵌合抗体的CDR序列移植到人源的FR上,获得人源化抗体;

  3. 通过实验或者计算获得抗体Fv区域的结构;

  4. 使用嵌合抗体的Fv结构作为模板对人源化的抗体进行建模,通过Roosetta的Relax模块对结构进行优化;

  5. 根据Rosetta能量函数对所有模型进行打分并排序;

  6. 排除CDR主链构象与亲本构象偏差超过 0.5 Å 的人源化抗体,以确保CDR在人源化的结构中保持正确构象;

  7. 根据抗体FR的家族进行聚类,选择多样性高的候选分子进行实验验证。

与传统的人源化方法不同,这种方法不需要考虑嵌合抗体与人源框架区之间的同源性,不过光从计算量来说这方法也把很多人拒之门外了。

案例1

第一个案例是一个鼠源抗体mAb492.1(mαQSOX1),靶点为QSOX1,这个抗体转成嵌合抗体后基本不表达,之前他们使用过另一个软件AbLIFT进行改造,获得了一个能够表达且保持活性的抗体AbLIFT18,但是重链和轻链的与人源抗体序列的相似度分别为66%和57%。

使用CUMAN设计获得的15个人源化抗体有12个与AbLIFT18具有可比的表达水平,纯化后其中有7个抗体具有正确的分子大小 (a);有两个人源化抗体(hαQSOX1.1和hαQSOX1.2)保持了QSOX1抑制活性,另两个抗体的抑制能力与鼠抗类似 (b);所有的这四个抗体与人源抗体序列的相似度均大于80%,基本与FDA批准的人源化抗体人源化程度一致 (c)

alt text

人源化的抗体热稳定性表现也比较好达到70°C,血清稳定性的结果显示37°C放样60h后hαQSOX1.1可以保持完整的抑制活性 (d);人源化的抗体因为使用的不同germline,相互之间的氨基酸差异为33-56个不等所以抗体表面的电荷分布有所差异 (e)

alt text

因为抗体表面的电荷水平以及分布与抗体的非特异性、聚集等特性相关,因此可以在人源化的过程通过对电荷分布的筛选来获得更优的人源化抗体,这边显示人源化的抗体的非特异性结合较低 (f);且聚集倾向也较低 (g);最后通过X射线衍射技术获得了hαQSOX1.4与抗原的复合物结构,发现尽管有51个突变,人源化抗体和亲本抗体之间的均方根偏差(RMSD)仅为 0.7 Å (h)。这些结果验证了CUMAb的准确性及其快速产生功能相似且稳定的人源化设计的能力。

alt text

案例2&3

在做人源化的时候很少会通过实验获得抗体结构,通过计算机预测抗体结构是唯一的选项,目前抗体结构的预测精度较高除了HCDR3部分,虽然HCDR3是抗原识别的关键决定因素但其大部分溶剂暴露区域并不与框架区形成直接相互作用,因此目前针对Fv部分的结构预测对于人源化设计而言已经足够。下面的两个案例分别使用AlphaFold和AbPredict对抗体进行结构预测。

案例2使用的是AlphaFold对抗体进行结构预测,因为FR中有个氨基酸与HCDR3可能有直接相互作用,因此在后续的设计中作者又在人源化的序列中额外引入了这个突变(a);但是表达量检测结果显示包含突变的表达水平均比较低(6,lane6-10);对人源化抗体的结合活性测试发现有一个分子的结合活性明显优于其他分子,这个抗体与鼠抗的差异有40处(c),而且人源化的程度分别为84%(VL)和89%(VH)(d);人源化抗体的结合活性与鼠抗保持一致分别为(3.2nM和0.95nM)(e),热稳定性也类似(f)。

alt text

案例3使用的是AbPredict,因为在使用AlphaFold建模时重轻链之间发生了一些链交换。使用CUMAB对两个MUC16的抗体进行人源化,人源化后对人源化抗体进行表达量测定,hαMUC16_Ab1 的分泌水平比嵌合抗体高出近7倍,hαMUC16_Ab2.1和hαMUC16_Ab2.2的表达水平与嵌合抗体类似(a);3个人源化的分子与鼠抗表现出可比的蛋白亲和力(b、c)和表达MUC16的工程细胞结合(d、e)和表达MUC16的肿瘤细胞OVCAR3的结合(f,g)。

alt text

从以上案例可以看出,尽管使用预测的Fv模型结构会存在一些不确定性,但CUMAb依旧可以快速生成稳定、表达良好、高亲和力的人源化抗体。

基于CUMAB的SDR移植

使用CUMAb人源化通常会将人源化抗体与人源抗体序列的相似度提高到80–88%,为了进一步提高人源化程度,作者开发了SDR移植的替代策略。SDR移植简而言之就是仅保留直接接触抗原的氨基酸,而抗体的其余部分包括不与抗原相互作用的CDR位置都替换成人源的抗体序列。

为了避免给CDR主链结构带来额外的变化,他们筛选人源抗体种系基因时挑选了CDR长度一样的序列,在人源化后又对人源化抗体的V基因和J基因进行聚类分析,与前面的方法不同SDR移植仅有重链J基因会发生变化。

作者选取的SDR移植的抗体为D44.1(mαHEWL),这个具有抗体-抗原复合物结构(1MLC),因为需要精确的选择抗体与抗原结合的氨基酸。SDR人源化后人源化的程度达到了重链(90%)和轻链(94%),高于CDR移植的86%和79-88%。根据活性检测结果5条人源化抗体中有两条具有亲和力,其中1条的亲和力与鼠抗一致。亲和力较高的人源化抗体与鼠抗的差异有64个,而且极大提高了人源化程度(a,b)。

alt text

抗体的表达水平也比较高(c);抗体的熔解温度也比鼠抗高5°C(d);小鼠和人源化Fab的亲和力检测发现人源化设计的亲和力为44nM而亲本小鼠抗体的亲和力为6.5nM(e)。

alt text

因此,SDR移植实现的更高水平的人源化程度是以亲和力损失一些为代价的,尽管人源化的抗体表达性和稳定性与CDR移植一样都会有所增加。

基于能量排序而非同源框架的人源化

传统的抗体人源化策略使用与动物抗体序列或结构最接近的人源抗体种系基因。CUMAb使用的是基于能量的策略忽略了序列或结构同源性,而是关注抗体的结构完整性和能量最优。基于能量排序的人源化极大地将潜在的FR范围从几十个高同源性FR扩大到数万个。本文分析了五个测试案例,探索能量排序对比序列同源性在抗体人源化中的作用,其中的4个案例中表现最佳的人源化抗体并非来源于序列同源最高的序列。

将动物抗体的CDR移植到最接近的人源抗体FR上通常无法重现亲本抗体的稳定性和功能特性,相比之下,基于能量排序的人源化的最优设计表现出与亲本抗体可比的稳定性和结合特性,并且这些设计通常并非源自与亲本抗体同源的人源抗体种系基因。因此尽管V基因亚组内具有高同源性,但FR和CDR之间关键的长程相互作用常常被传统的基于序列同源性的人源化所消除,相比之下基于能量排序的人源化设计通常可以保留这些相互作用。a图展示的是基于序列同源性的人源化引入的突变消除了FR区域连接HCDR1和HCDR2的氢键网络,b图是基于序列同源性的人源化引入的突变引入了空间位阻,c图是CUMAB人源化后引入S43P/A增加了抗体的稳定性,d图是基于序列同源性的人源化引入的突变破坏了轻链CDR之间的氢键。

alt text

讨论

结构分析表明,基于能量排序的人源化设计保留了关键的FR-CDR相互作用,而这些相互作用可能在基于序列同源性的人性化中被消除。因此来自能量排序的人源化设计更有可能保留结合亲和力,并且还保留或增加抗体的稳定性和表达水平。CUMAb的人源化方法也无需返回突变,人源化的程度对比传统的CDR移植更高。不过这边展示的案例还是比较少,一般CDR移植后不进行返回突变很难保持抗体的活性,本文的方法之所以可行可能是因为增加了人源化抗体的建模分析,保留了CDR主链构象与亲本构象偏差低于0.5Å的人源化抗体,另一方面能量较低的抗体也预示更高的稳定性。后续也需要更多的案例来验证他们的方法,当然这种方法虽然速度快,但也不是所有人都能用的起的。

参考文献

  1. Computational optimization of antibody humanness and stability by systematic energy-based ranking