抗原表位預測適用于已知一級結構的蛋白質或多肽抗原的線性表位的預測。人們通過觀察抗原表位與已知氨基酸序列的蛋白質某些結構特征關系,發(fā)現一些蛋白質的序列或結構特征與抗原表位有關。在抗原抗體的結合反應中,抗原參與結合的部位稱為 B 細胞抗原決定簇或者表位。從空間結構上看,B 細胞表位可分為線性表位(也稱 連續(xù)表位)和構象表位(也稱不連續(xù)表位)。線性表位由肽鏈上連續(xù)的氨基酸組 成;構象性表位由空間結構上接近但肽鏈上不連續(xù)的氨基酸組成; Rubinstein 等研究從 PDB 數據庫篩選的抗原抗體復合物,總結了 B 細胞表位生化、結構特點:(1) 75%的表位是由跨越 600Å ~1000Å 40 面積的 15~25 個氨基酸組成;(2)平均 90% 的表位殘基是與抗體的互補決定區(qū) (CDR)的殘基相互作用;(3)表位和非表位區(qū)的氨基酸組成有很大的不同;(4)環(huán)狀結構利于抗體的結合,因此表位多含有環(huán)狀結構,而螺旋和折疊結構比較少見。
表位是蛋白質抗原性的基礎,確定 B 細胞表位對于設計疫苗和藥物具有重要的指導作用。確定 B 細胞表位的傳統(tǒng)方法有兩種:X-射線衍射方法和實驗方法。但是這些方法比較繁瑣,工作量也非常大。隨著計算機技術的發(fā)展和生物信息數據庫的日益擴大,從已有數據中總結抗原表位的序列及結構特征,并通過計算手段對可能的表位進行預測,然后結合實驗手段予以驗證成為另外一條可能的技術路線。
1、B 細胞表位在線預測工具:
ABCpred
http://www.imtech.res.in/raghava/abcpred
線性表位預測
BCPREDS
http://ailab.cs.iastate.edu/bcpreds/predict.html
線性表位預測
Bepipred
http://www.cbs.dtu.dk/services/BepiPred
線性表位預測
IEDB tools
http://www.immuneepitope.org/tools/bcell/iedb_input
線性表位預測
COBEpro
http://scratch.proteomics.ics.uci.edu/
線性表位預測
CEP
http://bioinfo.ernet.in/cep.htm
構象表位預測
DiscoTope
http://www.cbs.dtu.dk/services/DiscoTope
構象表位預測
PEPITO
http://www.igb.uci.edu/
構象表位預測
SEPPA
http://lifecenter.sgst.cn/seppa/
構象表位預測
Epitopia
http://epitopia.tau.ac.il/
構象表位預測
EPCES
http://sysbio.unl.edu/EPCES/
構象表位預測
EPSVR
http://sysbio.unl.edu/EPSVR
構象表位預測
EPMeta
http://sysbio.unl.edu/EPMeta/
構象表位預測
CBTOPE
http://www.imtech.res.in/raghava/cbtope/
構象表位預測
Ensemble Method
http://bcell.whu.edu.cn/
構象表位預測
2、B 細胞表位數據庫
數據是 B 細胞表位分析與預測的基礎。研究者們通過收集和整理已有的研究成果,開發(fā)了一些 B 細胞表位數據庫。常用數據庫見下表:
IEDB
http://www.iedb.org/
BCIPEP
http://www.imtech.res.in/raghava/bcipep
CED
http://immunet.cn/ced/
EPITOME
http://www.rostlab.org/services/epitome/
AntiJen
http://www.ddg-pharmfac.net/antijen/AntiJen/aj_bcell.htm
HIV
http://www.hiv.lanl.gov/
PDB 數據庫于1971 年建立,主要收集通過 X-射線單晶衍射、核磁共振、 電子衍射等實驗手段確定的蛋白質、核酸和糖的三維結構。因此,該數據庫也存儲了一些抗原或者抗原-抗體復合物的三維結構。
IEDB 數據庫[5]在 2004 年建立,是使用最為廣泛和最具權威性的表位數據庫。 該數據庫存儲由實驗確定的 B 細胞表位(線性表位和構象表位),這些表位收 60 集自公開發(fā)表的出版物或者由研究組自行提交。目前,IEDB 數據庫包含 159,339 條 B 細胞相關記錄。每個表位都提供了對應的參考文獻、結構、來源抗原等信息。此外,該數據庫還集成了一些表位預測工具。
Bcipep 數據庫包含實驗確定的線性 B 細胞表位(來源于文獻或者其它的數據庫)。目前,該數據庫存儲了 555 條表位。對于每一條表位,數據庫給出了其肽段序列、來源蛋白、病原體等。如果數據來源于其它數據庫,Bcipep 數據庫也提供了鏈接。
CED 數據庫存儲了 293 條構象表位記錄。研究者從 PubMed 和 ScienceDirect 數據庫收集和整理文獻,然后手工分析超過 3000 條文獻,保留了高分辨率和完整的構象表位,并存入數據庫。CED 數據庫提供了表位的相關信 70 息,包括表位在抗原體的位置、表位的免疫特性、抗原體、抗原所對應的抗體等。 該數據庫提供了友好的操作界面,能夠展示表位的 3D 結構。
Epitome 數據庫存儲從抗原-抗體復合物推斷的抗原表位。在該數據庫中, 抗原殘基和 CDRs 之間的反應稱為免疫反應。研究者通過對復合物的比對和分析,識別抗原的 CDRs 區(qū)域,然后根據抗原抗體反應來標注與 CDRs 反應的抗原 75 殘基。該數據庫存儲了 142 條標記抗原,也提供了可視化工具分析抗原-抗體復合物以及標注的表位。
AntiJen是一個綜合數據庫,涵蓋了與免疫和疫苗相關的動力學、熱力學和分子數據。AntiJen v2.0 包含 3541 條 B 細胞表位(線性表位和構象表位)。每條表位都提供了其肽段來源、抗體、外部鏈接。
HIV 分子免疫數據庫包含 HIV 病毒表位。該數據庫中的數據來源于 HIV 免疫文獻,目前包含 11,361 條 HIV 相關的 B 細胞反應和 T 細胞反應數據。
3、B細胞表位預測方案簡介
從80年代Hopp和Woods提出親水性參數對抗原表位預測的方法以來,已有許多參數、算法發(fā)表,對B細胞蛋白抗原表位研究起到巨大的推動作用。現已被大眾認可并具有較好預測效果的方法,主要有以下6種:
(1)親水性方案(Hydrophilicity)
常用的有五種方法:Nozaki-Tanford scale,Hopp-Woods scale,Eisenberg scale,Kyte-Doolittle scale,HPLC scale。其中尤以Hopp-Woods方案最為有名。認為蛋白質抗原各氨基酸殘基可分為親水殘基和疏水殘基兩類。在機體內,疏水性殘基一般埋在蛋白內部,而親水性殘基位于表面,因此蛋白的親水部位與蛋白抗原表位有密切的聯(lián)系。Hopp-Woods方案是以殘基由有機相環(huán)境轉移到水相環(huán)境的自由能為依據計算各個氨基酸的親水性?,F已明確,親水性部位與抗原表位并無很好的一致性,即高親水性部位不一定是表位,表位也不一定是親水性部位。

(2)可及性方案(Accessibility)
如Janin可及性參數,指蛋白質抗原中氨基酸殘基被溶劑分子接觸的可能性。它反映了蛋白質抗原內、外各層殘基的分布情況。
(3)抗原性方案(Antigenicity)
對20個已研究得很透的蛋白質的69個連續(xù)位點的606個氨基酸統(tǒng)計分析,Welling建立了抗原性刻度。每個氨基酸用出現在抗原區(qū)的頻率描述,此頻率除以各氨基酸在所有蛋白質中的頻率就可推出此刻度值。該法研究表明,疏水性氨基酸殘基對抗原表位形成亦有貢獻。缺點是其所用的數據庫有限,并且連續(xù)位點內的殘基被認為是同等重要的。顯然那些不重要的殘基歸入計算會明顯降低相關性。
(4)可塑性方案(Flexibility)
指蛋白抗原構象不是剛性不變的,其多肽鏈骨架有一定程度的活動性,活動性強的氨基酸殘基即可塑性大的位點,易形成抗原表位。Karplas 和Schulz基于已知結構的31個蛋白質的Cx的溫度β因子,發(fā)展了一種預測蛋白質片段活動性的方法。
(5)電荷分布方案(Charge distribution)
認為對堿性抗原特異的抗體多趨于酸性,對酸性抗原特異的抗體多趨于堿性。
(6)二級結構預測方案(Secondary structure)
認為β轉角結構為凸出結構,多出現在蛋白質抗原表面,利于與抗體嵌合,較可能成為抗原表位。而α螺旋、β片層結構規(guī)則不易形變,較難嵌和抗體,一般不作為抗原表位??深A測蛋白質β轉角的有Chou-Fasman,Garnier,Cohen等方法。其中各種方法預測的成功率均不超過65%。一般認為Cohen方法對轉角的預測正確率很高,對于已知折疊類型的蛋白質(αα類,ββ類,α/β類)正確率高達95%,對于未知結構類型的蛋白質,可用3種類型分別預測,3類預測一致的轉角對預測表位有幫助。
對上述各種參數的預測比較表明,各種方案預測的正確率均不高。一般將上述多種方案綜合考慮,尤以可及性方案、可塑性方案、抗原性方案及二級結構預測為重要。概括而言,作為B細胞蛋白抗原的表位首先應易于位于或移動于蛋白質抗原表面,有利于與抗體結合。另外,具有一定柔韌性,因為抗原與抗體結合時蛋白構象有一定的變化。已經有一些文獻提出了各自不同的綜合分析方法。1988年Jameson和Worf提出一種綜合預測方案。權重選擇為:40%來自二級結構成分,可及性、柔韌性各15%,30%來自親水性。在吳加金等編的Goldkey軟件中,以六種參數Hopp-Woods,HPLC,Accessibility,Flexibility,Charge,Antigenivity綜合考慮,得出綜合判斷圖,閾值以上的峰即認為是預測的抗原表位。