一文了解UniProt數(shù)據(jù)庫使用技巧
UniProt數(shù)據(jù)庫全稱Universal Protein,是由歐洲生物信息研究所(EMBL-EBI)、瑞士蘇黎世大學(xué)的Swiss Institute of Bioinformatics(SIB)和美國國家生物技術(shù)信息中心(NCBI)三家機構(gòu)合作維護(hù)的知識庫,旨在整合、注釋和提供全面的蛋白質(zhì)序列及相關(guān)功能信息。
該數(shù)據(jù)庫由三個主要部分組成
UniProtKB:是UniProt的核心組成部分,分為Reviewed(Swiss-Prot)和Unreviewed(TrEMBL)。Reviewed包含專家手動注釋的高質(zhì)量蛋白質(zhì)數(shù)據(jù),包括蛋白質(zhì)的功能描述、域結(jié)構(gòu)、變異信息、文獻(xiàn)引用等詳細(xì)資料;TrEMBL則收集自國際核酸序列數(shù)據(jù)庫(GenBank/DDBJ/EMBL),包含了自動注釋的蛋白質(zhì)序列數(shù)據(jù),主要用于那些未經(jīng)過人工審核的序列信息。
Proteomes:用于集中展示特定物種的完整蛋白質(zhì)組信息。聚焦于那些已經(jīng)完成了全基因組測序的物種,通過將基因組預(yù)測出的所有蛋白質(zhì)編碼基因的產(chǎn)物進(jìn)行編目和注解,形成了全面的物種蛋白組圖譜。
UniRef:是一個聚類數(shù)據(jù)庫,通過算法將相似的蛋白質(zhì)序列歸類在一起,生成代表性的序列集合,提高數(shù)據(jù)檢索效率。細(xì)分為UniRef100、UniRef90和UniRef50三種不同層次的聚類標(biāo)準(zhǔn),分別對應(yīng)于97%、90%和50%的序列一致性閾值。
UniParc:這個數(shù)據(jù)庫匯集了來自多個來源的全部蛋白質(zhì)序列,包括但不限于UniProtKB、PIR、PRF、NCBI RefSeq等,它作為一個綜合存儲庫,確保每個序列只被收錄一次,即便同一序列出現(xiàn)在多個來源中,也只保留一份,有效防止重復(fù)。
舉例說明
我們今天以一個具體的基因為例子,來演示這個數(shù)據(jù)庫的使用方法,以人源的IL-6為例。
關(guān)鍵詞搜索:直接在首頁搜索框中輸入蛋白質(zhì)名稱、ID、物種名、功能描述等關(guān)鍵詞進(jìn)行快速檢索。
高級搜索:點擊“Advanced”鏈接進(jìn)入高級搜索頁面,這里可以通過構(gòu)建復(fù)雜的邏輯語句(AND、OR、NOT)和使用特定字段(如gene、protein name、organism等)進(jìn)行精準(zhǔn)查詢。
1
首先打開官網(wǎng)主頁:www.uniprot.org/,搜索欄輸入IL-6,點擊Search或鍵盤回車,然后左側(cè)欄選擇Human
Entry:Uniprot給每個蛋白質(zhì)賦予的ID(由此進(jìn)入查看具體信息)
Entry name:蛋白ID的簡要名字
Protein names:蛋白質(zhì)的名字
Gene names:編碼這個蛋白的Gene名字
Organism:蛋白質(zhì)的種屬來源
Length:氨基酸長度
2
找到你想要的蛋白,點擊進(jìn)入,到達(dá)詳情頁面,左側(cè)欄為目錄,點擊即可查看,包含豐富的信息板塊,如蛋白功能、亞細(xì)胞定位、序列特征、蛋白表達(dá)與互作、文獻(xiàn)引用、相似性蛋白、結(jié)構(gòu)域預(yù)測等。
Function:有關(guān)蛋白質(zhì)的功能信息。
Names & Taxonomy:有關(guān)蛋白質(zhì)和基因名稱和同義詞以及源生物的信息。
Subcellular location:有關(guān)成熟蛋白質(zhì)在細(xì)胞中位置的信息。
Disease & variants/ Phenotypes & Variants:在人類條目中,有關(guān)與蛋白質(zhì)相關(guān)的疾病的信息。在非人類條目中,有關(guān)與蛋白質(zhì)相關(guān)的表型的信息。在所有情況下,都描述了變異氨基酸的作用。
Expression:關(guān)于基因在多細(xì)胞生物的細(xì)胞或組織中mRNA或蛋白質(zhì)水平的表達(dá)的信息。
PTM/Processing:描述翻譯后修飾 (post-translational modifications,PTM) 和/或蛋白加工等信息。
Interaction:關(guān)于蛋白質(zhì)的四級結(jié)構(gòu)以及與其他蛋白質(zhì)或蛋白質(zhì)復(fù)合物相互作用的信息。
Structure:關(guān)于蛋白質(zhì)的三級結(jié)構(gòu)的信息。如果沒有完整的實驗確定的結(jié)構(gòu),在許多情況下,將顯示 AlphaFold 預(yù)測。
Family & Domains:關(guān)于與其他蛋白質(zhì)的序列相似性以及蛋白質(zhì)中存在的結(jié)構(gòu)域的信息。
Sequence:默認(rèn)情況下顯示規(guī)范蛋白質(zhì)序列,并根據(jù)要求顯示條目中描述的所有亞型。還包括與序列相關(guān)的信息,包括長度和分子量。
Similar proteins:提供指向 UniProt 引用集群 (UniRef) 的鏈接。
Uniprot常用功能:
BLAST,全稱Basic Local Alignment Search Tool,是一種用于比較核酸或蛋白質(zhì)序列與大型數(shù)據(jù)庫中存儲的所有序列的軟件工具包。UniProt提供的Blast工具專門針對其收錄的蛋白質(zhì)序列進(jìn)行優(yōu)化,使用戶能夠搜索相似序列、蛋白功能預(yù)測、物種進(jìn)化分析、結(jié)構(gòu)建模。
具體步驟:
1
以人類的IL-6為例,復(fù)制粘貼或輸入剛剛選擇的IL-6的Entry標(biāo)識符,會自動跳出相應(yīng)的序列信息,或直接粘貼已有的序列。
2
選擇目標(biāo)數(shù)據(jù)庫。默認(rèn)情況下,搜索所有參考蛋白質(zhì)組 + UniProtKB/Swiss-Prot,但您可以選擇僅針對 UniProtKB/Swiss-Prot 中已審閱的序列運行。
3
限制物種選項讓你精準(zhǔn)定位搜索范圍,只需輸入特定代碼,例如,輸入“9606”,搜索便只針對人類蛋白質(zhì);若想涵蓋整個哺乳動物界,則使用“哺乳動物 [40674]”。也可以選擇自動完成功能,輕松完成,確保你的查詢更貼合研究需求。
4
點擊RUN blast,等待結(jié)果。
Align,用于兩個或多個序列的信息比對,以識別相似區(qū)域,這些區(qū)域可能是序列之間功能、結(jié)構(gòu)或進(jìn)化關(guān)系的結(jié)果。
具體步驟:
1
將準(zhǔn)備好的兩段(或兩段以上)序列輸入進(jìn)去,或輸入Uniprot的Entry標(biāo)識符,會自動識別序列。
2
點擊RUN Align,等待結(jié)果
“Tree”部分通過系統(tǒng)發(fā)育樹來表示序列之間的進(jìn)化關(guān)系。
Search with list map IDs:“檢索/ID 映射”工具,您可以在其中提交標(biāo)識符列表以檢索相應(yīng)的 UniProt 條目,或?qū)?UniProt 標(biāo)識符映射到外部數(shù)據(jù)庫,UniProt條目中包含指向GenBank、PubMed、KEGG、GO等外部資源的鏈接,方便獲取更多相關(guān)信息。
Search peptides:多肽搜索”工具,允許您提交至少 3 個殘基的短肽序列,并找到與查詢序列完全匹配的所有 UniProtKB 序列
AntibodySystem
AntibodySystem Laboratories SAS于2019年創(chuàng)立于法國斯特拉斯堡,專注于生命科學(xué)研究領(lǐng)域蛋白及抗體試劑研發(fā)生產(chǎn)。致力于為全球生命科學(xué)基礎(chǔ)研究者提供高質(zhì)量的蛋白,抗體產(chǎn)品,產(chǎn)品類別囊括傳統(tǒng)多抗,經(jīng)典內(nèi)參抗體,標(biāo)簽抗體,高活性蛋白,invivo功能性抗體,低背景流式抗體,高特異性納米抗體,特色小分子抗體,高質(zhì)量磷酸化抗體,DNA/RNA抗體,PEG抗體等十余個系列;目前AntibodySystem旗下產(chǎn)品線涵蓋500種病毒與超級細(xì)菌,寄生蟲,腫瘤,老年癡呆,帕金森,變態(tài)與過敏反應(yīng),免疫抑制與免疫激活等多個領(lǐng)域。
佰樂博生物
武漢佰樂博生物(Biolab Reagents)由五位畢業(yè)于華中科技大學(xué),華中農(nóng)業(yè)大學(xué),武漢大學(xué)等知名高校,且具有二十年工作經(jīng)驗的生命科學(xué)領(lǐng)域研究者創(chuàng)立于2021年,憑借豐富的產(chǎn)品開發(fā)經(jīng)驗,利用全球技術(shù)平臺,引進(jìn)和整合全球高品質(zhì)的蛋白、抗體和試劑盒產(chǎn)品。目前,佰樂博生物作為法國AntibodySystem和ProteoGenix在亞洲總代理,提供近30,000種生命科學(xué)試劑,核心產(chǎn)品涵蓋蛋白、抗體和試劑盒,旨在為科研工作者提供專業(yè)、全面、可靠的試劑支持,推動生命科學(xué)研究的深入發(fā)展。