作者:徐晶,孫秀珍,劉昀,張永紅,李維 作者單位:西安交通大學(xué)醫(yī)學(xué)院第二附屬醫(yī)院呼吸內(nèi)科,陜西西安 710004
【摘要】目的 對免疫學(xué)篩選鑒定獲得的葎草花粉過敏哮喘特異性變應(yīng)原陽性pTSX1 cDNA克隆進(jìn)行生物信息學(xué)分析。方法 運(yùn)用生物信息學(xué)的序列分析、序列比對、基因構(gòu)成和蛋白質(zhì)的結(jié)構(gòu)及功能進(jìn)行預(yù)測。結(jié)果 pTSX1 特異性變應(yīng)原克隆序列分析表明,該克隆與現(xiàn)有的已知基因均無高度同源性。其序列有一615bp的開放閱讀框(61~675bp),編碼204個(gè)氨基酸。預(yù)測pTSX1蛋白的氨基酸序列編碼蛋白很有可能為核糖體蛋白。結(jié)論 獲得的葎草花粉過敏哮喘特異性變應(yīng)原陽性pTSX1 cDNA克隆是一個(gè)新的基因,pTSX1基因編碼的蛋白可能是核糖體蛋白。
【關(guān)鍵詞】 葎草花粉,變應(yīng)原cDNA,生物信息學(xué);序列分析
ABSTRACT: ob[x]jective To make a bioinformatical analysis of the specific allergen pTSX1 cDNA clone obtained from Humulus pollen in allergic asthma by immunological screening and gene cloning. Methods Bioinformatical approaches, including sequence analysis, sequence alignment, genetic makeup, protein structure and function prediction, were used. Results The analysis of the specific allergen pTSX1 cDNA showed that the gene had no high homology with genes known so far. The cDNA had a 615bp length open reading fr[x]ame and coded a protein with 204 amine acids. The analysis of amine acids sequence coded by the pTSX1 cDNA showed that the protein identity of this gene product might be one of ribosomal proteins. Conclusion The pTSX1 cDNA cloned from Humulus pollen in allergic asthma is a new gene, and the protein coded by pTSX1 gene may be one of ribosomal proteins.
KEY WORDS: Humulus pollen; allergen cDNA; bioinformatics; sequence analysis
花粉癥是敏感個(gè)體對花粉的一種超敏反應(yīng),在變態(tài)反應(yīng)性疾病中具代表性。它可引起多種過敏性疾病,以支氣管哮喘常見。葎草花粉近年來已成為我國多數(shù)地區(qū)包括西安地區(qū)夏秋季節(jié)花粉癥的主要變應(yīng)原[1]。構(gòu)建葎草花粉cDNA表達(dá)文庫并從中篩選出特異性變應(yīng)原是制備基因重組變應(yīng)原的基礎(chǔ),因而在診斷及治療由其引起的過敏性疾病中具有重要意義。我們先前報(bào)道用葎草花粉過敏哮喘患者血清對構(gòu)建好的葎草花粉cDNA λTripIEx2噬菌體表達(dá)文庫進(jìn)行免疫學(xué)篩選,獲得了與過敏性哮喘相關(guān)的三個(gè)葎草花粉特異性變應(yīng)原cDNA克隆,經(jīng)免疫學(xué)、分子生物學(xué)鑒定和生物信息學(xué)分析,可能為新基因。
生物信息學(xué)是一門由數(shù)學(xué)、統(tǒng)計(jì)、計(jì)算機(jī)與生物醫(yī)學(xué)交叉結(jié)合的新興學(xué)科。它已廣泛地滲透到醫(yī)學(xué)的各個(gè)研究領(lǐng)域中,成為生物醫(yī)學(xué)發(fā)展不可缺少的重要工具。隨著人類基因組計(jì)劃的快速發(fā)展,生物信息學(xué)技術(shù)在人類疾病與功能基因的發(fā)現(xiàn)與識別、基因與蛋白質(zhì)的表達(dá)與功能研究方面,都發(fā)揮著關(guān)鍵的作用。在對所有新基因的功能和特性進(jìn)行研究之前,有必要先充分利用生物信息學(xué)的方法對其進(jìn)行預(yù)測分析。
為了深入了解和研究我們發(fā)現(xiàn)的新基因的結(jié)構(gòu)與功能,我們運(yùn)用生物信息學(xué)研究和功能預(yù)測手段,對pTSX1 cDNA克隆進(jìn)行了詳盡的分析。
1 材料與方法
對葎草花粉cDNA λTripIEx2噬菌體表達(dá)文庫進(jìn)行滴度測定及擴(kuò)增,先選用葎草花粉過敏的哮喘患者的血清與大腸桿菌裂解液共同溫育去除交叉抗體,然后用免疫學(xué)方法篩選陽性克隆。提取陽性重組噬菌體DNA,經(jīng)EcoRⅠ和HindⅢ雙酶切分析、瓊脂糖凝膠電泳鑒定后,DNA序列測定并進(jìn)行生物信息學(xué)分析[2]。
1.1 核酸序列分析
首先在http://www.girinst.org/censor/index.php[3]進(jìn)行重復(fù)序列分析。http://www.ncbi.nlm.nih.gov/VecScreen/VecScreen.html去除載體污染。將測序得到的DNA序列采用美國國立生物技術(shù)信息中心(National Center for Biotechnology Information, NCBI)網(wǎng)站的Blast軟件(http://www.ncbi.nlm.nih.gov/blast/Blast.cgi)對GenBank中的非冗余數(shù)據(jù)庫(nonredundant databa[x]se, nr)進(jìn)行查詢,并兩兩進(jìn)行兩條核酸序列之間的同源性分析[4](http://www.ncbi.nlm.nih.gov/blast/bl2seq/wblast2.cgi)。軟件DNAMAN進(jìn)行核酸序列之間的多重比對分析及進(jìn)化分析。用http://www.fruitfly.org/seq_tools/promoter.html進(jìn)行基因啟動子[56]分析。GENSCAN分析基因外顯子。NCBI網(wǎng)站進(jìn)行基因表達(dá)譜分析及基于六相位翻譯原理查找cDNA序列的開放閱讀框(open reading fr[x]ame, ORF)(http://www.ncbi.nlm.nih.gov/gorf/gorf.html)。
1.2 蛋白質(zhì)分析
應(yīng)用Blast軟件進(jìn)行蛋白質(zhì)同源性分析,軟件InterProscan預(yù)測編碼蛋白的基本理化性質(zhì),包括氨基酸組成、分子質(zhì)量、等電點(diǎn)。使用軟件Sopma預(yù)測二級結(jié)構(gòu),軟件Antheprot進(jìn)行蛋白跨膜區(qū)分析[7]。
http://genome.cbs.dtu.dk/services/SignalP/進(jìn)行信號肽分析[8]。SMART進(jìn)行蛋白質(zhì)結(jié)構(gòu)功能域分析[9]。TargetP對蛋白質(zhì)序列進(jìn)行亞細(xì)胞定位分析。SwissModel服務(wù)器進(jìn)行三級結(jié)構(gòu)同源建模[10]。
2 結(jié) 果
2.1 利用生物信息學(xué)對pTSX1進(jìn)行核酸序列分析
2.1.1 重復(fù)序列分析
目的片段pTSX1沒有發(fā)現(xiàn)重復(fù)序列。
2.1.2 同源性分析
將測序得到的pTSX1核苷酸序列輸入NCBI網(wǎng)站,利用Blast軟件在GenBank數(shù)據(jù)庫Nucleotide Collection (nr/nt)中進(jìn)行核苷酸序列同源性(Blastn)分析(表1)。經(jīng)過Blast比對,結(jié)果顯示pTSX1序列與2個(gè)毛果楊樹基因Score值>620,序列一致性(identities)>84%,其中與收錄號為EF145831.1的毛果楊基因WS0113_K15(提取自華盛頓區(qū)域一棵8年生毛果楊樹的新生層及韌皮部)Score=643,序列一致性為85%,E=0。該基因的產(chǎn)物尚不知曉,但該基因編碼區(qū)與擬南芥At4g16720基因(其編碼蛋白為核糖體蛋白L15A)相類似。與一系列擬南芥克隆比對Score>420,序列一致性(identities)>79%,其中大部分編碼蛋白為核糖體蛋白。 表1 NCBI網(wǎng)站列出的核苷酸同源性分析的結(jié)果(略)
2.1.3 兩條核酸序列之間的同源性分析及核酸序列之間的多重比對分析及進(jìn)化分析
三條序列之間兩兩同源性分析均沒有發(fā)現(xiàn)明顯的同源性。DNAMAN軟件對3條序列進(jìn)行多重序列比對,結(jié)果顯示3條序列的一致性為38.69%(圖1)。
2.1.4 基因啟動子
經(jīng)過預(yù)測,pTSX1序列均不含啟動子。
2.1.5 基因外顯子
pTSX1有一個(gè)單一外顯子(61~675核苷酸)和Poly A信號(840~845核苷酸),見圖2。
2.1.6 開放閱讀框的分析
pTSX1序列有一615bp的開放閱讀框(61~675bp),編碼204個(gè)氨基酸。預(yù)測該蛋白的氨基酸序列為:MGAYKYVSELWRKK
QSDVMRFLQRVRCWEYRQHPSIVRVTRPTRP
DKARRLGYKAKQGYVVYRVRVRRGGRKRPV
PKGIVYGKPTNQGVTQLKFQRSKRPVAEERA
GRKLGGLRVLNSYWINEDSTYKYFEVILVDV
AHNAVRNDPRINWLCNPVHKHRELRGLTSA
GKKFRGLRGKGHRNYKNRPSRRATWKKNN
TVSLPRYR。
2.2 pTSX1編碼蛋白的分析
2.2.1 pTSX1核苷酸同源性的分析
所篩選得到的葎草花粉cDNA克隆序列pTSX1翻譯成氨基酸序列后,在NCBI網(wǎng)站使用Blastn程序進(jìn)行檢索,所得序列的一致性均>73%,Score值均>200(表2)。選取Score值高的10項(xiàng)進(jìn)行分析,其中6個(gè)編碼蛋白均為核糖體蛋白,4個(gè)為60S核糖體蛋白,2個(gè)只說明為核糖體蛋白。其余4個(gè)為尚未明確的蛋白。由此可知,葎草花粉序列pTSX1編碼蛋白很有可能為核糖體蛋白。
2.2.2 pTSX1蛋白產(chǎn)物理化性質(zhì)的預(yù)測
pTSX1基因編碼204個(gè)氨基酸、理論分子質(zhì)量約為24.23ku、等電點(diǎn)為11.90的堿性蛋白(圖3)。軟件InterProscan預(yù)測pTSX1編碼的蛋白共含有3454個(gè)原子,總分子式為C1078H1740N356O276S4。預(yù)測半衰期在哺乳動物網(wǎng)狀紅細(xì)胞中為30h,在酵母菌中大于20h,在大腸桿菌中大于10h。預(yù)測波動系數(shù)為39.63,結(jié)論為這類蛋白是穩(wěn)定的。使用軟件Sopma預(yù)測二級結(jié)構(gòu),結(jié)果顯示該蛋白富含α螺旋與β折疊(圖4);表2 NCBI網(wǎng)站列出的氨基酸同源性分析的結(jié)果(略)
2.2.3 蛋白質(zhì)結(jié)構(gòu)功能域的分析
基因pTSX1預(yù)測到一個(gè)Ribosomal L15(2~193aa)功能域(圖7)。
2.2.4 蛋白質(zhì)亞細(xì)胞定位的分析
預(yù)測到pTSX1編碼蛋白定位于線粒體,但可信度居于中等。
2.2.5 蛋白質(zhì)三級結(jié)構(gòu)的預(yù)測
在SwissModel服務(wù)器進(jìn)行蛋白質(zhì)的三級結(jié)構(gòu)同源建模(圖8)。
3 討 論
經(jīng)生物信息學(xué)分析,目的片段pTSX1序列核酸序列同源性分析與該序列編碼蛋白的同源性分析相一致,提示該序列為編碼核糖體蛋白的核酸序列。
目的片段pTSX1序列經(jīng)預(yù)測不含啟動子。有一個(gè)單一外顯子和Poly A信號。擁有一個(gè)615bp的開放閱讀框,編碼204個(gè)氨基酸的穩(wěn)定的堿性蛋白。編碼蛋白結(jié)構(gòu)功能域預(yù)測葎草花粉目的片段pTSX1序列編碼蛋白中有一核糖體蛋白L15(2~193aa)的功能域。此預(yù)測與前同源性預(yù)測相一致。蛋白質(zhì)亞細(xì)胞定位分析預(yù)測到pTSX1編碼蛋白定位于線粒體(可信度居于中等)。
核糖體是生物細(xì)胞中依據(jù)mRNA所提供的遺傳信息合成蛋白質(zhì)的細(xì)胞內(nèi)亞結(jié)構(gòu)。核糖體是顆粒結(jié)構(gòu),沒有被膜,含40%的蛋白質(zhì)、60%的RNA。蛋白按照一定的順序與RNA結(jié)合,組成兩個(gè)核糖體亞單體。核糖體中的蛋白質(zhì),rRNA以及其他一些輔助因子在一起提供了翻譯過程所需的全部酶活性。這些酶活性只有在核糖體整體結(jié)構(gòu)存在的情況下才具備。
不同種的原核生物核糖體蛋白質(zhì)之間有很高的同源性,序列分析和免疫反應(yīng)都證明了這一點(diǎn)。說明不同物種細(xì)胞中的核糖體可能來源于共同的祖先,在進(jìn)化上非常保守。在氨基酸選擇上應(yīng)當(dāng)是隨機(jī)的。由于核糖體的功能具有普遍意義,所以不同種的原核生物核糖體蛋白質(zhì)之間具有很高的同源性。對核糖體蛋白的功能有多種推測:①對rRNA折疊成有功能的三維結(jié)構(gòu)十分重要;②對核糖體的構(gòu)象變化起到微調(diào)作用;③在核糖體的結(jié)合位點(diǎn)及催化位點(diǎn)上與rRNA共同作用。
目前,用于變態(tài)反應(yīng)性疾病診斷及特異性免疫治療(SIT)的變應(yīng)原仍為粗制浸出液,存在諸多問題:成分復(fù)雜,且容易為外源性的毒性物質(zhì)污染;在治療中長期使用可能會出現(xiàn)過敏反應(yīng),嚴(yán)重者可致死亡;成分和濃度不穩(wěn)定,很難確定有效的治療劑量。1998年WHO的指導(dǎo)性文件中要求在免疫治療中應(yīng)使用標(biāo)準(zhǔn)化的變應(yīng)原疫苗。隨著分子克隆技術(shù)的發(fā)展,重組變應(yīng)原疫苗近年來成為研究的熱點(diǎn)。
基因重組疫苗是利用基因工程的方法,將變應(yīng)原的某個(gè)抗原基因或某幾個(gè)抗原表位在體外進(jìn)行擴(kuò)增和表達(dá),獲取表達(dá)產(chǎn)物作為免疫原。但其免疫原性較弱,需要進(jìn)行免疫修飾。與粗制浸出液相比,純化或重組變應(yīng)原具有如下優(yōu)點(diǎn):可大規(guī)模生產(chǎn),能保持較高的純度;可定量化、標(biāo)準(zhǔn)化,穩(wěn)定性好,易于質(zhì)控;特異性高,提高了診斷敏感性,并推進(jìn)了特異性免疫治療,有利于試劑的發(fā)展。目前,體外試驗(yàn)及皮膚試驗(yàn)的結(jié)果顯示,大部分基因重組變應(yīng)原的活性與天然變應(yīng)原提取液相當(dāng)。上述結(jié)論已被某些基因重組變應(yīng)原結(jié)構(gòu)分析的結(jié)果所證實(shí)。例如,由大腸桿菌所表達(dá)的基因重組變應(yīng)原Der p 2的IgE抗體反應(yīng)性與純化的天然Der p 2無差別。實(shí)際上Der p 2及樺樹花粉主要致敏蛋白組分Bet v 1的三維結(jié)構(gòu)測定是用基因重組變應(yīng)原來完成的。有研究者[1112]應(yīng)用重組變應(yīng)原疫苗進(jìn)行皮膚試驗(yàn)和體外血清學(xué)試驗(yàn),證實(shí)它和相應(yīng)的天然變應(yīng)原提取物一樣安全、有效。而且由于制劑穩(wěn)定、純度高,所以診斷實(shí)驗(yàn)的標(biāo)準(zhǔn)化也大大提高。作為治療用重組變應(yīng)原疫苗的基礎(chǔ)結(jié)構(gòu)經(jīng)過改造,明顯降低了IgE的結(jié)合力,可誘導(dǎo)人體保護(hù)性免疫應(yīng)答。堿基定向突變也為基礎(chǔ)性研究提供幫助,有助于認(rèn)識變應(yīng)原蛋白引起變應(yīng)原性的三維結(jié)構(gòu),能夠進(jìn)行廣泛、深入的免疫學(xué)以及發(fā)病機(jī)制的研究。
本次研究為進(jìn)一步探索過敏性哮喘發(fā)病的分子機(jī)制、特異性免疫治療、制備重組變應(yīng)原疫苗或核酸疫苗并進(jìn)一步應(yīng)用于臨床奠定了基礎(chǔ)。