摘 要:目的:2C類蛋白磷酸酶(PP2Cs)參與植物多種信號(hào)轉(zhuǎn)導(dǎo)途徑。其通過負(fù)調(diào)節(jié)絲裂原活化蛋白激酶(MAPK)信號(hào)通路參與植物多種脅迫響應(yīng)和代謝產(chǎn)物合成的調(diào)控。對(duì)工業(yè)大麻PP2C(CsPP2Cs)基因家族進(jìn)行全基因組鑒定及表達(dá)分析,以期為研究CsPP2Cs在工業(yè)大麻生長(zhǎng)發(fā)育過程中的生物學(xué)功能提供參考。方法:利用MEGA X構(gòu)建系統(tǒng)發(fā)育樹,利用ExPASy、WoLF PSORT、MEME、Batch-CD-Search、PlantCare、TBtools分別對(duì)CsPP2Cs蛋白理化性質(zhì)、亞細(xì)胞定位、保守基序、蛋白結(jié)構(gòu)域、CsPP2Cs基因啟動(dòng)子順式作用元件和與擬南芥PP2Cs(AtPP2Cs)基因的共線性進(jìn)行預(yù)測(cè)和分析。通過轉(zhuǎn)錄組數(shù)據(jù)和實(shí)時(shí)熒光定量聚合酶鏈?zhǔn)椒磻?yīng)(Real-time PCR)對(duì)CsPP2Cs基因表達(dá)進(jìn)行分析和驗(yàn)證。結(jié)果:從工業(yè)大麻全基因組中共鑒定出52個(gè)具有保守結(jié)構(gòu)域的PP2Cs,基因編碼蛋白長(zhǎng)度從244~1089個(gè)氨基酸不等,相對(duì)分子質(zhì)量在26.76~122.53kDa,亞細(xì)胞定位主要分布于細(xì)胞核、細(xì)胞質(zhì)和葉綠體。系統(tǒng)進(jìn)化樹將52個(gè)CsPP2Cs分為10個(gè)亞族和5個(gè)未分組成員。共線性分析發(fā)現(xiàn),工業(yè)大麻與擬南芥存在7對(duì)同源基因。順式元件預(yù)測(cè)顯示光響應(yīng)元件和脫落酸元件居多?;虮磉_(dá)熱圖顯示,相同基因在各組織中存在差異表達(dá)。對(duì)部分基因進(jìn)行Real-time PCR驗(yàn)證,進(jìn)一步證實(shí)了轉(zhuǎn)錄組數(shù)據(jù)的準(zhǔn)確性。同時(shí),可變剪切分析表明部分CsPP2Cs基因在進(jìn)化過程中存在可變剪切本。結(jié)論:從全基因組層面對(duì)CsPP2Cs進(jìn)行了分析和預(yù)測(cè),提示CsPP2Cs可能廣泛參與工業(yè)大麻的多種生物學(xué)過程,為進(jìn)一步研究CsPP2Cs功能奠定了基礎(chǔ)。
關(guān)鍵詞:工業(yè)大麻;PP2C 基因家族;成員鑒定;功能預(yù)測(cè);表達(dá)分析
大麻(Cannabis sativa)是大麻科(Cannabinaceae)大麻屬(Cannabis)一年生草本植株,多雌雄異株,生長(zhǎng)適應(yīng)能力強(qiáng),各國(guó)均有分布[1]。大麻具有廣泛的藥用價(jià)值,食用價(jià)值和工業(yè)價(jià)值。火麻仁為成熟的大麻種子,是中醫(yī)常用的潤(rùn)下藥,始載于《神農(nóng)本草經(jīng)》“補(bǔ)中益氣,久服肥健”,對(duì)消化系統(tǒng)、心血管系統(tǒng)、中樞神經(jīng)系統(tǒng)有不同程度的藥理作用,可用于治療腸燥便秘、高血壓、高血脂、風(fēng)濕性疼痛等[2,3]。此外,火麻仁含有豐富的不飽和脂肪酸、蛋白質(zhì)、氨基酸、維生素等成分。食用火麻油、火麻酒等火麻仁食品,對(duì)人體具有一定的保健作用[4]。大麻化學(xué)成分復(fù)雜,可以分為大麻素和其他類化合物[5]。大麻素為具有C21骨架的次生代謝產(chǎn)物,主要存在于大麻的花和苞片中,具有鎮(zhèn)痛、降眼壓、抗腫瘤、抗炎等藥理作用,對(duì)于治療癌癥效果顯著,可通過抑制細(xì)胞活性和誘導(dǎo)細(xì)胞凋亡,治療乳腺癌、前列腺癌、肝細(xì)胞癌、胰腺癌等[6,7]。大麻富含植物纖維,韌皮纖維是最好的天然纖維之一,是上等的紡織和造紙?jiān)牧?/font>[8]。大麻纖維所制成的衣物具有良好的透氣性、吸汗排濕,導(dǎo)熱性能出色,同時(shí)因其含有酚類物質(zhì)及其衍生物,具有較好的抗菌性,深受消費(fèi)者喜愛[9,10]。根據(jù)大麻不同的使用價(jià)值可以將大麻分為用于收獲種子、纖維及非精神活性大麻二酚的工業(yè)大麻或漢麻和具有精神活性物質(zhì)四氫大麻酚的毒品大麻、娛樂大麻或藥用大麻兩類[11]。大麻最早在新石器時(shí)代時(shí)在東亞地區(qū)被馴化,目前所有的工業(yè)大麻和毒品品種都是從中國(guó)的野生植物和地方品種代表的祖先基因庫(kù)中分化出來的[12]。
PP2Cs為絲氨酸/蘇氨酸殘基蛋白磷酸酶,以單體的形式存在,其活性依賴于鎂離子或錳離子[13]。PP2Cs為多功能蛋白磷酸酶,其結(jié)構(gòu)特殊,C端為保守的催化區(qū),N端為長(zhǎng)短不一的延伸區(qū)。延伸區(qū)域的差異導(dǎo)致PP2Cs具有多種生物學(xué)功能[13,14,15]。PP2C基因家族成員參與植物多種生理途徑,包括脫落酸(ABA)信號(hào)途徑、調(diào)控植物生長(zhǎng)發(fā)育、植物創(chuàng)傷信號(hào)途徑、植物抗病信號(hào)途徑等[16]。PP2C基因家族A亞族參與ABA信號(hào)轉(zhuǎn)導(dǎo)途徑。例如,擬南芥PP2C(AtPP2Cs)基因家族A亞族9個(gè)成員啟動(dòng)子區(qū)域均含有ABA響應(yīng)元件,其中ABI1、PP2C A、HAB1、HAB2已被證實(shí)對(duì)ABA信號(hào)轉(zhuǎn)導(dǎo)途徑具有負(fù)調(diào)控作用[17]。黃花蒿中,AaPP2C1與ABA受體蛋白AaPYLs相互作用,在擬南芥中過表達(dá)AaPP2C1后,ABA響應(yīng)基因在ABA處理后表達(dá)下調(diào),從而降低植株對(duì)于ABA的敏感性,促進(jìn)種子發(fā)芽生根[18]。多個(gè)PP2C基因家族B亞族成員負(fù)調(diào)節(jié)絲裂原活化蛋白激酶(MAPK)途徑,而蛋白質(zhì)磷酸化和去磷酸化幾乎涉及植物所有的生理過程[19]。MAPK信號(hào)途徑促進(jìn)表皮扁平細(xì)胞的分化并抑制氣孔細(xì)胞的形成,這一空間上特殊的細(xì)胞發(fā)育過程是通過AP2C3基因特異性地負(fù)調(diào)節(jié)MPK3,MPK4和MPK6基因的表達(dá)實(shí)現(xiàn)的[20]。在苜蓿中,機(jī)械損傷可以激活鹽脅迫誘導(dǎo)的MAPK(SIMK)蛋白,而PP2C基因家族B亞族的MP2C通過去磷酸化SIMK使MAPK途徑失活,負(fù)調(diào)控外界損傷響應(yīng)[21]。煙草毛狀根中過表達(dá)NtMPK4或葉片瞬時(shí)表達(dá)NtMPK4基因可以提高尼古丁的生物合成,而NtPP2C2b通過去磷酸化活化NtMPK4而減少尼古丁的積累[22],表明PP2Cs可能參與植物次生代謝產(chǎn)物合成的調(diào)控。
目前,許多園藝植物和藥用植物的PP2C基因家族均已進(jìn)行了鑒定和分析,其中擬南芥和水稻分別含有76個(gè)[23]和78個(gè)PP2C基因家族成員[24],谷子80個(gè)[25],毛竹125個(gè)[26]、甘藍(lán)128個(gè)[27]、蒺藜苜蓿94個(gè)[28]、丹參83個(gè)[29]等。大麻基因組測(cè)序已完成,但尚未有關(guān)于大麻PP2C基因家族的研究報(bào)道。本研究基于工業(yè)大麻基因組和轉(zhuǎn)錄組數(shù)據(jù),通過生物信息學(xué)技術(shù)對(duì)CsPP2Cs基因家族進(jìn)行鑒定和分析,以期為后續(xù)研究CsPP2Cs基因功能提供參考依據(jù),為工業(yè)大麻分子育種提供研究思路。
1材料
本項(xiàng)目使用的工業(yè)大麻CRBRx基因組數(shù)據(jù)及其他品種Cherry Chem、Canna Tsu、White Cookies、Black Berry Kush、Black Lime、Valley Fire、Sour Diesel、Mama Thai和Terple腺毛轉(zhuǎn)錄組數(shù)據(jù)均來源于(NCBI)(https://www.ncbi.nlm.nih.gov),擬南芥基因組和AtPP2Cs基因家族數(shù)據(jù)來源于TAIR數(shù)據(jù)庫(kù)(https://www.arabidopsis.org)。工業(yè)大麻Dinamed Kush(Diku)的葉、花、苞片和種子轉(zhuǎn)錄組數(shù)據(jù)由本課題組測(cè)序獲得。
2方法
2.1CsPP2Cs基因家族成員鑒定及染色體定位
使用TBtools軟件[30]提取工業(yè)大麻所有蛋白序列與AtPP2Cs成員文件進(jìn)行雙向Blast,并結(jié)合結(jié)構(gòu)域獲取可能的CsPP2Cs基因家族成員,去除重復(fù)轉(zhuǎn)錄本后獲取CsPP2Cs蛋白序列。利用ExPASy(https://web.expasy.org/protparam)網(wǎng)站對(duì)CsPP2Cs蛋白理化性質(zhì)、分子質(zhì)量、等電點(diǎn)和氨基酸數(shù)目進(jìn)行預(yù)測(cè)。采用WoLF PSORT(https://wolfpsort.hgc.jp)網(wǎng)站,根據(jù)結(jié)果分值預(yù)測(cè)CsPP2Cs蛋白亞細(xì)胞定位。
2.2進(jìn)化樹系統(tǒng)分類
將CsPP2Cs蛋白序列和AtPP2Cs蛋白序列共同導(dǎo)入MEGA X軟件中進(jìn)行多序列比對(duì),利用鄰接法(NJ)構(gòu)建系統(tǒng)進(jìn)化樹(Bootstrap值1000),以AtPP2Cs為分類依據(jù)對(duì)CsPP2Cs成員進(jìn)行分類。
2.3基因結(jié)構(gòu)、保守基序與系統(tǒng)進(jìn)化分析
將CsPP2Cs與AtPP2Cs蛋白序列共同導(dǎo)入MEGA X軟件中進(jìn)行多序列比對(duì),利用鄰接法構(gòu)建系統(tǒng)進(jìn)化樹(Bootstrap值1000)。運(yùn)用MEME(https://meme-suite.org/meme/tools/meme)網(wǎng)站預(yù)測(cè)CsPP2Cs蛋白保守基序(Motif),保守基序參數(shù)設(shè)為10,其他值默認(rèn)。利用NCBI的Batch-CD-Search(https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)對(duì)CsPP2Cs蛋白結(jié)構(gòu)域進(jìn)行預(yù)測(cè)。最后,將CsPP2Cs進(jìn)化樹文本、全基因組注釋文件、CsPP2Cs保守基序、CsPP2Cs保守結(jié)構(gòu)域及重命名文件在TBtools軟件中進(jìn)行可視化作圖。
2.4共線性分析
從NCBI網(wǎng)站上下載擬南芥、大麻的全基因組數(shù)據(jù),在TBtools軟件中導(dǎo)入二者的基因組序列文件,同時(shí)導(dǎo)入CsPP2Cs的ID,對(duì)二者的共線性關(guān)系進(jìn)行可視化。
2.5順式作用元件預(yù)測(cè)
通過TBtools軟件獲取CsPP2Cs基因上游2kb序列文件,利用PlantCare(http://bioinformatics.psb.ugent.be/webtools/plantcare/html)網(wǎng)站預(yù)測(cè)啟動(dòng)子區(qū)的順式作用元件,在TBtools軟件中將其可視化。
2.6表達(dá)模式分析
將已報(bào)道的9個(gè)大麻栽培品種(Cherry Chem,Canna Tsu,White Cookies,Black Berry Kush, Black Lime, Valley Fire, Sour Diesel, Mama Thai和Terple)腺毛轉(zhuǎn)錄組以及工業(yè)大麻Diku品種的葉、花、苞片和種子的轉(zhuǎn)錄組數(shù)據(jù)中CsPP2Cs基因的表達(dá)量數(shù)據(jù)導(dǎo)入TBtools軟件中繪制熱圖,對(duì)該基因在不同組織中差異性表達(dá)和基因在不同品種的表達(dá)進(jìn)行聚類分析。
2.7實(shí)時(shí)熒光定量聚合酶鏈?zhǔn)椒磻?yīng)(Real-time PCR)分析
根據(jù)轉(zhuǎn)錄組數(shù)據(jù)的差異性表達(dá),對(duì)CsPP2C31、CsPP2C33、CsPP2C41進(jìn)行Real-time PCR驗(yàn)證分析。利用WARYONG試劑盒提取工業(yè)大麻Diku品種花、苞片、葉和種子的RNA,后用TransGen試劑盒反轉(zhuǎn)錄獲取cDNA。利用NCBI設(shè)計(jì)引物,用FOREVER STAR試劑盒進(jìn)行實(shí)時(shí)熒光定量PCR分析,反應(yīng)程序?yàn)椋?5℃預(yù)變性3 min,95℃變性30s,56℃退火20s,72℃延伸15 s,循環(huán)40次。CsPP2C31正向引物5’-GAAAATTGAGGACGACGCCG-3’,反向引物5’-GCAAATGTTCGGCGGTGAT-3’;CsPP2C33正向引物5’-AGAACCAGAACTTGCTCCGG-3’,反向引物5’-GTCTTCCATCTCCTCTCGCG-3’;CsPP2C41正向引物5’-GGCGGTTCTTGTTGTGTGAC-3’,反向引物5’-TGTTAGAGCCTCAGCAGCAC-3’;內(nèi)參基因EFla正向引物5’-ACCAAGATTGACAGGCGTTC-3’,反向引物5’-CCTTCTTCTCCACAGCCTTG-3’。
2.8可變剪切分析
利用IGV軟件對(duì)工業(yè)大麻可變剪切文件和工業(yè)大麻基因組文件進(jìn)行處理,獲取大麻部分基因家族成員可變剪切圖譜。將Diku品種的葉、花、苞片和種子的轉(zhuǎn)錄組數(shù)據(jù)中部分CsPP2Cs成員的表達(dá)量數(shù)據(jù)導(dǎo)入TBtools軟件中繪制熱圖。
3結(jié)果與分析
3.1CsPP2Cs基因家族成員鑒定和進(jìn)化樹分析
利用TBtools軟件將工業(yè)大麻基因組蛋白序列與AtPP2Cs蛋白序列進(jìn)行雙向Blast比對(duì),共獲得52個(gè)CsPP2Cs成員,見表1。CsPP2Cs數(shù)目明顯少于擬南芥、水稻和丹參等。生物信息學(xué)分析發(fā)現(xiàn),CsPP2Cs編碼的蛋白氨基酸數(shù)目在244~1089;相對(duì)分子質(zhì)量范圍是26.76~122.53 kDa,相對(duì)分子質(zhì)量相差較大;等電點(diǎn)范圍4.74~9.60。利用WoLF PSORT對(duì)CsPP2Cs進(jìn)行亞細(xì)胞定位預(yù)測(cè)發(fā)現(xiàn),52個(gè)CsPP2Cs可能分布在葉綠體、細(xì)胞核、細(xì)胞質(zhì)、線粒體、液泡和質(zhì)膜。其中,90%以上成員分布于細(xì)胞核、細(xì)胞質(zhì)和葉綠體。進(jìn)一步利用TBtools軟件分析發(fā)現(xiàn),CsPP2Cs基因不均勻地分布在工業(yè)大麻的10條染色體上,其中Chr.NC_044370.1染色體上PP2Cs基因數(shù)目最多,達(dá)13個(gè),且該染色體上含有明顯的基因簇,如CsPP2C10-13,而Chr.NC_044372.1僅含有1個(gè)基因CsPP2C23。見圖1。
表1 工業(yè)大麻PP2C基因家族基本信息及特征
圖1 CsPP2Cs基因染色體分布(A)和PP2C基因家族系統(tǒng)發(fā)育樹(B)
注:染色體的NC號(hào)以黃色字體標(biāo)注;At.擬南芥;Cs.工業(yè)大麻
PP2Cs因其結(jié)構(gòu)的特殊性,N端比C端保守性差,N端延伸區(qū)的差異性決定了成員之間的功能差異性[23,31],為了進(jìn)一步研究CsPP2Cs基因家族成員進(jìn)化特性,將AtPP2Cs與CsPP2Cs共同構(gòu)建系統(tǒng)發(fā)育樹,見圖1。根據(jù)進(jìn)化樹的分類結(jié)果,可將CsPP2Cs分為10個(gè)亞家族。其各亞家族成員分布情況為A亞族4個(gè)、B亞族4個(gè)、C亞族4個(gè)、D亞族7個(gè)、E亞族11個(gè)、F亞族6個(gè)、G亞族5個(gè)、H亞族3個(gè)、I亞族2個(gè)、J亞族1個(gè),剩余5個(gè)成員未聚類,分為其他類。
3.2CsPP2Cs基因家族保守基序、基因結(jié)構(gòu)和順式作用元件分析
利用MEME網(wǎng)站和TBtools分別對(duì)CsPP2Cs的保守基序和基因結(jié)構(gòu)進(jìn)行了分析。保守基序分析發(fā)現(xiàn),保守基序1、2、3分布于51個(gè)工業(yè)大麻PP2C基因家族成員,除CsPP2C4不含保守基序1,CsPP2C46不含保守基序2,CsPP2C42不含保守基序3外,其他基因家族成員均含有相應(yīng)的結(jié)構(gòu)域。保守基序4、6、8存在于48個(gè)CsPP2Cs成員中,保守基序5、9、10分布少數(shù)基因家族成員。除此之外,同一亞族內(nèi)成員的保守基序組成幾乎相同,進(jìn)一步表明進(jìn)化樹分類的可靠性,而不同亞族中的保守基序組成具有一定差異。見圖2、表2。
圖2 CsPP2Cs保守基序、結(jié)構(gòu)、和順式作用元件
注:A:Motif.保守基序;UTR.非編碼區(qū);CDS.編碼區(qū);B:順式作用元件從上到下依次為黃酮類合成基因調(diào)控元件、分生組織表達(dá)調(diào)控元件、水楊酸響應(yīng)元件、厭氧呼吸響元件、光響應(yīng)元件、低溫響應(yīng)元件、赤霉素響應(yīng)元件、茉莉酸甲酯響應(yīng)元件、脫落酸響應(yīng)元件、生物鐘響應(yīng)元件、干旱誘導(dǎo)響應(yīng)元件、玉米醇溶蛋白響應(yīng)元件、細(xì)胞周期調(diào)控、生長(zhǎng)素響應(yīng)元件、胚乳表達(dá)、損傷誘導(dǎo)、防御和脅迫響應(yīng)、種子特異性調(diào)控、缺氧特異性誘導(dǎo)、光敏色素表達(dá)負(fù)調(diào)控
表2 CsPP2Cs基因家族10個(gè)保守基序
基因結(jié)構(gòu)分析發(fā)現(xiàn),CsPP2Cs普遍含有外顯子和2個(gè)以上的內(nèi)含子。其中A、C、D和G亞族基因的外顯子數(shù)量不超過4個(gè)。十分有趣的是,5個(gè)未聚類PP2C基因或含有10個(gè)以上的外顯子(CsPP2C46、CsPP2C3、CsPP2C33),或僅含有3個(gè)外顯子(CsPP2C34、CsPP2C31),見圖2。
基因啟動(dòng)子對(duì)基因的表達(dá)和調(diào)控十分關(guān)鍵,因此,利用PlantCare對(duì)CsPP2Cs基因家族成員的啟動(dòng)子的順式作用元件進(jìn)行預(yù)測(cè)。共計(jì)發(fā)現(xiàn)20個(gè)順式作用元件,其中主要順式作用元件包括光響應(yīng)元件、脫落酸響應(yīng)元件、無氧誘導(dǎo)元件和茉莉酸甲酯響應(yīng)元件,在工業(yè)大麻基因家族中的分布數(shù)量依次為290、163、118、104個(gè)。數(shù)量最少的是光敏色素下調(diào)表達(dá)作用元件,僅有1個(gè),位于CsPP2C24啟動(dòng)子區(qū)。
3.3工業(yè)大麻PP2C基因家族表達(dá)模式分析及Real-time PCR驗(yàn)證
利用工業(yè)大麻Diku品種的葉、花、苞片、種子的轉(zhuǎn)錄組測(cè)序數(shù)據(jù)和已發(fā)表的不同大麻品種的腺毛轉(zhuǎn)錄組數(shù)據(jù)[32],繪制CsPP2Cs在不同品種和不同組織的表達(dá)熱圖,見圖3。通過聚類分析發(fā)現(xiàn),CsPP2Cs在不同組織中的表達(dá)有較為明顯的差異,CsPP2C33(未聚類)在葉中高表達(dá),CsPP2C21(F亞族)和CsPP2C31(未聚類)在種子中高表達(dá),CsPP2C41(B亞族)在苞片中高表達(dá)。而CsPP2C7、CsPP2C15、CsPP2C48、CsPP2C51在10個(gè)品種中均有較高的表達(dá)量,CsPP2C1、CsPP2C2、CsPP2C4、CsPP2C6、CsPP2C9、CsPP2C10、CsPP2C16、CsPP2C17、CsPP2C19、CsPP2C26、CsPP2C31、CsPP2C38、CsPP2C40、CsPP2C42、CsPP2C47、CsPP2C49表達(dá)量較低。相同基因在同一植物、不同品種中表達(dá)量存在差異,間接表明品種之間的表型差異與基因表達(dá)存在一定聯(lián)系。
圖3 CsPP2Cs基因在不同品種和組織的表達(dá)熱圖
注:CsPP2Cs基因在BB(Black Berry Kush),MT(Mama Thai),CC(Cherry Chem),BL(Black Lime),T(Terple),S(Sour Diesel),VF(Valley Fire).CT(Canna Tsu)和WC(White Cookies)品種腺毛的表達(dá);種子(seed)、花(flower)、葉(leaf)和苞片(bract)為CsPP2Cs在Diku品種不同組織的表達(dá)
為了進(jìn)一步驗(yàn)證轉(zhuǎn)錄組數(shù)據(jù)的可靠性,利用Real-time PCR對(duì)CsPP2C31、CsPP2C33、CsPP2C41在工業(yè)大麻Diku不同組織部位的表達(dá)情況進(jìn)行了驗(yàn)證。Real-time PCR結(jié)果顯示,CsPP2C31,CsPP2C33,CsPP2C41分別在種子,葉和苞片中高表達(dá),與轉(zhuǎn)錄組結(jié)果一致,見表3。
表3 CsPP2Cs Real-time PCR(x±s,n=3)
3.4CsPP2Cs基因家族共線性和可變剪切分析
擬南芥作為模式植物,其PP2C基因家族成員功能研究較為全面。因此,利用TBtools對(duì)CsPP2Cs和AtPP2Cs基因家族成員進(jìn)行了共線性分析,共計(jì)發(fā)現(xiàn)7對(duì)同源基因,分別CsPP2C12/AT4G38520,CsPP2C32/AT5G53140,CsPP2C40/AT3G05640,CsPP2C48/AT3G17250,CsPP2C42/AT3G23360,CsPP2C46/AT5G19280,CsPP2C1/AT5G01700。這與系統(tǒng)進(jìn)化樹的分類結(jié)果一致。見圖4。
圖4 大麻與擬南芥PP2C基因共線性分析(A)和CsPP2Cs基因可變剪切分析(B)
可變剪切是前體mRNA通過不同的剪切方式形成多種成熟mRNA的過程,是調(diào)控基因表達(dá)和產(chǎn)生蛋白質(zhì)多樣性的重要機(jī)制。可變剪切對(duì)植物的生長(zhǎng)發(fā)育、信號(hào)轉(zhuǎn)導(dǎo)、生物脅迫和非生物脅迫有重要調(diào)控作用。為此,對(duì)CsPP2Cs基因家族中CsPP2C31、CsPP2C33、CsPP2C41 3個(gè)基因進(jìn)行可變剪切分析。分析結(jié)果表明CsPP2C31、CsPP2C33存在1個(gè)可變剪切本,CsPP2C41存在4個(gè)可變剪切本,表明該基因在進(jìn)化的過程中發(fā)生了可變剪切事件,見圖4。不同的可變剪切本在不同的組織和部位可能受到不同的調(diào)控,與熱圖表達(dá)結(jié)果一致。
4討論
PP2Cs蛋白在進(jìn)化上十分保守,細(xì)菌、真菌、植物和動(dòng)物體內(nèi)均存在大量的PP2Cs[33]。植物中的已知的PP2Cs主要參與脅迫信號(hào)轉(zhuǎn)導(dǎo),但大多數(shù)的PP2Cs功能仍然未知。本文利用生物信息學(xué)技術(shù),通過Blast比對(duì)序列、構(gòu)建系統(tǒng)發(fā)育樹、基因表達(dá)分析等方法,從工業(yè)大麻全基因組中獲取了52個(gè)CsPP2Cs成員。并對(duì)其亞細(xì)胞定位、理化性質(zhì)、基因結(jié)構(gòu)和表達(dá)情況等進(jìn)行了分析與預(yù)測(cè)。其中,90% CsPP2Cs分布于細(xì)胞核、細(xì)胞質(zhì)、葉綠體,為后續(xù)基因互作研究提供一定的參考依據(jù)。CsPP2Cs基因不均勻分布在工業(yè)大麻的10條染色體上,大部分染色體存在基因簇,表明該基因在進(jìn)化的過程中發(fā)生了復(fù)制事件,同一基因簇的成員可能含有相類似的功能。
進(jìn)化樹分析將CsPP2Cs分為10個(gè)亞家族和5個(gè)未分類成員,與擬南芥分類結(jié)果一致,表明該基因家族在進(jìn)化過程中較為保守。擬南芥中,PP2C A亞族主要參與ABA信號(hào)響應(yīng),而ABA廣泛調(diào)控植物的蒸騰作用、營(yíng)養(yǎng)生殖和種子萌發(fā)[17,34]。CsPP2C A亞族的CsPP2C15啟動(dòng)子區(qū)域含有ABA響應(yīng)元件,定位于細(xì)胞質(zhì)。這與處于同一進(jìn)化分支上的擬南芥AT3G11410非常相似,AT3G11410在擬南芥種子萌發(fā)時(shí)調(diào)控ABA信號(hào)通路[35]。PP2C B亞族基因成員與MAPK基因家族成員有顯著調(diào)控關(guān)系[36]。由于植物不同脅迫響應(yīng)共享MAPK信號(hào)通路的調(diào)控,因此,推測(cè)PP2C可能是MAPK信號(hào)轉(zhuǎn)導(dǎo)的特異性響應(yīng)的分子基礎(chǔ)。CsPP2Cs B亞族含有4個(gè)成員,分別是CsPP2C41、CsPP2C14、CsPP2C26和CsPP2C19。其中,CsPP2C41定位在葉綠體,在進(jìn)化中與At2G30020(AtAP2C1)更相近。At2G30020在擬南芥中負(fù)調(diào)控脅迫引起的MAPK信號(hào)轉(zhuǎn)導(dǎo)。植物受傷后,At2G30020突變體中的茉莉酸含量升高[37],過表達(dá)株系中,損傷引起的MAPK信號(hào)降低,而CsPP2C41的啟動(dòng)子中具有茉莉酸甲酯響應(yīng)元件,提示CsPP2C41與At2G30020可能具有相似的功能。
保守基序與基因功能密切相關(guān),保守基序9為CsPP2Cs D亞族所特有,AtPP2Cs基因家族D亞族具有明顯的核定位和質(zhì)膜定位信號(hào)[23],與細(xì)胞發(fā)育相關(guān)。擬南芥PP2C基因家族的MIDAs蛋白調(diào)節(jié)幼苗脫黃化,其中,MIDA11參與下胚軸伸長(zhǎng),MIDA9和MIDA10調(diào)節(jié)頂鉤的發(fā)育,MIDA1調(diào)控子葉分離[38],其他D亞族成員對(duì)植物幼苗的萌發(fā)及生長(zhǎng)均有不同程度的調(diào)控作用[39],推測(cè)CsPP2Cs基因家族D亞族成員可能具有相應(yīng)的功能。工業(yè)大麻與擬南芥共線性分析共獲取了7對(duì)同源基因,其中,蛋白質(zhì)定位在細(xì)胞質(zhì)的E亞族基因CsPP2C40與AT3G05640(AtPP2CF1)具有共線性。擬南芥中外源ABA處理可顯著提高AT3G05640基因在維管組織和保衛(wèi)細(xì)胞的表達(dá)[40]。另外,AT3G05640基因過表達(dá)株系表現(xiàn)出對(duì)ABA處理的低敏感表型[40]。CsPP2C48基因共線性基因AT3G17250在擬南芥胚乳中表達(dá),其負(fù)調(diào)控蛋白激酶途徑、脂類信號(hào)轉(zhuǎn)導(dǎo)途徑和茉莉酸生物合成途徑[41]。因此,CsPP2C40和CsPP2C48基因在大麻中可能具有類似的功能。
通過Real-time PCR對(duì)部分差異性表達(dá)的基因進(jìn)行分析發(fā)現(xiàn),CsPP2C33基因在葉中高表達(dá)。CsPP2C33與AT4G27800在進(jìn)化中處于同一分支,AT4G27800.1基因?yàn)閿M南芥AT4G27800基因的3種剪切形式中的一種,在葉片中表達(dá),與植物的光合作用密切相關(guān)[42];種子高表達(dá)基因CsPP2C31與AT4G11040基因同源,AT4G11040在種子吸脹期抑制去磷酸化,影響種子的休眠和萌發(fā)[43]。因此,CsPP2C33與CsPP2C31基因在大麻中極有可能具有類似的功能。
本研究通過生物信息學(xué)技術(shù)和方法對(duì)CsPP2Cs基因家族成員進(jìn)行了系統(tǒng)且全面的分析,為工業(yè)大麻PP2C基因家族的功能研究和大麻的分子育種品種選育提供了參考依據(jù)。
利益沖突:本文不存在任何利益沖突。
參考文獻(xiàn)
[1]楊柳秀,李超然,高雯.大麻化學(xué)成分及其種屬差異研究進(jìn)展[J].中國(guó)中藥雜志,2020,45(15):3556-3564.
[2]AMIN M R,ALI D W. Pharmacology of Medical Cannabis[J].Adv Exp Med Biol,2019,1162:151-165.
[3]賀海波,石孟瓊.火麻仁的化學(xué)成分和藥理活性研究進(jìn)展[J].中國(guó)民族民間醫(yī)藥,2010,19(15):56-57.
[4]韋鳳,涂冬萍,王柳萍.火麻仁食用開發(fā)和藥理作用研究進(jìn)展[J].中國(guó)老年學(xué)雜志,2015,35(12):3486-3488.
[5]弓佩含,楊洋,劉玉婷,等.大麻化學(xué)成分及藥理作用的研究進(jìn)展[J].中國(guó)實(shí)驗(yàn)方劑學(xué)雜志,2017,23(13):212-219.
[6]DARIŠ B,TANCER VERBOTEN M,KNEZ ?,et al. Cannabinoids in cancer treatment: Therapeutic potential and legislation[J].Bosn J Basic Med Sci,2019,19(1):14-23.
[7]HILL K P,PALASTRO M D,JOHNSON B,et al. Cannabis and pain: A clinical review[J].Cannabis Cannabinoid Res,2017,2(1):96-104.
[8]周永凱,張建春,張華.大麻纖維的抗菌性及抗菌機(jī)制[J].紡織學(xué)報(bào),2007,28(6):12-15.
[9]陳建華,臧鞏固,趙立寧,等.大麻化學(xué)成分研究進(jìn)展與開發(fā)我國(guó)大麻資源的探討[J].中國(guó)麻業(yè),2003,25(6):266-271.
[10]孫小寅,管映亭,溫桂清,等.大麻纖維的性能及其應(yīng)用研究[J].紡織學(xué)報(bào),2001,22(4):34-36.
[11]JOHNSON R. Defining hemp: A fact sheet[J].Congressional Res Service, 2019, 44742.
[12]REN G, ZHANG X, Li Y, et al. Large-scale whole-genome resequencing unravels the domestication history ofCannabis sativa[J].Sci Adv, 2021, 7(29): eabg2286.
[14]HUBBARD M J,COHEN P. On target with a new mechanism for the regulation of protein phosphorylation[J].Trends Biochem Sci,1993,18(5):172-177.
[15]BORK P,BROWN N P,HEGYI H,et al. The protein phosphatase 2C (PP2C) superfamily: detection of bacterial homologues[J].Protein Sci,1996,5(7):1421-1425.
[16]FUCHS S,GRILL E,MESKIENE I,et al. Type 2C protein phosphatases in plants[J].FEBS J,2013,280(2):681-693.
[17]UMEZAWA T,SUGIYAMA N,MIZOGUCHI M,et al.Type 2C protein phosphatases directly regulate abscisic acid-activated protein kinases inArabidopsis[J].Proc Natl Acad Sci U S A,2009,106(41):17588-17593.
[18]ZHANG F, FU X, LV Z, SHEN Q, et al. Type 2C phosphatase 1 ofArtemisiaannuaL. is a negative regulator of ABA signaling [J]. Bio Med Res Int, 2014,2014:521794.
[20]UMBRASAITE J,SCHWEIGHOFER A,KAZANAVICIUTE V,et al.MAPK phosphatase AP2C3 induces ectopic proliferation of epidermal cells leading to stomata development inArabidopsis[J].PLoS One,2010,5(12):e15357.
[21]MESKIENE I,BAUDOUIN E,SCHWEIGHOFER A,et al. Stress-induced protein phosphatase 2C is a negative regulator of a mitogen-activated protein kinase[J].J Biol Chem,2003,278(21):18945-18952.
[22]LIU X,SINGH S K,PATRA B,et al. Protein phosphatase NtPP2C2b and MAP kinase NtMPK4 act in concert to modulate nicotine biosynthesis[J].J Exp Bot,2021,72(5):1661-1676.
[23]SCHWEIGHOFER A,HIRT H,MESKIENE I. Plant PP2C phosphatases: emerging functions in stress signaling[J].Trends Plant Sci,2004,9(5):236-243.
[24]XUE T,WANG D,ZHANG S,et al. Genome-wide and expression analysis of protein phosphatase 2C in rice andArabidopsis[J].BMC Genomics,2008,9:550.
[25]閔東紅, 薛飛洋, 馬亞男, 等.谷子PP2C基因家族的特征[J].作物學(xué)報(bào), 2013,39(12):2135-2144.
[27]王丹丹. 白菜、甘藍(lán)、擬南芥PP2C型蛋白磷酸酶基因的比較分析與功能研究[D].楊凌:西北農(nóng)林科技大學(xué),2017.
[28]YANG Q,LIU K,NIU X,et al. Genome-wide identification of PP2C genes and their expression profiling in response to drought and cold stresses in medicago truncatula[J].Sci Rep,2018,8(1):12841.
[29]徐志超,浦香東,宋經(jīng)元.基于丹參基因組的蛋白磷酸酶2C家族的系統(tǒng)分析[J].中國(guó)現(xiàn)代中藥,2018,20(6):652-657.
[30]CHEN C,CHEN H,ZHANG Y,et al. TBtools: An integrative toolkit developed for interactive analyses of big biological data[J].Mol Plant,2020,13(8):1194-1202.
[31]LU X,XIONG Q,CHENG T,et al. A PP2C-1 Allele underlying a quantitative trait locus enhances soybean 100-seed weight[J].Mol Plant,2017,10(5):670-684.
[32]ZAGER J J,LANGE I,SRIVIDYA N,et al. Gene Networks Underlying Cannabinoid and Terpenoid Accumulation in Cannabis[J].Plant Physiol,2019,180(4):1877-1897.
[33]RODRIGUEZ P L.Protein phosphatase 2C (PP2C) function in higher plants[J].Plant Mol Biol,1998,38(6):919-927.
[34]FINKELSTEIN R R,GAMPALA S S,ROCK C D. Abscisic acid signaling in seeds and seedlings[J].Plant Cell,2002,14 Suppl(Suppl):S15-45.
[35]YOSHIDA T, NISHIMURA N, KITAHATA N, et al. ABA-hypersensitive germination3 encodes a protein phosphatase 2C (AtPP2CA) that strongly regulates abscisic acid signaling during germination among arabidopsis protein phosphatase 2Cs [J]. Plant Physiol,2006,140(1):115-126.
[36]BROCK A K,WILLMANN R,KOLB D,et al. The Arabidopsis mitogen-activated protein kinase phosphatase PP2C5 affects seed germination, stomatal aperture, and abscisic acid-inducible gene expression[J].Plant Physiol,2010,153(3):1098-1111.
[37]SCHWEIGHOFER A,KAZANAVICIUTE V,SCHEIKL E,et al.The PP2C-type phosphatase AP2C1, which negatively regulates MPK4 and MPK6, modulates innate immunity, jasmonic acid, and ethylene levels inArabidopsis[J].Plant Cell,2007,19(7):2213-2224.
[38]SENTANDREU M,MARTíN G,GONZáLEZ-SCHAIN N,et al. Functional profiling identifies genes involved in organ-specific branches of the PIF3 regulatory network inArabidopsis[J].Plant Cell,2011,23(11):3974-3991.
[39]ROVIRA A,SENTANDREU M,NAGATANI A,et al.The sequential action of MIDA9/PP2C.D1, PP2C.D2, and PP2C.D5 is necessary to form and maintain the hook after germination in the dark[J].Front Plant Sci,2021,12:636098.
[40]SUGIMOTO H,KONDO S,TANAKA T,et al. Over expression of a novel Arabidopsis PP2C isoform, AtPP2CF1, enhances plant biomass production by increasing inflorescence stem growth[J].J Exp Bot,2014,65(18):5385-5400.
[41]HSIEH T F,SHIN J,UZAWA R,et al. Regulation of imprinted gene expression inArabidopsisendosperm[J].Proc Natl Acad Sci USA,2011,108(5):1755-1762.
[42]PRIBIL M,PESARESI P,HERTLE A,et al. Role of plastid protein phosphatase TAP38 in LHCII dephosphorylation and thylakoid electron flow[J].PLoS Biol,2010,8(1):e1000288.
[43]XIANG Y,SONG B,NÉE G,et al. Sequence polymorphisms at the REDUCED DORMANCY5 pseudophosphatase underlie natural variation in Arabidopsis dormancy[J].Plant Physiol,2016,171(4):2659-2670.
文章摘自:蔡曉雪,王思凡,米要磊,萬會(huì)花,曹雪,孫偉,蘇暢,陳士林,徐艷琴,陳偉強(qiáng).工業(yè)大麻PP2C基因家族成員鑒定及表達(dá)分析[J/OL].中國(guó)實(shí)驗(yàn)方劑學(xué)雜志:1-13[2022-07-08].DOI:10.13422/j.cnki.syfjx.20221111.
