Nature Communications百邁客合作文章油菜重測序-GWAS詳解

2019年03月11日,Nature Communications在線發表了西南大學農學與生物科技學院與北京百邁客生物科技有限公司共同合作文章“Whole-genome resequencing reveals?Brassica napus?origin and genetic loci involved in its improvement”?西南大學盧坤研究員為本文第一作者,西南大學李加納教授、中國農業科學院蔬菜花卉研究所王曉武研究員、美國佐治亞大學Andrew H. Paterson教授為該文章共同通訊作者,其中北京百邁客公司生物信息研發總監周鋼博士,王運通,李小龍為共同作者,文章詳細解讀如下:


英文題目:Whole-genome resequencing reveals?Brassica napus?origin and genetic loci involved in its improvement

中文題目:全基因組重測序揭示甘藍型油菜起源和參與其改良的遺傳基因座

發表雜志:Nature Communications?;

影響因子:IF=12.353;

發表時間:2019.03.11;

合作單位:西南大學農學與生物科技學院;

摘 要

甘藍型油菜(Brassica napus,2n=4x=38,AACC)是一種重要的異源多倍體作物,其來自于白菜型油菜(Brassica rapa,2n=2x=20,AA)和甘藍(Brassica oleracea,2n=2x=18,CC)的種間雜交。然而,真正的野生B. napus群體尚不清楚,其起源和改良過程仍不清楚。在本研究中,研究人員利用重測序的方法對588份甘藍型油菜(Brassica napus)進行測序,揭示了A亞基因組可能從歐洲蕪菁的祖先進化而來,而C亞基因組可能是從大頭菜,花椰菜,西蘭花和中國羽衣甘藍的共同祖先進化而來。此外,冬季油籽型可能是歐洲油菜的原始形式。防御反應相關基因在亞基因組上的特異性選擇有助于物種形成后的環境適應性,而不對稱的亞基因組選擇導致生態型的變化。通過結合全基因組關聯分析(genome-wide association studies),群體選擇分析及轉錄組分析,研究人員鑒定了與提高的脅迫耐受性,含油量,種子質量和生態型改良相關的基因,這些基因成為甘藍型油菜(Brassica napus)進一步功能鑒定和遺傳改良的候選基因組。

研究背景

甘藍型油菜(Brassica napus)是世界范圍內重要的油籽作物,包括用于動物飼料和人類消費的結節(甘藍或大頭菜)和綠葉(飼料油菜和羽衣甘藍)形式存在。在Brassica napus的育種期間,種子中不需要的油用成分芥酸和脂肪族硫代葡萄糖苷含量顯著地減少,而含油量,種子產量和抗病性得到了顯著改善。如禹氏三角(Triangle of U)中所描述,三個異源多倍體種,甘藍型油菜Brassica napus?(AACC, 2n = 38),芥菜Brassica juncea?(AABB, 2n = 36)和埃塞俄比亞芥Brassica carinata?(BBCC, 2n = 34)?分別來源于三個祖先二倍體種間兩兩雜交,三個祖先二倍體種包括:蕪菁Brassica rapa?(AA, 2n = 20),甘藍Brassica oleracea?(CC, 2n = 18),和黑芥Brassica nigra?(BB, 2n = 16)。這三個蕓薹屬二倍體祖先種本身是古多倍體,經歷了譜系特異的全基因組三倍化,使得異源多倍體后代甘藍型油菜(B. napus)成為研究多倍體形態,進化和選擇過程的理想模型。

作為最早的異源多倍體作物之一,B.napus通過B. rapaB.oleracea雜交形成,估計甘藍型油菜(B.napus)的形成時間為~6700和~7500年前及38000-51000年前。文獻中記載,冬季甘藍型油菜首次在歐洲種植,大約在1700年,春季甘藍型油菜開始種植并在18世紀末傳播到英國,半冬生態型主要在中國種植,在1930 – 1940年間從歐洲引入。然而,并沒有真正已知的野生甘藍型油菜(B.napus)群體,導致雜交形成B.napus的兩個祖先種的精確身份仍然難以捉摸,因為B. rapaB. oleracea具有形態多樣的亞種,并且通常在整個歐洲種植了幾百年。這些物種之間的天然雜交偶然性地在適當的條件下發生。雖然最近的一項研究表明甘藍型油菜(B.napus)的A亞基因組可能來源于歐洲蕪菁(B. rapa ssp. rapa)的祖先,但是由于僅5份B.napus和27份?B. rapa種質被納入該項分析中,因此需要提供更多支持該結論的證據。先前基于細胞核和葉綠體標記的研究也表明,甘藍型油菜可能是從蘿卜和西蘭花之間的種間雜交發育而來,或是由幾個獨立的雜交事件形成的。為了進一步了解甘藍型油菜的進化,有必要揭示野生種或馴化種的供體是否是親本祖先,其中B. rapaB. oleracea亞種參與甘藍型油菜的形成。

全基因組重測序這一技術手段已被用于鑒定有助于作物馴化和改良的基因,例如水稻(Oryza sativa),番茄(Solanum lycopersicum)和大豆(Glycine max)。三個蕓薹屬祖先種和異源多倍體種B. napusB. juncea的基因組已經釋放。199份B. rapa和119份B. oleracea種質的重測序將有助于研究B. napus中每個亞基因組中的受選擇作用,同時將澄清該物質的祖先種。

在本研究中,研究人員進行了588份B. napus材料的重測序及2份具有不同種子質量的B. napus種質中11個組織的轉錄組測序。大量變異的鑒定不僅僅提供了對甘藍型油菜(B. napus)起源和進化歷史的深入理解,確定了其改良所涉及的遺傳基因座,而且為控制重要性狀的候選基因的進一步功能驗證奠定了基礎。此外,本研究的發現為促進B. napus和具有優良性狀的相關作物的繁殖提供了基礎。

材料方法

研究材料:588份甘藍型油菜(B. napus)種質(466份來自亞洲,102份來自歐洲,13份來自北美,7份來自澳大利亞),根據生長習性記錄,這些材料分為三種生態型[春季型(86份),冬季型(74份)和半冬季型(428份)];199?B. rapa和119?B. oleracea種質數據(NCBI中下載);2份具有不同含油量和種子質量的代表性種質(Zhongshuang11和Zhongyou821)的11個組織;

研究策略:Illumina HiSeq 4000,PE125,插入片段350 bp;B. rapa?(version 1.5)?和B. oleracea?(version 1.0)整合為甘藍型油菜祖先的假基因組(B. napus?ancestral pseudo-genome);B. napus參考基因組(version 4.1);

研究方法:

參考基因組比對:Burrows-Wheeler Aligner (version 0.7.10-r789),Picard(release 2.0.1),GATK(version 3.2-2-gec30cee);

SNP和InDel calling:?SAMtools’s mpileup (version 0.1.19-44428cd)和GATK,SelectVariants in GATK(以B. napus?ancestral pseudo-genome基因組為參考基因組,B. napus重測序數據進行mapping比對,calling SNPs,基于亞基因組水平,分為兩組SNPs;分別以B. rapa?B. oleracea相應的基因組做參考,在?B. rapa?B. oleracea重測序數據中檢索SNPs,與已獲得的兩組SNPs整合,分別代表BraA和BolC SNP集;以?B. napus基因組作為參考基因組,B. napus重測序數據進行mapping比對,獲得SNPs集合Bna);

系統發育和群體結構分析:分別利用BraA, BolC和Bna SNPs數據集獲得17,000, 19,377?和19,548個SNPs構建3個ML trees(IQ-TREE v1.6.6),通過Bayesian information criterion(BIC)確定最佳模型,PCA主成分分析[EIGENSOFT version 6.1.4],群體結構分析[ 50份B. napus地方種和2個祖先種,199份B. rapa和119?B. oleracea種質材料(STRUCTURE)];

B. napus的種群歷史動態分析:diffusion approximations for demographic inference (?a?i) version 1.7.0和fastsimcoal2 v. 2.6.0.3;SMC++;

LD連鎖不平衡分析:?PLINK v1.07;

農藝性狀的測量:本研究中所有種質材料在2013年和2014年的生長季節種植在中國重慶?(29°45′N, 106°22′E, 238.57 m)?,進一步隨機選擇了5株植株,進行了單株種子產量(SY),長角果長度(SL)的測量,含油量(OC),種子顏色(SC)與總硫代葡萄糖苷含量(GC)通過NIRS進行分析,脂肪酸棕櫚酸,硬脂酸,油酸,亞油酸,亞麻酸,二十碳烯酸和芥酸通過氣液色譜法定量,同時進行開花時間(FT)的測定;

全基因組選擇清除分析:核苷酸多態性π,Fst,ROD,XP-CLR,XP-EHH;

基因型填充和準確性評估:Beagle v.4.1?;

全基因組關聯分析研究:mrMLM v1.3,GEC software;

轉錄組和基因本體富集分析:STAR 2.4.2a,FPKM(2個具有不同含油量和種子質量的代表性種質的11個組織,每個樣品2個生物學重復);

GO富集分析:BLASTP;

研究結果

1)測序與變異分析

研究人員對來自21個國家的588份不同的甘藍型油菜(B.napus)種質進行重測序(圖1 a),共計獲得4.03 Tb clean data,將測序數據過濾后,比對到甘藍型油菜(B. napus)參考基因組上,比對效率從79.84%—99.45%不等,有效數據平均測序深度~5×(3.37×—7.71×),共計獲得5,294,158個SNPs(Bna表示)和?1,307,151個indels。通過Sanger測序驗證了20份種質中103個隨機選擇的SNPs,表明大多數已鑒定的SNPs(95.1%)是真實的。在20份種質的2個生物學重復中,對SNPs的可靠性進一步證實,發現大多數SNPs(93.5%-96.4%)是重復的。

圖1? 甘藍型油菜的種質的地理分布和群體結構

B. napus測序數據比對到B. napus?ancestral pseudo-genome(整合了B.rapaB. oleracea參考基因組)上獲得SNPs集合,進一步基于兩個祖先種的比對信息,將SNPs數據集劃分為BnaA和BnaC兩個集合。將B. rapaB. oleracea的測序數據分別比對到相應的基因組上,比對到B. rapa上的SNPs與BnaA進行整合,形成?A(B. rapaB. napus)亞基因組SNPs集合(BraA表示,包含529,771個SNPs),類似,形成?C(B. oleracea?和B. napus)?亞基因組SNPs集合(BolC表示,包含675,457個SNPs)。

2)甘藍型油菜(B. napus)的起源

基于最佳模型(Bna, BraA和BolC SNPs集合分別采用GTR+F+ASC+R5, GTR+F+ASC+R7?和?TVM+F+ASC+R8模型),利用IQ-TREE構建(ML) trees(圖1a,2a,3a),結果顯示,B. napusB. rapaB. oleracea各自具有一個分枝。大部分甘藍型油菜(B.napus)依據生態型聚類到一起,而B. rapaB. oleracea的聚類主要反映了亞種間的關系。BraA的系統發育關系顯示,甘藍型油菜(B.napus)的親緣關系更接近于European turnip(歐洲蕪菁),并與B. rapa?ssp.?rapa?(亞洲蕪菁)及其它亞種親緣關系較遠(圖2a),而這正與最近的一項研究結果相一致,即甘藍型油菜(B. napus)的A亞基因組是從歐洲蕪菁的祖先進化而來的;通過動態演化情境模擬進一步分析顯示,在大約~106-1,170年前,從歐洲蕪菁到甘藍型油菜A亞基因組發生了基因交流(fastsimcoal2);PCA主成分分析顯示,甘藍型油菜地方品種(B. napus?landraces,n = 50,1980年前登記)更接近歐洲蕪菁(n = 33)(圖2b)。群體結構分析顯示,當K=2時,為最佳的分群數(圖2c),其明確的將甘藍型油菜的地方品種與歐洲蕪菁分開,進一步支持了甘藍型油菜A亞基因組的進化歷史。

圖2? 588份?B. napus材料和199份B. rapa材料的群體結構分析

在BolC ML tree中,甘藍型油菜種質(B. napus?accessions)與甘藍關系更近,主要包括4個亞種—-大頭菜(B. oleracea?var.?gongylodes),西藍花(B. oleracea?var.?italica),花椰菜(B. oleracea?var.?botrytis)和中國羽衣甘藍(B. oleracea?var.?alboglabra),暗示了甘藍型油菜C亞基因組可能是從這些譜系的共同祖先進化而來的(圖3a)。為了驗證這一結果,研究人員利用了?a?i和fastsimcoal2進行了動態演化情境模擬分析,?a?i結果支持了甘藍型油菜C亞基因組從大頭菜,西蘭花和花椰菜的共同進化而來的這一模型(log-likelihood =–6806);fastsimcoal2結果以更高的支持度證明了甘藍型油菜的C亞基因組起源于大頭菜,西藍花和花椰菜的共同祖先(Δ= 4603200; log-likelihood =–2975039),上述研究暗示甘藍型油菜C亞基因組起源于四個甘藍亞種的祖先分化期間;考慮到種群遷移事假可能發生在三個不同的階段(recent, medium- and long-term),本研究中比較了五個模型(模型c-g)以推斷甘藍型油菜C亞基因組的進化歷史,本研究的數據支持模型c(log-likelihood = -2914388),暗示了甘藍型油菜的祖先從四個甘藍亞種的共同祖先分化,甘藍型油菜最近的基因交流發生在~108–898年前;在PCA主成分分析中,大頭菜(n=19)是與甘藍型油菜地方種親緣關系最近的亞種,后續是中國羽衣甘藍,西蘭花和花椰菜(圖3b),表明甘藍型油菜地方品種與這四個甘藍亞種親緣關系更近,當K=2時,作為甘藍型油菜地方種與甘藍的最佳的分群數(圖3c),代表不同的甘藍型油菜和甘藍的分類群,表明甘藍型油菜C亞基因組具有比A亞基因組具有更復雜的起源。

圖3? 588份?B. napus材料和199份B. oleracea材料的群體結構分析

Cruydt Boeck記錄了冬季型甘藍型油菜(winter?B. napus)的早期形態并注意到其被用作燃料,為了進一步驗證這個記錄,研究人員基于A和C亞基因組的祖先種(33份歐洲蕪菁和66份四種甘藍亞種)和B. napus種質的SNP集合,比較了不同類群的LD衰減值(Linkage disequilibrium (LD) decay),在閾值r?2?= 0.3時,B.rapa(2.10 kb)和B. oleracea(27.90 kb)要強于B. napus的A(19.30 kb)和C(1365.30 kb)亞基因組,進一步支持了在甘藍型油菜進化過程中在兩個亞基因組上經歷了強烈的瓶頸效應。在Bna SNP集合中,油用型甘藍型油菜(oilseed?B. napus)比菜用型甘藍型油菜(vegetable?B. napus)的LD衰減更快,冬季型比春季型和半冬季型LD衰減更快;研究人員進一步利用SMC++評估了不同生態類型的有效群體大小(Ne)和分化時間及甘藍型油菜的用途。不同甘藍型油菜的生態類型的Ne值顯示出相似的動態,估計甘藍型油菜的形成時間~1912-7178年前。冬季型和半冬季型甘藍型油菜生態類型在?60年前進行分化,而冬季型和春季型甘藍型油菜在?416年前進行分化,油用型和非油用型油菜在?~277年前進行分化,而這些結果與歷史記錄相一致,基于上述結果,可以推測出冬季油用型油菜為原始的甘藍型油菜。

3)改良的甘藍型油菜受選擇信號分析

首先將甘藍型油菜起源后的改良過程分為兩個階段,第一個改良階段(first stage of improvement,FSI)是從起源種到地方種的改良,第二個改良階段(second stage of improvement,SSI)代表從地方種的改良到栽培種的改良。由于尚且不知道野生型甘藍型油菜的類群,研究人員混合了兩個組群的祖先種,歐洲蕪菁(n = 33)和四種甘藍的亞種(n = 66),分別以此代表了甘藍型油菜假-野生祖先A(AA表示)亞基因組和C(CA表示)亞基因組。為了避免來自非祖先種基因滲入的影響,研究人員通過利用FST和ROD在B. napus地方種(AL表示)A亞基因組和AA之間,及在C亞基因組和B. napus地方種(CL表示)和CA之間比較基因組變異,在B. napus地方種和其祖先種中共有的變異中鑒定了FSI-受選擇信號,利用甘藍型油菜地方種作為衍生組,祖先種作為對照組。通過比較B.napus地方種和改良品種(n = 95, registration date after 2000)及不同生態類型的栽培種比較,鑒定SSI-受選擇信號。

從AA到AL,核苷酸多態性(π)從7.23×10?4降到5.40×10?4,從CA到CL,核苷酸多態性(π)從7.45×10?4降到4.97×10?4,暗示了在FSI過程中,在甘藍型油菜(B. napus)中遺傳多樣性丟失,且遺傳多樣性的丟失在C亞基因組中要強于A亞基因組,FST?(AL/AA)=0.136,低于FST (CL/CA)?=0.246。值得注意的是,FST?(AL/AA)FST (CL/CA)?均高于FST(improved cultivar/landrace )?(0.016),暗示了SSI過程與FSI過程相比,發生了更少的遺傳分化,這種差異很可能歸因于甘藍型油菜育種史上最值得注意的事件:即廣泛使用不含芥酸的品種?Liho和低硫代葡萄糖苷品種Bronowski去培育零芥酸低硫代葡萄糖苷栽培種。

通過FST和ROD的z值轉換的計算檢測了424和366共有FSI-選擇窗口,在A亞基因組和C亞基因組上分別對應了66個和44個受選擇信號,在離群區域中,研究人員分別檢索了AL中的1,522個基因和CL中的811個基因。GO富集分析中揭示了FST和ROD在A亞基因上重疊的區域受選擇基因主要在GO中富集在三個類群中,主要包括抗逆性[對食草動物的反應(GO:0080027),脫落酸代謝過程(GO:0009687)和免疫調控反應(GO:0050776)],生長發育[腋芽分生組織起始(GO:0090506)和分省組織起始(GO:0010014)]和代謝途徑[不飽和脂肪酸生物合成過程(GO:0006636),甘油三酯生物合成過程(GO:0019432)和萜類代謝過程(GO:0006721)],而像光形態形成(GO:0009640),毛狀體形態發生(GO:0010090),細胞增殖的調節(GO:0042127)和花絮的發育(GO:0010229)這些發育過程在C亞基因中過度表達。這些結果表明,A亞基因組特異性的選擇可能促進了甘藍型油菜FSI過程中耐受性和含油量的積累,而其發育特性的改善可能是由于C亞基因組中的不對稱選擇。關于SSI-受選擇信號,研究人員通過FST?, ROD, XP-CLR和XP-EHH中至少3種方法,同時鑒定了912個受選擇位點(對應于跨越16.35 Mb區間內的79個受選擇信號)(圖4a,d)。在重疊區域鑒定的2610個基因在韌皮部硫代葡萄糖苷運輸(GO:1901349)和硫代葡萄糖苷生物合成過程中(GO:0019761)過量表達——代表的相應關鍵基因的沉默將導致優質甘藍型油菜種子硫代葡萄糖苷含量減少;這些基因富集到蔗糖轉運(GO:0015770),RNA剪切(GO:0008380)和授粉(GO:0009856)等途徑,暗示了在育種過程中除了種子質量外,還有育性,能源利用率及轉錄調控進行了改善。此外在雙高(高芥酸和硫代葡萄糖苷)和雙低(低芥酸和芥子油苷)栽培種中的84個受選擇信號在1417個重疊窗口合并,并具有與SSI相似的GO富集路徑。研究人員進一步確定了甘藍型油菜(B. napus)生殖系統的的優化,受選擇區的基因同時也富集到生殖過程(GO:0022414),生殖結構發育(GO:0048608)和次生枝條形成的調節(GO:2000032)這些功能。此外,參與硫代葡萄糖苷轉運和脂肪酸延伸的候選基因位于A和C亞基因組的共線性區域內,這意味著平行的亞基因組選擇可能有助于提高種子質量。

4)全基因組關聯分析研究(Genome-wide association studies)

為了鑒定與11個農藝性狀相關的候選基因,研究人員利用了多位點隨機混合線性模型mrMLM v1.3進行全基因組關聯分析研究(genome-wide association studies)。為了獲得高質量的SNPs,研究人員對Bna SNP集合進行了估算,保留了670,028個SNP,MAF> 5%,用于后續的GWAS分析。通過19個樣品多態性核苷酸和Sanger測序結果的評估比較,表明98.74%的推算基因型是正確的,20份種質的兩個生物學重復推算的與真實的基因型的平均系數(r2)為0.956,最小值和最大值范圍從0.928到0.967,進一步證實推算的基因型的準確性。最終共計鑒定了與10個目標性狀顯著相關的60個位點,其中5個與種子產量相關,3個與長角果長度相關,4個與油脂含量相關,48個與種子質量相關(圖4c),此外,3個位點在閾值范圍內顯示與開花時間相關,與種子質量性狀顯著相關的SNPs解釋了14.30%?到35.47%的表型變異,高于種子產量(16.81%)和含油量(20.64%),此外,本研究中還檢測到與先前的GWAS研究中與種子質量相關的大部分基因座。由于與油含量和產量的相關性狀是復雜的并容易受到環境變化影響,研究人員將本研究中重要的基因座位與前期研究的QTLs位點進行了整合。因此,在受選擇區與QTLs定位區域內,基于功能注釋和轉錄組分析控制不同性狀的候選基因被鑒定,如下分析。

5)轉錄組分析(Transcriptome analysis)

為了鑒定SSI-相關基因的差異表達,研究人員收獲了11個組織,從高油含量、雙低栽培種Zhongshuang11和低油含量、雙高栽培種Zhongyou821中選取了11個組織,過濾后,獲得了848,776,815個125-bp paired-end reads,包含212.19 Gb數據量,平均82.64%?的測序reads唯一比對到甘藍型油菜(B. napus)的參考基因組上,在開花期(Se45D)后45天,在種子中檢測到了最高數量的差異表達基因(DEGs),其中包括其9,962個上調表達和12,441個下調表達基因,最低數量的差異表達基因組(DEG)發生在Se14D,僅有2,420 265個基因差異表達。

在Zhongshuang11開花后的的7天(SP7D),10天(SP7D)和14(SP7D)天,在莖(St),葉(Le)和長角果皮中下調表達的基因在芥子油苷生物合成過程中顯著過量表達(GO:0019761),表明在雙低品種中的低種子硫代葡萄糖苷含量可能是由硫代葡萄糖苷生物合成減少引起的。在長角果皮中,上調表達的基因在脂肪酸生物合成過程中顯著過度富集,暗示著長角果皮也可能在增加種子油分含量中起重要作用。

6)甘藍型油菜FSI期間環境適應性主要基因

在FSI時期,防御反應基因在甘藍型油菜環境適應過程中起到了關鍵作用,在A亞基因組上,研究人員分別鑒定了6個,5個,6個和14個與耐旱性,食草動物抗性,對機械刺激的反應和免疫反應相關基因。在這些與耐旱相關基因中,NCED3?(Bra001552)基因在調節ABA(脫落酸)生物合成中起主要作用,以進一步響應水分缺失,除此之外,NCED3一起參與了ABA的產生,從而影響植物生長和水分脅迫耐受性;在干旱期間,內源性ABA快速生產,誘導氣孔關閉,從而提高耐旱性,在A亞基因組ABA生物合成途徑相關基因可能在甘藍型油菜FSI過程中提高其干旱耐受性發揮一定的作用,為其在多樣化的環境中的培育奠定了堅實的基礎。其余參與ABA代謝調控的候選基因也同樣值得關注,例如CYP707A3Bra021965Bra025083),XERICO?(Bra013211)和?PHYBBra001650),所有這些基因都通過ABA的調節積累,與甘藍型油菜相應耐旱機制相關。

此外,在甘藍型油菜FSI過程中,A亞基因組的特異性選擇有助于提高其抗病性,在受選擇的區域,NPR3?(Bra025093)是一個值得關注的基因,作為植物免疫信號水楊酸的受體,NPR3控制蛋白酶體介導的NPR1降解,其涉及對細菌和卵菌病原體的防御反應的負調節;類似的防御反應基因,BAH1(Bra032581),NHL25?(Bra028103)和NDR1?(Bra035766)也同樣參與了植物對微生物的先天免疫,進一步對甘藍型油菜FSI過程中響應生物脅迫具有重要作用。

7)提高種子質量的主要基因

在甘藍型油菜中,種子油分包含50%的芥酸和高水平的硫代葡萄糖苷,顯著降低了其營養價值,GWAS相關結果(圖4c,f)獲得了與種子芥酸和硫代葡萄糖苷含量相關的幾個候選基因。芥子油苷在蓮座葉和長角果壁中合成,隨后在轉運蛋白的作用下,通過韌皮部重新定位到胚胎,研究人員鑒定了硫代葡萄糖苷特異性轉運蛋白GTR2,其可能負責將硫代葡萄糖苷從源組織遞送到甘藍型油菜中的種子中,在8個Bna.GTR2基因中,3個基因(BnaC02g42280DBnaA09g06180DBnaA09g06190D)在雙低栽培種的種子中沉默(圖c,f);其中又有3個基因(BnaA02g33530DBnaC02g42260DBnaC09g05810D)定位到主效QTL區域中,通過沉默這5種GTR2基因,尤其是位于主效QTL區域內的基因,可以進一步減少甘藍型油菜種子中的抗營養芥子油苷含量。在SSI期間,鑒定了4個GWAS信號與芥酸相關,包括在活躍的FATTY ACID ELONGASE 1?(FAE1)?基因[其產品控制芥酸油酰輔酶A(C18:1-CoA)合成]附近,坐落在A08?(BnaA08g11130D)和C03(BnaC03g65980D)兩條染色體上的2個位點(圖4)。這兩個基因在芥酸品種中高量表達,表明FAE1沉默是減少種子芥酸含量的重要因素;與芥酸相關的額外的GWAS信號坐落在C02和C07染色體上(圖4),在AMP-DS?(BnaC02g42510D)和ATGLL?(BnaC07g30920D)附近,其可能代表SSI受選擇基因,其產物減少了種子中芥酸含量。

圖4??甘藍型油菜SSI期全基因組關聯分析與受選擇區域的注釋

8)甘藍型油菜與生態型相關基因的改良

根據春化需求,甘藍型油菜分為冬季(需要長時間冷期),半冬季(需要短期冷期)和春季(無需冷期)共計3種生態型,最原始的甘藍型油菜是冬季油籽型,春季型和半冬季型以適應不同的環境而發展起來。為了鑒定不同生態型下的候選基因,研究人員利用冬季型油菜作為對照,春季型和半冬季生態型作為衍生群體(圖5a),在冬季型和半冬季型及冬季型和春季型油菜受選擇區域,分別檢測到1,996和1,117個重疊窗口,包括156個選擇區域中的4,548個基因和107個選擇區域中的2,729個基因,其最主要的受選擇區域坐落在C亞基因組上,只有32和21個受選擇區域分布在A亞基因組上,表明生態型改善主要是由不對稱的亞基因組選擇引起的。此外,對應于72個受選擇區域的844個離群窗口在兩種生態型改良分析中重疊,這些平行選擇信號可能有助于甘藍型油菜的局部適應。生態型改良選擇區域的相關基因在維持花器官特征(GO:0048497),花器官脫落(GO:0010227)和花分生組織生長的調節(GO:0010080)等相關途徑中具有高度代表性,暗示SSI選擇信號可能對甘藍型油菜地方環境適應性至關重要。

研究人員在FLOR-ID(FLOweRing Interactive Database)中檢索到了306個基因與擬南芥開花時間相關,在甘藍型油菜中鑒定了1,225個直系同源基因。在兩組比對中,24?個開花時間相關基因同時坐落在受選擇區域中(圖5a,c),其中22個分布在C亞基因組上,主要通過春化和光周期途徑調節開花時間。特別地,FLC基因座及其染色質介導的調節原件將是調控甘藍型油菜開花時間的最有希望的靶標。

在春化途徑中,FLC?(BnaC02g00490D)?編碼甘藍型油菜生態型改良的核心調控因子(圖5c),由于同源擬南芥FLOWERING LOCUS CFLC)的產物是開花過渡期的重要阻遏物。最近的一項研究報道指出,不同的FLC旁系同源物對甘藍型油菜開花時間的自然變異有不同的貢獻,并且BnFLC.A2中的2.833-kb插入及其與BnFLC.C2的同源交換(HE)產生了早期開花的甘藍型油菜生態型。通過GWAS研究結果顯示,檢測到了3個基因座位與開花時間相關(圖5b),有意思的是,在染色體A02和C02上的兩個FLC基因,位于2個LD blocks內(hFT-1hFT-2),控制了開花時間的變異,解釋了總計表型變異的~8%,這些結果進一步證實了生態型改良過程中FLC的重要性。通過調節FLC的表達,參與染色質修飾的基因也經歷了生態型改良的廣泛選擇(圖5a,c),例如FLC激活基因SSRP1BnaC02g37430D),編碼促進染色質轉錄(FACT)復合物的組分,和FLC阻遏基因VRN2BnaC01g21540D),編碼多梳抑制復合物2(PRC2)的組分。

在擬南芥中,FACT復合物中的組蛋白伴侶SSRP1有助于RNA聚合酶II的合成并促進FLC表達。相比之下,VRN2通過調節FLC基因座上H3K27me3和H3K9me3抑制標記的沉積,在春化后維持FLC的轉錄抑制中起關鍵作用。這些結果表明表觀遺傳變異,特別是涉及調控FLC表達的組蛋白修飾,與甘藍型油菜的開花時間密切相關。因此,這些基因代表了未來甘藍型油菜育種計劃中有潛力的調控目標。

圖5? 受選擇生態型改良甘藍型油菜開花期調控概述

9)油籽油份含量與油籽產量相關的主要基因

種子的油份含量在甘藍型油菜FSI期間就可能得到了顯著的改善。針對油份含量,研究人員檢測到了9個與QTLs區域重疊的FSI受選擇區域,在這些重疊的區域中,2個基因參與脂肪酸合成,1個基因參與三酰基甘油生物合成,7個基因參與脂肪酸延伸。例如,染色體A02上的(KASI)編碼可能對脂肪酸合成至關重要的蛋白質,并且還在葉綠體裂解和胚胎發育中起作用。擬南芥的KASI突變體破壞胚胎發育并顯著降低種子中的脂肪酸水平,Bna.FATA1BnaA03g37700D)是擬南芥FATA ACYL-ACP THIOESTERASE 1的同源基因,其產物通過水解酰基-ACP復合物控制末端脂肪酸合成的終止,兩個擬南芥FATA基因的突變降低了FATA活性,影響油含量和種子脂肪酸組成。

甘藍型油菜種子產量受長角果長度和枝條分枝的影響,研究人員檢測到三個與長角果長度顯著相關的基因座,顯著的SNP-性狀關聯的峰值位于染色體A09上27.99 Mb,在ARF18附近的165 bp缺失,與種子重量和長角果長度增加相關;研究人員在雙低甘藍型油菜栽培種中鑒定了兩對平行的SSI選擇信號,擬南芥BRC1在染色體A08和C01上的直系同源基因以及DOF4.4在染色體A08和C03上的直系同源基因可能是編碼甘藍型油菜芽分枝和長角果發育的關鍵調控因子。因此,SSI選擇信號中與種子油含量和種子產量相關的基因以及GWAS鑒定的候選基因在甘藍型油菜育種中具有實際應用,以獲得高產量和含油量的品種。

總結

本研究為油菜的起源和改良歷史提供了非常重要的資源,同時有助于挖掘重要農藝復雜性狀的遺傳基礎,其中和有利突變,選擇信號和候選基因相關的顯著SNP在異源多倍體油菜及其親屬的產量、種子質量、含油量和適應性上提供了豐富的寶貴資源。

小編寄語

如果您的項目有任何問題,歡迎點擊下方按鈕聯系我們,我們將免費為您設計文章方案。

最近文章
网络棋牌看牌器 幸运飞艇五六码规律走势技巧 体育彩票飞鱼漏洞 竞彩足球胜分差 福建时时现场直播 河北河北快三走势图 重庆时时五星走势图乐彩 吉林时时在哪购买 2o19年最的特马网站 赛车娱乐城 上海时时结杲 3d试机号后预测汇总牛材网 七星彩计划师 青海快3开奖l结果 今日3d福利彩报 诚信28app 中国围棋排名