一文帶你get Hi-C研究套路

背景介紹

DNA在染色體上是高度折疊的,DNA與DNA片段之間不可避免的形成了高強度的交互作用。2002年提出的3C技術,用于測定染色體特定位點與位點之間的交互作用,隨后發展出4C、5C 技術,分別用于測定染色體上一點到多點和多點與多點之間的交互作用。Job Dekker在2009年開發出Hi-C 技術,實現了全基因組范圍內染色體片段間相互作用的捕獲。Hi-C 除了用于輔助基因組組裝、對已組裝的基因組進行糾錯,還可以揭示基因組的三維結構特征,包括從隔室(A/B Compartments)到拓撲相關結構域(TAD),最后到染色體環(loop),目前,已在人、果蠅、酵母、擬南芥、水稻和棉花等物種成功構建基因組三維結構,并完成了對不同樣本基因組三維結構的比較分析。

1.Hi-C三維構象研究內容

1)繪制全基因組的Hi-C map、Cis/Trans和IDEs等分析;
2)Compartment A/B 鑒定與分析,包括與ChIP-seq、WGBS和RNAseq等聯合分析;
3)TAD鑒定與分析,包括與ChIP-seq、WGBS和RNAseq等聯合分析;
4)繪制全基因組LOOP模型圖,需DNase-seq或ATAC-seq,并與ChIP-seq和RNAseq聯合分析;
5)多樣本三維結構差異分析,包括Compartment A/B、TAD和Loop差異鑒定與分析;
6)基因/重復序列互作分析,包括與RNAseq聯合分析。

圖1 染色體不同層級三維構象圖
(Fraser J, et al, 2015)

2.染色體三維結構重點研究內容

A/B compartments

高等動植物基因組可以人為劃分為兩個compartments,稱作A/B compartments,通過計算PCA,第一主成分中正值表示A compartment,負值表示B compartment。A/B compartments在基因組中一般呈間隔分布,A compartments呈松散染色質狀態,基因密度高,屬于轉錄活躍區域,而B compartments則呈壓縮染色質狀態,基因密度低,屬于轉錄抑制區域。通過對多個樣本A/B compartments 的分布進行對比,在全基因組水平找出A/B compartments保守的區域以及發生A/B compartments轉換的區域,結合RNA-Seq對發生A/B compartments轉換區域內的基因的表達量進行統計,有助于解釋不同樣本間的差異與染色質活性狀態之間的關系。如圖2:

圖2 人正常細胞和癌癥細胞A/B compartments
(Wu P, et al, 2017)

例如在人的多發性骨髓瘤文章中,作者利用正常B細胞(GM12878)和兩種亞型的骨髓瘤細胞(近二倍體U266和近三倍體RPMI-8226)進行Hi-C、WGS和RNA-seq測序,結果發現,相比于GM12878,U266和RPMI-8226癌癥細胞中6%的區域均存在B轉換到A,1%的區域均存在A轉換到B,結合RNA-seq數據,發現B轉換到A區域內的基因變成轉錄活躍狀態,而A轉換到B區域內的基因變成轉錄抑制狀態,KEGG富集通路發現這些基因與多發性骨髓瘤相關,主要涉及MAPK信號轉導途徑、TNF信號轉導途徑、細胞因子和細胞因子受體相互作用途徑等,進一步在染色體2q11.2-q12.142處發現一個細胞因子基因簇,幾種白細胞介素IL1R1,IL1R2,IL18R1和細胞因子MAP4K4下調表達,這些基因在后續研究中重點關注。

?TAD?

TAD(拓撲關聯結構域)是一個高度自關聯的連續區域,通過明顯的邊界與相鄰區域分離開來,形成一個獨立的調控單元,內部的基因擁有共同的調控元件,存在協同表達特征。TAD邊界通常具有大量的絕緣子蛋白和黏連蛋白(植物中TAD邊界一般缺少絕緣蛋白,邊界不明顯),對于維持TAD結構及穩定性具有重要作用,不但可以指導染色體折疊成高級結構,還可以正確指導遠距離轉錄調控,該邊界發生變化會導致基因調控變得紊亂。TAD邊界還與組蛋白修飾、甲基化修飾等密切相關,通常與轉錄活性相關的表觀遺傳標記富集在TAD邊界,而與轉錄失活相關的表觀遺傳標記遠離TAD邊界。通過對多個樣本TAD進行對比,在全基因組水平找出發生變化的TAD(重點關注TAD邊界),結合ChIP-seq、WGBS等分析TAD的變化是否與表觀遺傳修飾相關,進一步利用RNA-Seq對相關基因的表達量進行統計,有助于解釋不同樣本間空間結構的差異與表觀遺傳修飾及轉錄調控之間的關系。如圖3:

圖3 不同種棉花TAD邊界及表觀遺傳修飾
(Wang M, et al, 2018)

例如,在棉花的三維基因組進化文章中,作者對二倍體雷蒙德氏棉、二倍體亞洲棉、四倍體陸地棉和四倍體海島棉構建了三維基因組圖譜,與雷蒙德氏棉D03染色體相比,陸地棉和海島棉對應的D亞基因組中發生了染色質重排,虛線對應的TAD結構發生了變化,雷蒙德氏棉中該TAD結構完整,存在明顯的邊界,陸地棉中該邊界發生了左移,而海島棉中該TAD趨向于消失。因而通過鑒定TAD發生變化區域的基因,可以研究多倍化過程中基因表達調控的改變(研究多倍體的老師們,這可是一個很好的套路文章哦)。同時結合ChIP-seq數據對該TAD邊界進行分析發現,雷蒙德氏棉富含豐富的H3K4me3(活性染色質標記),而陸地棉和海島棉中H3K4me3顯著減少,說明在棉花的多倍化與表觀遺傳修飾存在密切關聯。

Loop?

Loop(染色質環)將線性距離很遠的位點拉至空間距離很近,在Hi-C圖譜中表現為峰值位點(peak loci),該peak位點通常一端為啟動子,另一端為增強子,Loop將啟動子和增強子拉至空間很近的距離,從而調控基因的表達,存在這種loop(啟動子-增強子環)相關基因的表達量將幾倍甚至幾十倍的增加。loop通常與DNAase-seq或者ATAC-seq結合使用(特異性識別啟動子),從而鑒定啟動子-增強子環。通過對多個樣本Loop進行對比,在全基因組水平找出發生變化的Loop,結RNA-Seq對相關基因的表達量進行統計,有助于解釋不同樣本間loop及基因轉錄調控之間的關系。如圖4:

圖4 人不同細胞loop(Rao S S.P. , et al, 2014)

例如,在人的loop文章中,作者在GM12878細胞系發現9448個loop,其中2854個loop與已知的啟動子-增強子作用相關,基因的啟動子存在loop比不存在loop時的表達量顯著增加。GM12878細胞系中存在一個Loop,這個Loop連接了SELL啟動子和一個遠端增強子SELP,基因開啟轉錄,表達量增加,而IMR90細胞系中沒有這個Loop,基因不表達。

3百邁客Hi-C研究優勢

百邁客自2016年初以來,利用Hi-C技術進行染色體水平的基因組組裝及染色體三維構象的研究,成功開發出六堿基、四堿基酶切方案,組裝、互作輕松拿下。在植物Hi-C領域,更是邁進了一大步,在同行還只能處理植物活體樣本的時候,我們已經可以輕松“駕馭”離體枝條,感覺一大波離體枝條在向小編招手~

迄今為止,保持著近100%的建庫成功率,積累了大量植物、動物(哺乳動物、昆蟲、水生動物等)、微生物等的項目經驗。植物一次建庫成功率在97%以上,很多物種對應文庫的Valid Interaction Pairs(%)值在80%以上,最高達92.61%;動物樣品文庫的Valid Interaction Pairs(%)平均值在60%,最高達86.68%;真菌樣品文庫的Valid Interaction Pairs(%)平均值在72%,最高達84.6%。2018,百邁客Hi-C服務平臺將繼續為您的科學研究保駕護航!

參考文獻
1.Fraser J, Williamson L, Bickmore W A. et al. An Overview of Genome Organization and How We Got There: from FISH to Hi-C. Microbiology and Molecular Biology Reviews, 2015.
2.Wu P, Li T, Li R, et al.3D genome of multiple myeloma reveals spatial genome disorganization associated with copy number variations. Nature communication, 2017.
3.Wang M, Wang P, Lin M, et al.Evolutionary dynamics of 3D genome architecture following polyploidization in cotton. Nature plants, 2018.
4.Rao S S.P. , Huntley M H., Durand N C., et al.A 3D Map of the Human Genome at Kilobase Resolution Reveals Principles of Chromatin Looping. Cell, 2014.5他

最近文章
网络棋牌看牌器 浙江快乐时时号码 曾道免费资料开奖结果人 辽宁省快乐十二前三直选遗漏 幸运飞艇冠军稳赚 天津十分开奖走势 十一运夺金开奖最多的号码 广西快3走势图带连线 内蒙古时时开奖结果查询 北京赛网 足彩胜负平规则 天津十一选五爱乐彩 7乐彩预测号码 青海快三走势图31期 浙江快乐十二爱乐彩 江苏时时计划软件 3分时时计划在线