De novo測序即在不依賴參考基因組的情況下對某物種基因組進行從頭測序、拼接和組裝,從而獲得全基因組單堿基精度序列圖譜。全基因組序列圖譜完成后,可以構建該物種的基因組數(shù)據(jù)庫;為該物種的后基因組學研究搭建平臺;為后續(xù)的基因挖掘、功能驗證提供DNA序列信息。
產(chǎn)品類型 | 測序策略 | 推薦數(shù)據(jù)量 | 周 期 |
動植物基因組de novo | 二/三代平臺 | 簡單基因組:survey(100X PE150),草圖(HiFi:20-35X),Hi-C輔助組裝(100X),注釋(推薦Iso-seq 50G subreads); 復雜基因組:survey(100X PE150),草圖(HiFi≥30X),Hi-C輔助組裝(100X),注釋(推薦Iso-seq 50G subreads)。 | 基因組草圖組裝最快8自然日,組裝+注釋+進化最快50自然日(視基因組復雜程度而定)。 |
產(chǎn)品類型 | 送樣要求 |
基因組survey(二代平臺) | 樣品類型:基因組DNA樣品 樣品需求量:小片段文庫≥0.2 μg 樣品濃度:≥5 ng/μl 樣品純度:OD260/280=1.8-2.2、OD260/230=0.8-2.5 樣品質量:基因組完整,DNA主帶清晰、無降解、無污染 |
基因組de novo(三代平臺) | DNA總量:HiFi≥6 μg 濃度:≥30 ng/μl 質量:基因組完整性,DNA主帶:HiFi≥30 Kb 純度:OD260/280≥1.5、 OD260/230≥1.2、 QC/NC=0.5-2.0 |
基因組注釋 | 至少6個不同時期或不同部位的樣品,推薦kinnex Iso-seq 3M/GS 數(shù)據(jù)量 |
Hi-C輔助組裝(二代平臺) | 新鮮組織進行甲醛交聯(lián),1個Hi-C文庫至少需要新鮮血液約5 ml或組織1 g,推薦2-3 g組織量 |
注:若提供組織樣品,則植物樣本需為無菌黃化苗、組培樣品或嫩葉;動物樣本為肌肉、血液等脂肪含量較少的組織。盡量選擇同一個體取樣,以減少個體差異性對后續(xù)拼接的影響。如果動物樣本的性別決定模式是XY型,則盡量選擇雌性個體(XX型),如果是ZW型,則盡量選擇雄性個體(ZZ型)。
多組學技術助力油松基因組適應繁殖機制和進化解析
The Chinese pine genome and methylome unveil key features of conifer evolution
期刊:Cell 合作方式:共同作者 影響因子:41.582 發(fā)表時間:2022.01 合作單位:北京林業(yè)大學研究 對象:35年生無性系優(yōu)良油松的新芽
油松,染色體水平基因組,甲基化
針葉樹在世界森林生態(tài)系統(tǒng)中占主導地位,是種植最廣泛的樹種之一。針葉樹基因組屬于大型基因組,存在高度重復序列(70%-80%),因此基因組組裝難度較高。
研究者利用三代測序、Hi-C輔助組裝等技術,組裝獲得了25.4 Gb染色體水平的油松基因組。通過使用來自760個生物樣本的大規(guī)模RNA-seq數(shù)據(jù)來輔助基因結構注釋,揭示油松基因組擴展、生殖過程和適應性進化的多重基因組特征和分子機制。
材料選擇:35年生無性系優(yōu)良油松的新芽
測序策略:
DNA:DNA小片段文庫,103X;三代基因組測序,103X;二代測序,Hi-C文庫
RNA:二代測序,構建RNA文庫
油松基因組研究給針葉樹進化研究提供了新思路,為今后進一步開展針葉樹適應與發(fā)育研究提供了數(shù)據(jù)參考。
研究者首先通過二代測序,對油松基因組大小進行評估,隨后利用三代測序數(shù)據(jù)進行自校正和組裝,成功構建出24.4 Gb(96.1%,12條染色體)的油松高質量的染色體水平基因組。
針葉樹中的基因通常多于二倍體被子植物,基因復制導致了許多基因家族的擴張。在基因復制的不同類別中,油松的旁系同源主要來源于分散重復(DSD),很少來自全基因組復制(WGD),油松發(fā)生近期全基因組復制事件概率較低。
圖1 油松高質量基因組組裝
油松的基因組存在大量的長內(nèi)含子,總內(nèi)含子/外顯子長度與基因組的大小呈正相關,基因表達水平的差異與基因長度和內(nèi)含子數(shù)有關。長基因的RNA剪接和DNA甲基化檢測結果表明,幾乎所有CG和CHG位點都發(fā)生了甲基化,DNA甲基化可能參與了長內(nèi)含子的準確識別。
圖2 油松基因組的基因空間結構和復雜性展示
通過功能富集分析發(fā)現(xiàn)了3,623個顯著擴張的家族基因,主要參與生物和非生物脅迫反應。通過鑒定油松中的轉錄因子(TF)和轉錄調節(jié)因子(TR)家族,發(fā)現(xiàn)對低溫高度敏感的AP2/ERF基因家族成員可能在油松的低溫適應中發(fā)揮關鍵作用。在候選基因編碼酶鑒定中,萜烯合成相關基因在不同年齡的油松中有明顯的表達模式,新形成的針葉可能是萜烯的主要合成部位。
圖3 油松中萜烯的合成途徑
被子植物中具有很多調節(jié)開花的關鍵基因,但油松中缺少很多同源基因。FT/TFL1-like基因是被子植物中調節(jié)開花的關鍵基因,但油松中僅有2個拷貝,但在其他針葉樹中一般有4-6個拷貝。研究者在擬南芥中做了轉基因驗證, 過表達了這兩個基因,轉基因植株表現(xiàn)出明顯的晚開花表型。
通過對油松基因組中12個高表達的MADS-box基因的酵母雙雜交檢測,發(fā)現(xiàn)兩個AGL6-like基因(PtDAL1和PtDAL14)在油松中有不同的表達模式,其中PtDAL14在生殖器官中特異性表達,與其他MADS-box轉錄因子蛋白相互作用,表明AGL6-like基因可能作為MADS-box轉錄因子之間相互作用的橋梁,從而形成互作網(wǎng)絡。最后研究者提出了一個控制油松雌雄球果發(fā)育的模型,為今后針葉樹生殖發(fā)育研究提供了一張藍圖。
圖4 油松中12個MADS-box家族轉錄因子的表達及蛋白互作模型
從染色體層面看,基因組甲基化水平與油松的TE覆蓋率顯著相關,研究發(fā)現(xiàn)攜帶TE的基因區(qū)域的平均甲基化水平遠高于不攜帶TE的基因區(qū)域,但TSS和TES區(qū)域的平均甲基化水平始終較低。DNA甲基化對于TE基因組的擴張產(chǎn)生了影響,但未有證據(jù)表明,油松甲基化程度隨樹齡的增加而下降。LTR-RTs代表了大部分TEs,不平等重組(UR)是植物中一種重要的LTR-RT清除機制,針葉樹的UR率可能比被子植物小型基因組低得多,SGS3-RDR6-RdDM通路可能是針葉樹中主要的DNA甲基化途徑。
圖5 油松中DNA甲基化及轉座子擴張
研究者構建了當前大型基因組中連續(xù)性最好的高質量染色體水平的油松基因組。研究發(fā)現(xiàn)轉座子的不斷擴張和緩慢清除是導致針葉樹基因組巨大的重要原因,具有超長內(nèi)含子的大基因往往表達水平較高。與被子植物相比,油松具有獨特的生殖系統(tǒng)。油松基因組的構建為其獨特適應性和發(fā)育研究、生殖生物學研究及基因組輔助育種進化和基因組學研究提供了重要參考。
Niu S.H., Li J., Bo W.H., et al.The Chinese pine genome and methylome unveil key features of conifer evolution. Cell, 2022, 185(1):1-14.