- 代謝通路圖繪制,Science/nature文章經典基因篩選思路!
- 2024年07月25日來源:中國網
提要:自我們首次發布MetMap分析以來,已經過去將近9個月的時間啦,那么在這過去的一年時間里面,KEGG有什么新變化呢?MetMap又有哪些變化呢?接下來,我們來給大家仔細盤點一下。
自我們首次發布MetMap分析以來,已經過去將近9個月的時間啦,那么在這過去的一年時間里面,KEGG有什么新變化呢?MetMap又有哪些變化呢?接下來,我們來給大家仔細盤點一下。
本篇文章核心內容如下:
1.KEGG數據庫截止到2024年7月23日數據庫物質增加,植物代謝通路無新增;
2.NCBI上2024年植物代謝通路文章達到6000+篇,但是未登記入KEGG數據庫,使用受限;
3.植物廣泛靶向?代謝組2024年上半年升級完成檢出突破新高,最高檢出達到4000個物質;
4.MetMap通路條數新增30條,目前已累計有60條,物質總數達到2800+,相當于KEGG目前通路物質數的43.7%,是KEGG數據庫2023-2024年一年新增的11倍以上;
5.MetMap的兩種應用方案獲認可,通路中虛線不用擔憂,可為基因篩選提供思路;
1.KEGG數據庫最新情況分析
截至到7月23日,KEGG在過去的一年內對數據庫內的物質以及通路等均進行了更新,對于更新我們的重點主要放在植物相關通路。對KEGG官方網站上展示出來的更新記錄進行分析,我們發現KEGG在過去一年內數據庫內物質數量增加248個物質,但是在植物代謝通路上沒有新增。
過去一年新增的代謝通路情況如下(KEGG官方更新記錄):
我們可以看到新增的通路主要偏向于人、微生物類型的較多,其中涉及到植物的通路主要是今年6月份更新的兩條,但是這兩條的更新記錄為更名(這里也可以說明,老師如果前后兩次做分析剛好卡在更新的時間節點上,也會出現不同通路名的情況屬于正常情況),而沒有相關通路新增。
2.NCBI植物通路研究文章
我們以關鍵詞“plant pathway”在NCBI上面進行相關文章檢索,在2024年所有涉及到該關鍵詞的文章總共包含6774篇。這些文章中包含綜述、研究性、評論等類型的文章。
從中篩選一篇研究型文章進行分析,研究結果繪制了番茄中生物堿合成的部分通路,我們將通路中的所有物質在KEGG中進行檢索,無法找到任何一個物質的記錄,而這篇文章發表的時間為2023年,這也表明雖然KEGG目前包含了很多通路,但是對于植物通路的記錄比較有限,這也會限制我們拿到代謝組和轉錄組學多組學或單一組學結果的分析。
3.植物廣泛靶向代謝組數據庫和檢出物質數5年更新情況
今年上半年,我們再次完成對植物廣泛靶向?代謝組數據庫的升級,本次數據庫升級至35000+個物質,其中超過33000+種均為次生代謝物。
數據庫的升級必然會伴隨著檢出的增加,利用最新版本的數據庫對不同類型的樣本進行檢測,檢出的物質范圍在1000-4000種,相較于去年,我們的檢出又有了提升;除了檢出以外,在鑒定準確性高的物質數量方面,我們也有了顯著的提升,Level1(檢測準確性90%以上)的物質平均檢出可以達到600+種,最高可以達到900+種。
那么對于每年在數據庫擴大和物質數檢出提升的植物廣靶?來說,目前的KEGG數據庫顯然已經無法滿足物質注釋和通路富集分析的需求了。
4.MetMap通路圖現狀
邁維在2023年10月份首次發布了自主建立的特色分析內容MetMap,在過去的這9個月了,這項工作的升級也一直在進行中。而于7月5日,邁維再次對通路圖進行升級,后續結果交付中老師們會拿到更多的通路圖。本次新增的通路也擴大了物質類型,覆蓋黃酮、萜類、生物堿、香豆素等物質類型,為物種專屬通路的繪制提供了便利。
除了通路圖條數的增加很重要以外,更加重要的是通路上新增物質數的多少,因為如果通路圖條數很多,但是各條通路圖之間的交集也非常多的話,利用起來也是非常有限的,截至到目前為止,MetMap在KEGG現有通路物質的基礎上新增超過2800種物質,占2024年KEGG通路物質數量的比例超過43.7%,是KEGG數據庫2024年新增物質數的11倍以上。
5.MetMap在文章中的應用方式
雖然通路圖千種好,但是不能利用起來就是沒有任何價值的,那么我們如何在分析或文章中利用這個分析內容呢?
1.這張圖的形式與KEGG通路圖較為類似,因此可以直接將這張圖替代原本的KEGG通路圖直接放入文章,然后參照我們之前分享過的關于通路圖的描述方式進行描述即可。
可以達到給文章新增亮點:物質更新穎,通路更新穎。
2.作為我們自己繪圖的模板:將重點關注的物質提取出來,可以極大程度的減少復雜通路的構建工作。
也可以達到物質注釋更多、物質注釋更特異、基因注釋更豐富,一次解決多組學研究三大難題。
老師拿到圖形可能會有點疑問,通路圖上面有存在虛線,這些怎么用?其實我們在文章閱讀的過程中會發現,很多文章的通路圖都同時包括實線和虛線,因為虛線并不代表不具有參考性,虛線的物質推測也非常有助于我們對于參與功能的基因進行篩選。例如,2024年5月11日發表在Nature Communication上面一篇關于茶枝柑中黃酮合成的研究文章中也同樣存在非常多的虛線,而這些虛線則恰恰給了下一步研究的基因篩選思路。
Wen et al. Nat Commun. 2024 May 11;15(1):3991.
那么有的老師可能就會問了,要做這個分析內容,有什么要求嗎?目前我們針對新項目不加收任何費用,在交付數據的同時已經完成此項分析,是不是很心動?邁維基于代謝(Metabolic)和通路(Map)自主創新構建的新一代通路MetMap,歡迎您來咨詢。