武漢xrktw向日葵下载生物科技有限公司
電話:027-87606602(市場部)
027-62431231(行政部)
Q Q : 270105245 465436937
1511879086 812115916
傳真:027-87606602
郵箱:support@celebsonice.com
地址:武漢市東湖高新區高新大道888號高農生物園高農國際1棟
網址:www.celebsonice.com
轉錄因子(Transcription factors,TFs)在控製基因表達中起著關鍵的作用。對TFs的係統性識別和注釋,隨後是TF數據庫的構建,可能充當了研究轉錄因子的功能和進化的有用資源。植物轉錄因子數據庫PlantTFDB(http://planttfdb.cbi.pku.edu.cn),它包含了從165個物種中預測的320370個TFs,並將其分成58個Family。PlantTFDB對每個識別的TF進行了全麵的注釋,包括功能域(functional domains)、三維結構、gene ontology (GO), plant ontology (PO)、表達信息、特殊功能描述、結合motif基序、調控信息、相互作用、參考文獻以及到UniProt、RefSeq、STRING、Entrez等數據庫的交叉鏈接。
PlantTFDB有著小清新綠的簡單友好界麵,可以使用TF ID和常見名稱進行快速搜索,或者直接使用BLAST中的序列進行查詢。下麵xrktw向日葵下载來詳細介紹一下這位重要的植物轉錄因子數據庫。
1、數據庫主頁布局介紹
1) 點擊Home即可跳轉到主頁麵
2) 點擊TFext跳轉到Extended TF repertoires頁麵。TFext展示近期新測序鑒定的TF數據。
3) 點擊Blast跳轉到序列比對頁麵,輸入fasta格式的核苷酸和蛋白序列文件進行比對分析,得到比對結果。
4) 點擊Prediction跳轉到Transcription Factor Prediction頁麵,輸入或者上傳核苷酸和蛋白序列文件進行基於比對分析的轉錄因子預測。
5) 點擊Download跳轉到數據庫下載頁麵,可以下載數據庫156個物種和最近新鑒定的轉錄因子數據信息,包括CDS、蛋白序列、motif。
6) 點擊Help跳轉到幫助頁麵,可以查看一些常見疑問解答。
7) About,是對網站簡單介紹
8) 點擊Links跳轉到鏈接地址頁麵,可以查看其他關聯數據庫地址和工具地址。
9) 點擊PlantRegMap跳轉到植物轉錄調控查詢頁麵,可以查詢模式物種的轉錄調控關係。
10) 精簡搜索,輸入轉錄因子名稱或TF ID即可搜尋得到相關信息。
11) 點擊即可開關下麵的樹狀結構,通過物種查詢相關轉錄因子。
12) 通過58個家族,查詢相關轉錄因子。
2、查詢轉錄因子案例
2.1已知序列
如果你手上有相關序列,想要了解是屬於什麽轉錄因子,點擊Prediction跳轉到轉錄因子預測頁麵,在文本框中輸入fasta格式(fasta 格式:大於號>後緊跟序列名,換行後是序列)的序列(蛋白與核酸序列均可)信息,再點擊Prediction按鈕即可將任務提交給後台運行,如果序列數據不多很快就可以反饋結果,點擊預測出的TF可以查看該轉錄因子的詳細信息。
2.2已知轉錄因子名稱
若要查找已知的轉錄因子名稱,以擬南芥的MYC2為例,你可以直接在主頁麵Search框中輸入即可查詢。
在Search Result下點擊TF ID即可查看詳細信息,包括轉錄因子通用名,蛋白序列信息,3D結構,GO以及PO,還可鏈接到與之相關的其他相關數據庫,還可查看轉錄因子相關文獻,非常便捷。
研究轉錄因子都會涉及到上下遊調控,這個數據庫收錄了調控相關信息如下:
1) 轉錄因子結合的基序
2) 植物轉錄因子調控map中順式作用元件map
3) 在UniProt中對於此轉錄因子調控相關描述
4) 此轉錄因子上下遊調控,資源存儲在PlantRegMap
5) ARTM(擬南芥轉錄調控map)中在上遊調控此轉錄因子,AT1G32640 (R), AT4G25470 (R)兩者均可抑製MYC2
6) ARTM中MYC2下遊調控基因,有激活和抑製的區分
7) 相關調節植物激素:脫落酸、茉莉酸
8) 蛋白-啟動子和蛋白-蛋白相互作用,數據收集自BioGRID、IntAct和BIND。
9) 相關幹擾後錄因子表型描述,
若要查找已知家族轉錄因子,以擬南芥的G2-like轉錄因子家族為例,點擊Home跳轉到主頁,主頁下麵有以TF家族分類的信息(Browse by Family),找到G2-like關鍵詞後點擊跳轉到G2-like家族主頁,該頁麵展示了不同物種中包含有G2-like轉錄因子信息,如果研究的是擬南芥,則找到擬南芥的拉丁文並點擊,即可搜索到擬南芥基因組中所有與G2-like相關的基因信息。點擊基因ID可查詢該基因的詳細信息。
xrk向日葵视频app下污來看一下擬南芥 G2-like Family中轉錄因子的信息:
1) 簡短G2-like Family的鑒定,進化以及相關功能
2) 點擊即可下載擬南芥G2-like Family中所列轉錄因子蛋白序列信息,文件為*.fas。
3) 點擊後跳轉頁麵獲得DNA binding domain (DBD)以及相關蛋白序列比對
4) 點擊即可查看擬南芥G2-like Family根據結構域和蛋白序列構建的進化樹文件
介紹了這個數據庫的簡單操作,那麽生信分析時如何利用這個數據庫挖掘自己數據中的轉錄因子信息呢?
高通量測序分析結果中關於轉錄因子的分析往往會使結果更加豐富,那麽如何通過編程更加高效快捷的利用該數據庫呢?
有生信分析背景的小夥伴可以在linux 服務器上批量分析相關的內容。參考如下:
1轉錄因子鑒定
Linux 服務器上使用軟件 iTAK[1],軟件內部內置了PlantTFDB的數據庫數據,可以直接用於預測植物的轉錄因子。軟件的使用方式非常簡單。隻用輸入你需要鑒定的蛋白質序列的fasta格式即可。
執行命令:Perl /opt/software/iTAK-1.7a/iTAK.pl /nfs2/igenebook/paotong_AJATS2180801003-2_all_data/ATAC/06.GOKEGG/PF_1.genelist.fa
程序運行完成之後會得到如下的一個文件夾
其中tf_classification.txt就是xrk向日葵视频app下污得到的植物轉錄因子預測的結果,如下圖
第一列到第四列分別是蛋白名稱,轉錄因子,TF或者是TR(轉錄調控子),所屬家族.
另外可以對轉錄因子家族進行統計並簡單作圖如下:
2、轉錄因子調控網絡分析
在得到目標的轉錄因子之後,可以根據轉錄因子motif網站 https://agris-knowledgebase.org/downloads.html 提供的motif序列,利用homer[2]軟件對目標序列(peak或者Promoter區域的序列)進行motif分析,得到目標區域的已知轉錄因子motif。然後根據peak或promoter關聯的基因及其注釋篩選出motif結合基因,對這些基因用clusterprofiler 軟件做GO富集分析,最後利用Cytoscape做成網絡互作圖。示例結果如下:
[1] Zheng Y, Jiao C, Sun H, Rosli HG, Pombo MA, Zhang P, Banf M, Dai X, Martin GB, Giovannoni JJ, Zhao PX, Rhee SY, Fei Z (2016) iTAK: a program for genome-wide prediction and classification of plant transcription factors, transcriptional regulators, and protein kinases. Molecular Plant 9:1667-1670.
[2] Heinz S, Benner C, Spann N, Bertolino E et al. Simple Combinations of Lineage-Determining Transcription Factors Prime cis-Regulatory Elements Required for Macrophage and B Cell Identities. Mol Cell 2010 May 28;38(4):576-589
企業名稱:武漢xrk向日葵视频app下污生物科技有限公司
電話:027-87606602(市場部) 027-62431231(行政部)
Q Q : 270105245 1511879086
465436937 812115916
傳真:027-87606602
郵箱:support@celebsonice.com
地址:武漢市東湖高新區高新大道888號高農生物
園高農國際1棟
網址:www.celebsonice.com