我有一個感興趣的基因,我想在同系物之間進行比較。如何從門上已知的編碼序列中找到一個基因?然後,我想我可以進行Clustal序列比對,看看序列如何匹配。
我有一個感興趣的基因,我想在同系物之間進行比較。如何從門上已知的編碼序列中找到一個基因?然後,我想我可以進行Clustal序列比對,看看序列如何匹配。
有各種同源物數據庫,例如:
使用現有數據庫的優點是,與簡單的BLAST搜索相比,使用了更複雜的方法來檢測直系同源物(請參閱“ 基因正交論推斷的計算方法””進行審核),並且所有內容均已預先計算,因此速度更快。缺點是所有預先計算的方法都需要使用過去基因組的快照,因此並非所有當前可用的基因組都將存在。
如果我足夠了解您的問題,那麼UCSC的基因組瀏覽器是一個不錯的起點。如果您知道該基因的名稱,則可以對其進行搜索。例如,這是人類胰島素受體1的頁面。從那裡您可以比較46個基因組,並進行比對。
也許您想改用NCBI / Homologene。 http://www.ncbi.nlm.nih.gov/homologene
,或者如果您有核苷酸或蛋白質序列,則僅使用psiblast抗NR。
僅加我的5美分,就有一個名為 metaphors的最新數據庫:
MetaPhOrs是一個基於系統發生的正字法和參數學預測的公共存儲庫使用七個流行的同源性預測服務(PhylomeDB,EnsemblCompara,EggNOG,OrthoMCL,COG,真菌Orthogroups和TreeFam)中的可用資源。目前,在MetaPhOrs數據庫中存儲了超過306百萬個獨特的同源蛋白質對。這些預測是從針對829個基因組的705123棵系統樹中獲得的。對於每個預測,MetaPhOrs都會提供描述其優缺點的一致性評分和證據等級,以及樹的數量和到其源數據庫的鏈接。
之所以特別好,是因為:
這是我所知道的唯一一個同源性數據庫,該數據庫提供了有關寄生性與正交性的信息。
它與UniProt名稱鏈接
它為批處理查詢提供了一個很好的python API