基因ID转换

写在前面的话:

基因ID在不同的生信软件和数据库中有不同的命名规则。因此,将基因ID进行转换是必备的生信技能。此文章主要介绍几个常用的基因ID转换网站及R包转换工具

BioMart工具

BioMart 是 Ensembl 网站提供的一个 web 工具。他的主要功能是进行基因功能的注释和跨数据库注释,还有就是基因ID的转换。

选择数据库和数据集

第一步.png

第二步.png

输入ID类型及基因集

限制一次500个ID转换

第三步.png

第四步.png

选择输出基因ID类型

第五步.png

注:查看数据基因ID信息

第六步.png

输出结果

第七步.png

BioDBnet

biological DataBase network,一个集成了大量生物数据库的应用程序,比如Gene, UniProt, Ensembl, GO等,由ABCC进行维护。它实际上包括多个应用程序,如dbWork,dbFind等。主要功能包括基因ID转换,基因功能注释,基因信息查找,还可以将基因ID转换成其他物种的同源基因ID等。

选择输入和输出ID类型

1.png

输入物种Taxon ID

2.png

3.png

输入数据集并提交结果

4.png

结果查看

5.png

BioDBnet其他工具

dbWalk

适用于需要转换为多种ID类型

6.png

7.png

dbFind

自动识别输入的基因ID类型,并转换为统一ID类型

8.png

9.png

DAVID

打开官网,选择基因ID转换工具

Screenshot 2023-06-18 at 01.55.47.png

上传基因List

Screenshot 2023-06-18 at 01.57.47.png

填写选项

David ID.png

结果查看

Screenshot 2023-06-18 at 02.04.12.png

Uniprot

选择ID mapping

uniprot基因转化1.png

根据需求输入信息

uniprot基因转化2.png

选择Reviewed

uniprot基因转化3.png

结果查看和下载

uniprot基因转化4.png

使用R包进行转换


1
2
3
4
5
6
7
library("clusterProfiler") 
library("org.Bt.eg.db") # 根据物种选择不同的物种基因注释包

gene_name <- bitr(sig_rna$ENSEMBLTRANS, # 输入数据集
fromType = "ENSEMBLTRANS", # 输入ID类型
toType = c("SYMBOL"), # 输出ID类型
OrgDb = org.Bt.eg.db) # 物种ID数据包


1
keytypes(org.Bt.eg.db)

[1] “ACCNUM” “ALIAS” “ENSEMBL”
[4] “ENSEMBLPROT” “ENSEMBLTRANS” “ENTREZID”
[7] “ENZYME” “EVIDENCE” “EVIDENCEALL”
[10] “GENENAME” “GENETYPE” “GO”
[13] “GOALL” “IPI” “ONTOLOGY”
[16] “ONTOLOGYALL” “PATH” “PFAM”
[19] “PMID” “PROSITE” “REFSEQ”
[22] “SYMBOL” “UNIPROT”