如何把kegg数据库的hsa系列id转为基因名字呢

如何把kegg数据库的hsa系列id转为基因名字呢,第1张

首先我问了一下chatGPT关于kegg数据库的hsa系统介绍:

KEGG (Kyoto Encyclopedia of Genes and Genomes) 是一个集成了基因组、代谢组和信号传导通路等多种生物信息学数据和分析工具的综合性数据库。KEGG数据库的hsa系统是其中的一个分支,专注于人类基因组和蛋白质组的信息整合、注释和分析。下面是hsa系统的一些主要特点:

基因信息:hsa系统提供了关于人类基因的详细信息,包括基因名称、别名、序列、染色体位置、功能注释等。这些信息可通过多种途径进行查询和访问,如基因搜索、染色体浏览、KEGG PATHWAY等。代谢通路:hsa系统包含了大量的代谢通路信息,可用于研究代谢通路中基因、蛋白质、代谢产物之间的关系以及代谢通路在生理、疾病等方面的作用。hsa系统中的代谢通路可通过KEGG PATHWAY进行浏览和查询。疾病信息:hsa系统还提供了关于人类疾病的信息,包括疾病名称、分类、症状、基因、代谢通路等方面的信息。这些信息可用于研究基因与疾病之间的关系,以及发现潜在的药物靶点等。蛋白质信息:hsa系统也包含了大量的蛋白质信息,包括蛋白质名称、序列、功能、亚细胞定位等。这些信息可用于研究蛋白质的结构与功能,以及蛋白质在代谢通路中的作用。工具与资源:除了上述信息之外,hsa系统还提供了一系列的生物信息学工具和资源,如BLAST搜索、KEGG Mapper、KEGG Orthology等。这些工具和资源可用于研究基因、蛋白质和代谢通路等方面的生物学问题。

总之,KEGG数据库的hsa系统为研究人类基因组和蛋白质组提供了一个非常有价值的资源和工具,广泛应用于生物医学研究、药物研发等领域。

目前(2023-04-03)在 /list/pathway/hsa 可以看到全部的人类的通路,比如:

hsa01100 Metabolic pathways - Homo sapiens (human)
hsa01200 Carbon metabolism - Homo sapiens (human)
hsa01210 2-Oxocarboxylic acid metabolism - Homo sapiens (human)
hsa01212 Fatty acid metabolism - Homo sapiens (human)

目前(2023-04-03)在  /link/hsa/pathway 可以看到全部的人类的通路以及它对应的基因的hsa系列id,比如:

path:hsa00010 hsa:10327
path:hsa00010 hsa:124
path:hsa00010 hsa:125
path:hsa00010 hsa:126
path:hsa00010 hsa:127

这样就有一点尴尬,因为人类的通路我们可以容忍它是kegg数据库的id,但是人类的基因我们不需要 hsa:127这样的东西,也很难理解,关于这些id的定义当然了看kegg的官网即可;

如何把kegg数据库的hsa系列id转为基因名字呢,第2张 

比如:/dbget-bin/www_bget?hsa:230 就可以看到这个基因的很详细的信息:

ALDOC, ALDC 
(RefSeq) aldolase, fructose-bisphosphate C

NCBI-GeneID: 230
NCBI-ProteinID: NP_005156
OMIM: 103870
HGNC: 418
Ensembl: ENSG00000109107
Pharos: P09972(Tbio)
UniProt: P09972 A0A024QZ64

那么就需要一个转换,如何把kegg数据库的hsa系列id转为基因名字呢,我继续询问chatGPT,这次它给了我一个略有瑕疵的代码:

如何把kegg数据库的hsa系列id转为基因名字呢,第3张

略有瑕疵的代码

如果有r基础,很容易修改成功:

library(KEGGREST)

# example list of hsa IDs
hsa_ids  - c("hsa:10458", "hsa:23545", "hsa:10157")

# retrieve information about the genes
gene_info  - keggGet( hsa_ids )

# extract the gene names from the information
gene_names  - sapply(gene_info, function(x) x$NAME)

# print the gene names
print(gene_names) 

所以,接下来只需要去   /link/hsa/pathway  拿到人类的全部的基因的hsa格式的id,然后使用  keggGet 函数即可批量转换啦。

DABAN RP主题是一个优秀的主题,极致后台体验,无插件,集成会员系统
白度搜_经验知识百科全书 » 如何把kegg数据库的hsa系列id转为基因名字呢

0条评论

发表评论

提供最优质的资源集合

立即查看 了解详情