近日,上海科技大学iHuman研究所与中国天翼云科技有限公司合作,发布了专注于脊索动物嗅觉受体的数据库——脊索动物嗅觉受体数据库(Chordata Olfactory Receptor Database, CORD),相关文章近期已在Protein & Cell发表。
嗅觉作为脊索动物最古老、最复杂的化学感知系统之一,在动物的生存、繁衍和社交中扮演着至关重要的角色。了解嗅觉受体的结构和功能不仅有助于揭示动物对气味的感知机制,还有助于深入探讨嗅觉与行为之间的复杂关系。
然而,脊索动物嗅觉受体的研究一直面临着一个重要挑战:除少数模式动物外,其他物种的嗅觉受体基因注释差、数据分散、配体信息缺乏统一整理等。针对这些痛点,CORD应运而生。
CORD数据库:汇聚超百万条脊索动物嗅觉受体数据
CORD是全球首个专注于脊索动物嗅觉受体的专业数据库,致力于为研究者提供全面的嗅觉受体数据和分析工具。目前,数据库涵盖了2776个脊索动物物种,共计1176818个嗅觉受体序列,其中包括663380个功能性嗅觉受体基因以及513438个嗅觉受体假基因。物种的广泛覆盖性使得CORD成为嗅觉科学领域的一个重要资源,极大丰富了科学家对脊索动物嗅觉系统的理解。
在数据获取方面,CORD依托iHuman研究所强大的科研实力与中国天翼云科技有限公司的技术支持,全面整合了各类脊索动物的基因组注释信息。研究人员可以在数据库中轻松检索、下载和分析嗅觉受体相关数据,支持多种生物信息学应用场景。
先进功能:赋能科研的多维度探索
CORD的核心优势不仅仅体现在庞大的数据量上,还在于其丰富的功能设计和用户体验优化。数据库引入了多种生物信息学分析工具和可视化功能,帮助研究者深入理解嗅觉受体与气味物质之间的相互作用,并可以将这些信息应用于以嗅觉受体为靶点的药物研发上。
数据库中内置的Genome2OR工具是其一大亮点。这一基于隐马尔可夫模型的工具支持对多个脊索动物基因组进行高效注释,并能快速识别出潜在的嗅觉受体基因,显著提高了基因注释的精度和速度。Genome2OR的升级让研究者可以更快地获取新的嗅觉受体序列,从而加速嗅觉感知机制的探索。
在技术层面,CORD通过采用NebulaGraph图数据库和Elasticsearch搜索引擎技术,大幅提升了数据检索速度和查询效率。科研人员可以通过关键词或序列比对的方式,在庞大的数据集中迅速找到感兴趣的嗅觉受体基因及其关联信息。
除了支持基础的嗅觉感知研究,CORD还为嗅觉相关疾病的研究提供了全新的契机。嗅觉障碍,如嗅觉丧失或嗅觉过敏,往往与神经系统疾病密切相关。通过深入研究不同物种嗅觉受体的结构与功能,科学家们能够更好地理解嗅觉系统的运行机制,进而为嗅觉障碍相关疾病的诊断、治疗与预防提供科学依据。
用户友好:便捷的使用体验
CORD数据库设计注重用户友好性,界面简洁直观、操作简单。用户可以根据需要,自定义数据检索条件,实现快速高效的查询。此外,数据库的可视化分析功能可以将复杂的数据进行图形化展示,为研究人员提供了直观的数据分析工具,帮助他们从不同角度审视嗅觉受体的数据特征,轻松开展深入的生物信息学研究。
未来展望:推动嗅觉研究的持续发展
CORD的发布为脊索动物嗅觉研究带来了前所未有的机遇。随着该数据库不断扩展与优化,未来更多的物种和基因数据将被纳入其中,推动对嗅觉受体的跨物种研究。研究者们可以借助这一平台,深入探究气味分子的感知机制、嗅觉系统的进化过程,以及与嗅觉相关的疾病机理。数据库开发者们诚挚邀请全球的相关科研人员、数据分析专家及生物学爱好者使用CORD数据库,共同推动嗅觉科学研究迈向新高度。
上海科技大学iHuman研究所和生命科学与技术学院2022届毕业生、之江实验室博士后韩伟,天翼云科技有限公司鲍思羽为共同第一作者。天翼云科技有限公司曹莉娜博士,浙江大学第一附属医院黄行许教授和上海科技大学iHuman研究所、生命科学与技术学院、上海市高分辨电子显微学重点实验室、上海临床研究中心长聘副教授赵素文是文章的共同通讯作者。上海科技大学为第一完成单位。
论文链接:
https://academic.oup.com/proteincell/advance-article/doi/10.1093/procel/pwae050/7762834?login=true