|
|
马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。
您需要 登录 才可以下载或查看,没有账号?立即注册
x
1、文章信息
题目: A taxonomically harmonized global dataset of wild bird hosts for avian influenza virus surveillance
期刊: Scientific Data
作者: Fanshu Du, Qiang Zhang, Yachang Cheng, Yang Liu, Weipan Lei, Lu Wang, Honglei Sun, Yipeng Sun, Jinhua Liu, Zhichao Li & Juan Pu
发表日期: 2025年12月19日
DOI: 10.1038/s41597-025-06451-1
2、论文摘要
野生鸟类是禽流感病毒(AIV)的关键自然储存库,并在其全球传播中发挥着核心作用。然而,由于缺乏标准化的全球野生鸟类宿主名录,限制了在“同一健康”框架下对AIV风险进行全面的监测与评估。本研究基于GISAID EpiFlu?数据库中1973年至2023年间报告的23,358株野生鸟类来源的病毒分离株,生成了一套在分类学上经过协调统一的AIV野生鸟类宿主数据集。我们对宿主名称进行了系统地提取、验证和协调,以解决报告中的不一致性,并统一了各记录间的分类学信息。该数据集包含隶属于26个目的394种野生鸟类,其中雁形目和鸻形目鸟类在宿主多样性中占据了相当大的比例。通过阐明AIV野生鸟类宿主的全球范围,该数据集为宿主识别、系统发育注释和基于生态性状的分析奠定了基础。数据集采用机器可读的格式构建,能够支持可重复的、大规模、物种层面的病毒学、流行病学和生物多样性研究。
3、研究背景
在H5N1等高致病性禽流感病毒随野鸟迁徙全球扩散、跨物种传播事件频发的背景下,两个关键问题亟待明确:我们是否准确掌握了全球范围内感染禽流感病毒的野鸟物种?现有宿主信息是否足以支撑物种层面的病毒生态研究和跨物种风险评估?中国农业大学与中国科学院地理科学与资源研究所联合团队,首次构建了全球范围内标准化、可程序识别的禽流感野鸟宿主数据集,系统校准并确认了394个明确的野鸟宿主物种,为理解病毒生态、评估跨物种传播风险提供了关键支撑。
长期以来,国际流感病毒数据库中关于野鸟宿主的记录普遍存在命名混乱、分类模糊、拼写不一致等问题,严重阻碍了科学研究与疫情防控。为此,该研究系统整理了GISAID EpiFlu? 数据库中1973年至2023年间所有动物源A型流感病毒的记录,筛选出23,358条野鸟来源的病毒数据,并在此基础上完成了野鸟宿主校准工作。研究对所有宿主条目进行格式标准化和人工核验,剔除重复与模糊数据,并参照全球鸟类分类权威名录AviList(2025版)进行分类学对齐,最终确认了394个野鸟宿主物种。该研究构建了首个可程序识别、分类准确的全球禽流感野鸟宿主标准化数据集,包括禽流感野鸟宿主分类字典、含有完整野鸟宿主信息的病毒信息表以及确定的野鸟宿主物种清单等数据信息。
4、研究结果
数据集规模:最终数据集包含23,358株野生鸟类来源的AIV分离株,对应816个独特的宿主条目,其中608个条目(对应19,613株病毒)可鉴定到物种水平,涵盖394种野生鸟类,分属26个目。
时间分布:2000年后,野生鸟类来源的AIV分离株数量显著增加,并出现三个明显的峰值期:2006-2011年、2014-2017年和2020-2023年。2023年的分离株数量达到历史最高值(1,826株)。
图1 | 野生鸟类来源的流感病毒分离株的时间分布
亚型分布:H5N1(17.94%)、H3N8(8.59%)和H4N6(8.05%)是检出率最高的三种亚型。不同时期的优势亚型有所不同:2006-2011年以H5N1、H3N8、H4N6为主;2014-2017年H5N8和H5N6成为优势亚型;而2020-2023年,H5N1再次成为绝对优势亚型,尤其在2022-2023年,超过88%的分离株为H5N1亚型。
图2 | 野生鸟类来源的流感病毒分离株的亚型组成和时间趋势
宿主多样性:雁形目和鸻形目在病毒分离株数量(分别为13,908和4,293株)和物种数量(分别为100种和87种)上均占据主导地位,凸显了它们在AIV生态网络中的核心作用。雀形目虽然物种丰富(68种),但相关的病毒分离株较少(224株);而鹰形目则相反,26个物种贡献了300株病毒。年度宿主物种多样性的变化趋势与病毒分离株数量的变化趋势基本一致,在疫情高峰期,参与病毒传播的野生鸟类物种更加多样化。
图3 | 不同野生鸟类目中毒株数量和鸟种数量分布
数据集构成:研究在Zenodo平台上公开发布了三个核心数据文件:
Avilist-Wild_Bird_Host_Classification_Dictionary.csv:包含816个野生鸟类宿主条目的分类学术语对照表,链接了原始宿主名称与标准化的分类层级(目、科、属、种)及AviList ID。
Aviliest-Wild_Bird_Host_Linked_Isolates.csv:包含23,358株病毒分离株的完整元数据,每条记录都附带了协调后的宿主分类信息。
Aviliest-Wild_Bird_394_Species_List.csv:列出了394种确认的AIV野生鸟类宿主物种及其分类信息和关联的病毒分离株总数。
图4 | 野生鸟类来源的流感病毒分离株及宿主物种多样性的时间趋势
5、研究方法
研究者构建了一个五步流程来生成协调统一的野生鸟类宿主数据集:
数据收集:从GISAID EpiFlu?数据库检索了1973年至2023年间所有动物来源的A型流感病毒分离株记录,共获得95,257条记录。
宿主信息提取与标准化:尽管元数据中有“Host”字段,但病毒分离株名称(Isolate_Name)中通常包含更精确的物种信息。研究者遵循WHO的流感病毒命名格式,从“Isolate_Name”字段中提取宿主术语,并通过转换为小写、替换连字符和下划线、去除空格等方式进行标准化,最终得到1,093个独特的宿主条目。
宿主类别分类:将提取的1,093个宿主条目分为五大类:野生鸟类、家禽、哺乳动物、环境和来源不明(NA)。其中,816个条目被识别为野生鸟类宿主。
野生鸟类宿主协调统一:对816个野生鸟类宿主条目进行系统的分类学特异性评估,以确定其可识别的最精确分类等级(纲、目、科、属、种)。对于能可靠鉴定到物种水平的条目,依据“AviList:全球鸟类名录(v2025)”这一权威分类学参考,记录其学名和通用名。对于描述模糊的条目(如“候鸟”、“天鹅”),则将其归入可能的最具体的高级分类单元(如属、科、目或纲)。最终,鉴定出394个独特的野生鸟类物种,并为所有816个条目构建了链接其原始宿主条目与科学分类的术语对照表。
数据集整合:将协调后的宿主分类信息与病毒分离株的元数据(如分离株ID、亚型、地点、日期等)进行整合,并对地点、日期和亚型等字段进行标准化处理(例如,提取年份、简化地点、分离HA和NA亚型),生成最终的数据集。
图5 |本研究数据处理流程
6、论文总结
该研究基于全球范围内分散、模糊且不可比较的禽流感病毒野鸟宿主记录,首次实现了跨国家、跨时间段的宿主记录统一,显著提升了数据使用价值。数据集可直接应用于病毒系统发育分析、宿主风险建模、跨物种传播链条重建、宏基因组注释及跨数据库数据整合等多个领域的研究,为One Health框架下的疫情风险识别与前瞻性防控提供科学支持。
该研究由中国农业大学、中国科学院地理科学与资源研究所、自然资源部第三海洋研究所、中山大学、北京师范大学等多家机构共同完成,中国农业大学博士生杜凡姝和中国科学院地理科学与资源研究所博士生张强为共同第一作者,中国农业大学蒲娟教授和中国科学院地理科学与资源研究所李之超副研究员为共同通讯作者。研究工作得到国家重点研发计划(2022YFF0802400)和国家自然科学基金(81961128002)等项目的支持。
引用
Du, F., Zhang, Q., Cheng, Y. et al. A taxonomically harmonized global dataset of wild bird hosts for avian influenza virus surveillance. Sci Data 13, 135 (2026). https://doi.org/10.1038/s41597-025-06451-1
来源:生态风险与韧性前沿
|
|