智谱华章-AI发掘科技创新原动力

您的位置:智谱华章官网 > 公司新闻 > 新闻报道 > 智谱华章官网:收录全球上百个新冠疫情数据集

智谱华章官网:收录全球上百个新冠疫情数据集

发布日期:2020-04-28 14:39浏览次数:
随着 COVID-19 数据集的日益普及,全球技术开发人员为流行病学家和数据科学专家们创建了一堆分析工具,来迅速汇总和分析 COVID-19 大流行的数据,让这次新型冠状病毒爆发成为有史以来最直观的一次。


通过这些宏观、全面、又详细的可视化数据集,我们每一个“吃瓜网民”都可以算得上半个流行病学家。

第一个数据分析仪表板和汇合工具出现在 COVID-19 爆发后不久。该仪表板由约翰·霍普金斯大学提供,成为了目前重要的数据源,它将来自世卫组织、疾病预防控制中心、ECDC、NHC、DXY、1point3acres、Worldometers.info、BNO、国家政府卫生部门以及当地媒体报道的数据进行汇合,形成可视化数据展示。

202004280201.jpg

约翰·霍普金斯大学的 COVID-19 全球仪表板

约翰斯·霍普金斯大学也将数据放在了 GitHub 上。自 1 月 23 日发布该仪表板以来,COVID-19 已经成为公认的最可视化的大流行数据集。

GitHub 地址:https://github.com/CSSEGISandData/COVID-19

可视化分析大流行

除了约翰·霍普金斯大学的 COVID-19 全球仪表板,目前全球还有许多优秀的可视化分析数据集,比如:

  • 利用约翰霍普金斯大学 GitHub 存储库的数据,Tableau 公司发布了一个入门仪表盘,使其在 Tableau Public 上可用,提供各种可视化模板,也设置了数据集的 .hyper , .tde 和 CSV 版本,便于访问。

地址:https://www.tableau.com/covid-19-coronavirus-data-resources

  • 美国环境系统研究所公司(Esri)通过地图和地理定位技术应用于 COVID-19 的跟踪,此外还对 COVID-19 病例数据进行了本地化,并与来自权威医疗机构的病床可用性数据相结合。

地址:https://www.esri.com/en-us/covid-19/overview

  • Facebook 和卡内基梅隆大学( Carnegie Mellon )将用户数据匿名化,以追踪全美范围内的 COVID-19 状况。

地址:https://covid-survey.dataforgood.fb.com/

  • 《大西洋月刊》( Atlantic )的作者们正在使用开源软件收集来自多个来源的数据。

地址:https://covidtracking.com/

  • GitHub 有一系列关于新型冠状病毒的数据集,而像 data.world 和 Kaggle这种竞赛、预测和可视化的平台也有新型冠状病毒的数据集。

地址:https://data.world/

  • Reddit 有个专题专门展示一群爱好者和数据科学家的可视化成果,Our World in Data也对 COVID-19 的研究和数据进行了概述。

地址:https://www.reddit.com/r/dataisbeautiful/

  • 数据服务公司 Starschema 已经列出了一个免费的数据集,旨在成为 COVID-19 病例发病率和死亡率的唯一真实数据来源,这些数据可以用人口密度和地理位置来扩充。

地址:https://www.snowflake.com/datasets/starschema/

  • IBM 汇总了 COVID-19 数据,并将其与 Weather Channel 应用程序进行集成,该应用程序将天气数据和本地新型冠状病毒事件融合在一起。通过其天气频道应用,IBM 的子公司可以将相关的 COVID-19 数据提供给 3 亿的活跃用户。在谷歌和微软必应( Microsoft Bing )的共同努力下,IBM可视化技术将得以发展,把 COVID-19 数据带给大众。

地址:https://accelerator.weather.com/bi

  • ESO是一家数据软件公司,专注于研究EMS、火灾和医院的急救人员的情况,以追踪全美各地的急救数据,该数据集收集了从院前到医院的反应,收集自全美 2600 家 EMS 机构,但不包括加州。

地址:https://www.eso.com/covid-19/

  • 健康指标与评估研究所( Institute for Health Metrics and Evaluation )也有一组数据,关注医院病床的使用情况,以及重症监护床和呼吸机的需求。

地址:https://covid19.healthdata.org/united-states-of-america

  • C3.ai 创建了一个统一的数据集,公开所有可用的 COVID-19 数据集。

地址:https://c3.ai/products/c3-ai-covid-19-data-lake/

202004280202.jpg

汇总到 C3 数据集中的数据集:

  • 约翰霍普金斯大学: COVID-19 数据仓库

https://github.com/CSSEGISandData/COVID-19

  • 大西洋: COVID 跟踪项目

https://covidtracking.com/

  • 纽约时报: COVID-19 在美国的数据

https://github.com/nytimes/covid-19-data

  • nCoV-2019 数据工作组:流行病学数据

https://github.com/beoutbreakprepared/nCoV2019/tree/master/latest_data

  • MOBS Lab: COVID-19 情况报告

https://www.mobs-lab.org/2019ncov.html

  • 世界卫生组织:每日情况报告

https://www.who.int/emergencies/diseases/novel-coronavirus-2019/situation-reports

  • 欧洲疾病预防和控制中心:全球最新情况

https://www.ecdc.europa.eu/en/covid-19-pandemic

  • 蒙特利尔大学: COVID-19 图像数据收集

https://github.com/ieee8023/covid-chestxray-dataset

  • 美国国家生物技术信息中心病毒数据库

https://www.ncbi.nlm.nih.gov/labs/virus/vssi/#/virus?SeqType_s=Nucleotide&VirusLineage_ss=Severe%20acute%20respiratory%20syndrome%20coronavirus%202,%20taxid:2697049

  • COVID-19 开放研究数据集

https://registry.opendata.aws/cord-19/

  • COVID-19 数据科学:韩国数据集

https://github.com/ThisIsIsaac/Data-Science-for-COVID-19

  • 印度卫生和家庭福利部: COVID-19 印度

https://www.mohfw.gov.in/

  • 民防部网址-冠状病毒紧急情况

https://github.com/pcm-dpc/COVID-19

  • COVID-19 印度尼西亚的数据科学

https://www.kaggle.com/ardisragen/indonesia-coronavirus-cases

  • 凯撒健康:美国医院 ICU 病床

https://khn.org/news/as-coronavirus-spreads-widely-millions-of-older-americans-live-in-counties-with-no-icu-beds/#lookup

  • HealthData.org :美国医院容量

https://covid19.healthdata.org/united-states-of-america

  • 美国环保局:美国空气质量

https://aqs.epa.gov/aqsweb/documents/data_api.html

  • 美国人口普查局:人口数据

https://data.census.gov/cedsci/

  • IEEE: COVID-19 Tweets 数据集

https://ieee-dataport.org/open-access/corona-virus-covid-19-tweets-dataset

  • 华盛顿大学: COVID-19

https://covid19.healthdata.org/united-states-of-america

  • 凯撒家庭基金会:社会距离政策

https://www.kff.org/health-costs/issue-brief/state-data-and-policy-actions-to-address-coronavirus/#socialdistancing

新冠肺炎( COVID-19 )开放数据源

不久前,为了对抗蔓延全球的新冠肺炎疫情,帮助研究者、政策制定者、医疗工作者和普通民众更深入地了解病毒和疫情,清华大学联合中国工程科技知识中心、清华大学附属北京长庚医院、阿里巴巴智能计算实验室、北京智源人工智能研究院数据开放研究中心、搜狗搜索、智谱.AI共同上线了“新冠肺炎( COVID-19 )开放数据源”

202004280203.jpg

新冠肺炎( COVID-19 )开放数据源,自疫情发端即致力于收集来自世界各地各种类型的相关开放数据,并保持持续更新。数据源涵盖流行病研究、知识、媒体和政策等多个领域,目前已收集 194 条开放数据源。

感兴趣的“业余流行病学家”们,可通过以下链接,一键直达新冠肺炎( COVID-19 )开放数据源专题页面:

https://www.aminer.cn/data-covid19/