数据银行

数据是驱动未来的石油,是构筑智慧医疗的基石。“数据银行”是本平台的核心引擎。
它以前所未有的广度和深度,系统性地汇聚、治理并融合了中西医药学知识,
为精准医疗、创新研发和智能决策提供了坚实可靠的数据动力。

探索数据维度
🌊

规模浩瀚

总数据量超100TB,涵盖亿万级文献、千万级分子与基因关联、百万级临床数据,构建了全球领先的医疗健康大数据资源库。

☯️

中西融合

独创性地将中医理论(方剂、证候、药材)与现代医学(基因、靶点、通路)深度融合,构建了多层次、多维度的知识网络。

💎

质量卓越

所有数据均经过严格的标准化清洗、去重、实体对齐和关系抽取,确保了数据的高准确性、一致性和完整性。

🚀

AI就绪

数据经过精心构建,专为大语言模型训练和下游AI应用而设计,可直接用于模型预训练、知识图谱构建和各类智能系统开发。

数据维度全景

非结构化数据 - 知识的源泉

📖

文献摘要

  • 数量: 6000万
  • 属性: 标题, 作者, 摘要, 关键词
  • 来源: 中英文期刊全文, EviMed医学专利, 指南/共识库
📚

文献全文

  • 数量: 4000万
  • 属性: 标题, 作者, 全文内容, 参考文献
  • 来源: 中英文期刊全文, EviMed医学专利, 指南/共识库
📜

中医古籍、教材

  • 数量: 2000本
  • 属性: 书名, 作者, 章节, 原文, 注释
  • 来源: 中医十三五规划教材、权威典籍
📌

指南和共识

  • 数量: 20000
  • 属性: 名称, 发布机构, 时间, 适用范围, 推荐意见
  • 来源: 指南共识官方发布, EviMed指南库
📹

影音数据

  • 数量: 200T
  • 属性: 视频/音频文件, 采集设备, 时间, 患者信息
  • 来源: 名医门诊视频, 中医专家讲课, 公开课
👅

舌脉象图像

  • 数量: 2000+
  • 属性: 图像文件, 采集设备, 时间, 患者信息
  • 来源: 合作医院四诊仪设备采集

半结构化数据 - 临床的洞见

📝

临床医案

  • 数量: 10000
  • 属性: 患者ID, 主诉, 现病史, 诊断, 治疗方案, 医嘱, 按语
  • 来源: 中英文期刊、合作医院临床一线采集
💻

电子病历 (RWD)

  • 数量: 180000
  • 属性: 就诊记录, 诊断信息, 用药信息, 检验检查结果
  • 来源: 医院共享数据, 临床合理用药数据库
💳

医保记录 (RWD)

  • 数量: 整理中
  • 属性: 就诊时间, 医疗机构, 费用明细, 报销金额, 药品名称
  • 来源: 医院共享数据

结构化数据 - 智能的核心

🌿

中药方剂数据

  • 数量: 180,000
  • 字段: 方剂名称、数据来源、方剂出处、药材组成、主治、加减、功效、用法用量、制备方法、临床应用、各家论述、用药禁忌、附注、描述、功用、方义、运用、重要文献摘要、配伍特点、化裁方鉴别、加减化裁、分类、歌诀、药味组成
  • 来源: 中医临床病症大典、中国《药典》、TCMID、TCMSP、HERB、FangNet
💊

中成药数据库

  • 数量: 100,000
  • 字段: 中成药名称、出处、通用名、商品名、性质、相关疾病、性状、成份、功能主治、规格、不良反应、用法用量、禁忌、注意事项、孕妇/儿童/老人用药、药物相互作用、药理毒理、药代动力学、贮藏、有效期、描述、处方、制法、鉴别、检查、含量测定、特征/指纹图谱、效价测定、靶点、毒性信息等
  • 来源: 中国《药典》、上市药品、药品注册与受理数据库、药材标准、药材炮制规范
🧬

中药成分数据

  • 数量: 40,000
  • 字段: 成分名称、化学结构、药理作用、来源药材、含量
  • 来源: 中国《药典》、NPASS、Super Natural II、ETCM、TCM-MC
🧪

天然分子及衍生物

  • 数量: 3,600,000
  • 字段: 分子ID、分子名称、结构式、来源、药理作用
  • 来源: COCONUT、Super Natural II、NPASS、TCM@Taiwan
📋

中西医疾病数据

  • 数量: 10,000
  • 字段: 中医病名、西医病名、症状对照、诊断标准对照、文件名、疾病名称、描述、相关中医疾病、科室、发病部位、症状、病因、诊断鉴别、治疗原则/方法、预防、并发症、费用、预后、护理、饮食、就医指南等
  • 来源: 中医临床病症大典、TCMID、SymMap
🩺

中医证候数据

  • 数量: 3,000
  • 字段: 证候名称、四诊特征、病机分析、治疗原则
  • 来源: 中医临床病症大典、TCMBank、LTM-TCM
🌱

中药材草本植物数据

  • 数量: 20,000
  • 字段: 药材名称、拼音、英文名、药理作用、不良反应、拉丁名、别名、基源、原形态、化学成分、理化鉴别、附方、用法用量、炮制、制剂、毒性、注意、贮藏、生境分布、道地、产地、数据库来源、描述、主治、临床应用等
  • 来源: 药材标准、药材炮制规范、HERB、TCMSTD
🔗

药对数据

  • 数量: 1,000
  • 字段: 药对组成、伍用功能、主治、常用量、经验总结、禁忌、相关疾病及分类
🍲

药食同源药膳数据

  • 数量: 200
  • 字段: 药膳名称、成分、功效、适用人群、制作方法、材料、烹饪步骤、禁忌
🥗

食谱数据

  • 数量: 50,000
  • 字段: 菜名、分类、主分类、简介、难度、耗时、提示、材料、分量、步骤、功效主治、视频、组成/功效/主治图谱
🍵

茶饮数据

  • 数量: 1,000
  • 字段: 茶饮名称、成分、功效、适用人群、禁忌、煎煮方法、舌脉、体质
🏃

运动数据

  • 数量: 1,000
  • 字段: 运动类型、功效、适用人群、强度、注意事项
🎵

音乐疗法数据

  • 数量: 500
  • 字段: 音乐类型、功效、适用病症、播放时长
🪡

针灸数据

  • 数量: 200,000
  • 字段: 穴位名称、定位、手法、适应症、禁忌
  • 来源: 中医临床病症大典、TCMID、TCMBank
🩹

中医外治法数据

  • 数量: 1,000
  • 字段: 疗法名称、操作方法、适应症、禁忌
⚖️

中药和西药相互作用数据

  • 数量: 100,000
  • 字段: 药物1ID、药物2ID、交互类型、交互效果、作用机制、临床证据
  • 来源: TCMBANK,ddinter2
🌏

五运六气、八字与疾病

  • 数量: 1,000
  • 字段: 年份、节气、五运、六气、生辰八字、对应疾病、病因病机、临床表现
💉

西药数据

  • 数量: 20,000
  • 字段: 药名、化学成分、药理作用、适应症、剂量、不良反应、禁忌症
  • 来源: Drugbank、KEGG、Chembl、PubChem、Binding db、EviMed、药品注册数据库等
🥛

营养素数据

  • 数量: 1,000
  • 字段: 营养素名称、功效、来源、推荐摄入量
  • 来源: Drugbank、PubChem、临床合理用药数据库
🧫

已上市和在研分子数据

  • 数量: 整理中
  • 字段: 分子ID、名称、开发阶段、适应症、药理作用
  • 来源: Drugbank、TTD、Chembl、药品注册数据库
🧮

分子互作DDI数据

  • 数量: 整理中
  • 字段: 药物1ID、药物2ID、交互类型、交互效果、文献支持
  • 来源: STITCH、Binding db、临床合理用药数据库
⚠️

药物不良反应数据

  • 数量: 整理中
  • 字段: 药物ID、不良反应类型、严重程度、发生率、文献支持
  • 来源: Drugbank、TTD、临床合理用药数据库、EviMed等
🧬

LINCS药物扰动表达数据

  • 数量: 整理中
  • 字段: 药物ID、细胞系、扰动条件、基因表达变化
  • 来源: cMAP、LINCS
🧑‍🔬

遗传学数据

  • 数量: 整理中
  • 字段: 基因ID、基因名称、功能、突变类型
  • 来源: GWAS、dbGAP、GEO、TCCG
🔬

疾病关联SNP

  • 数量: 整理中
  • 字段: 疾病ID、SNP编号、基因位置、关联性分析
  • 来源: GWAS、dbGAP、WTCCC
🧑‍🔬

疾病关联Gene

  • 数量: 整理中
  • 字段: 疾病ID、基因ID、关联机制、文献支持
  • 来源: GWAS、dbGAP、GEO、TCCG、cMAP
🧬

ScRNA-seq数据

  • 数量: 整理中
  • 字段: 细胞ID、基因表达量、细胞类型、样本信息
  • 来源: GEO
🧪

蛋白组学数据库

  • 数量: 整理中
  • 字段: 蛋白质ID、名称、功能、结构、表达数据、互作数据
  • 来源: UniProt、STRING、TISSUES
🔬

代谢物数据

  • 数量: 整理中
  • 字段: 代谢物ID、名称、化学结构、生物功能、来源、研究ID、样本类型、分析方法等
  • 来源: HMDB、Metabolomics Workbench、PubChem
🌻

草药基因组

  • 数量: 整理中
  • 字段: 草药名称、基因组ID、基因序列、功能注释
  • 来源: 草药基因组

最终沉淀:中西医药知识图谱

所有数据最终汇聚并沉淀为一个庞大而精细的“中西医药知识图谱”。它不仅是数据的集合,更是知识的升华。通过将数千万节点(如疾病、药物、基因、方剂、证候)与数亿条关系进行连接,我们揭示了传统中医理论与现代生命科学之间千丝万缕的深层联系。

这个动态演化的知识图谱,是我们进行复杂推理、实现精准推荐、赋能创新研发的智慧核心。

知识图谱
中药
疾病
基因
靶点
方剂

开启您的数据驱动创新之旅

无论您是来自医院、高校、科研机构还是创新企业,我们都相信,“数据银行”能够为您在临床研究、药物研发、健康管理等领域的探索提供前所未有的强大助力。让我们携手,共同将数据的潜力转化为守护生命的价值。

申请合作与数据接入