### **一、古籍文献数字化平台**
1. **中国哲学书电子化计划**
- 内容:收录《黄帝内经》《本草纲目》等2000+部中医典籍
- 特点:提供全文检索与XML标注版本
- 网址:http://ctext.org/
2. **国家图书馆中华古籍资源库**
- 内容:包含中医善本、地方志中的医药记载
- 功能:支持按朝代、作者分类浏览
- 网址:http://www.nlc.cn/gb/guji/
3. **中医古籍数据库(上海中医药大学)**
- 特色:专注针灸、脉诊等临床文献,含症状-方剂关联数据
- 访问:需通过高校或研究机构申请权限
### **二、结构化医药数据库**
1. **中医药数据库(TCM-ID)**
- 内容:药材化学成分、四气五味、归经等标准化数据
- 提供:MySQL格式下载,含600+种药材信息
- 来源:https://www.tcmip.cn/
2. **中医症状-方剂关联数据库**
- 构建:基于《伤寒杂病论》等经典的症状-治法网络
- 格式:CSV/JSON,含症状频次、方剂组合规律
- 获取:GitHub开源项目(如TCM-Network)
3. **中药系统药理学数据库(TCMSP)**
- 数据:药材靶点预测、成分-疾病关联
- 应用:药物发现与复方优化研究
- 网址:http://tcmspw.com/tcmsp.php
### **三、知识图谱与语义网络**
1. **中医药知识图谱(CNKI)**
- 结构:包含疾病、证候、方剂、中药四层关联
- 工具:提供Neo4j图数据库查询接口
- 访问:需通过知网机构账号
2. **中医医案知识图谱**
- 来源:名医诊疗记录文本挖掘
- 特点:含症状-辨证-治法-方剂推理路径
- 获取:GitHub项目(如TCM-KG)
### **四、现代中医药研究数据**
1. **临床试验注册平台**
- 内容:针灸、中药制剂的临床试验数据
- 平台:中国临床试验注册中心(ChiCTR)
- 网址:http://www.chictr.org.cn/
2. **中药成分分析数据库**
- 数据:HPLC/MS等仪器分析的化学成分指纹图谱
- 来源:国家药典委员会、中药标准化项目
### **五、数据清洗与预处理建议**
1. **古籍文本处理**
- 使用结巴分词+自定义词典(含中医术语)
- 工具:Python的`jieba`库+THUOCL中医词库
2. **结构化转换**
- 将症状描述转换为ICD-11中医扩展编码
- 参考:《中医临床诊疗术语》国家标准
3. **可视化方向**
- 药材分布地图:结合《中国道地药材产区图》
- 方剂网络图:D3.js力导向图展示君臣佐使关系
- 症状-药材关联矩阵:热力图或弦图呈现