山东大学暑假实训医疗知识图谱第三周记录一 目录 1.工作内容2.总结 1.工作内容 根据对网站的解析开始理清代码编写思路。 2.总结 对网站结构进行解析: 该网站中的药品说明书按照首字母分类,共有22个字母,每个字母下有药品说明书的链接,并进行了分页。每个药品说明书链接点进去之后,就是该药品对应药品说明书的具体内容 想到先得到每个字母下所有的全部分页数量,再对每个分页进行字符串拼接,最终得到每个药品说明书对应的地址,之后访问该地址对说明书内容进行爬取。