山东大学暑假实训医疗知识图谱第三周记录三 目录 1.工作内容2.总结 1.工作内容 继续编写爬虫代码,并对编写好的代码进行调试。 2.总结 得到地址后,访问该网址,找到class=”yaopinming”将药品名加到数组中。 之后根据class=”smsli”获取药品说明书中的其余内容,输出到指定文件中,输出完最后一行加入分隔符,继续爬取下一个药品说明书的数据。 在数据爬取过程中,遇到了部分网页地址错误导致的http error,解决方法是遇到相应的错误则跳过该说明书继续爬取下一个说明书的内容。