虚拟机 MySQL 数据库账号/ 密码 :root/Password123$
具体任务要求:
1、 使用 chrome 浏览器,查找网站异步请求的数据,在计算机桌面“GZ-032 竞赛文档”文件夹“XXX-02.docx(XXX 代表赛位号、02 代表任务二)”文件中创建并编写完成下表:
内容 | 网页源码对应字段 |
酒店评分 | |
酒店名称 | |
酒店星级 | |
用户点评数 |
(示例表)
内容 | 网页源码对应字段 |
北京 | Province |
中国 | Country |
2、 完善 hotelscrawl.py 中内容,将函数内容截图并保存。
1) 将完整的 start_requests 函数内容截图并保存;
2) 将完整的 get_city 函数内容截图并保存;
3) 将完整的 get_page 函数内容截图并保存;
4) 将完整的 get_hotel_id 函数内容截图并保存;
5) 将完整的 parse 函数内容截图并保存。
3、 根据爬取字段,在 MySQL 中创建 crawl 数据库,在该数据库中创建 hotels 表,并查看表结构,将查看结果(含字段总行数)截图并保存。
4、 完善 pipelines.py 中内容,将函数内容截图并保存。
1) 将完整的 process_item 函数内容截图并保存。
5、 爬虫程序运行结束后查看MySQL数据库,按seq倒序排序,返回前4行数据,将命令与查看结果截图并保存。
答案已更新请查收任务二:3-数据采集(20分_答案)