【2019全国职业技能大赛大数据技术】任务二:3-数据采集(20分_题目)

虚拟机 MySQL 数据库账号/ 密码 :root/Password123$
具体任务要求:
1、 使用 chrome 浏览器,查找网站异步请求的数据,在计算机桌面“GZ-032 竞赛文档”文件夹“XXX-02.docx(XXX 代表赛位号、02 代表任务二)”文件中创建并编写完成下表:

内容网页源码对应字段
酒店评分 
酒店名称 
酒店星级 
用户点评数 


(示例表)

内容网页源码对应字段
北京Province
中国Country

2、 完善 hotelscrawl.py 中内容,将函数内容截图并保存。
1) 将完整的 start_requests 函数内容截图并保存;
2) 将完整的 get_city 函数内容截图并保存;
3) 将完整的 get_page 函数内容截图并保存;
4) 将完整的 get_hotel_id 函数内容截图并保存;
5) 将完整的 parse 函数内容截图并保存。
3、 根据爬取字段,在 MySQL 中创建 crawl 数据库,在该数据库中创建 hotels 表,并查看表结构,将查看结果(含字段总行数)截图并保存。
4、 完善 pipelines.py 中内容,将函数内容截图并保存。
1) 将完整的 process_item 函数内容截图并保存。
5、 爬虫程序运行结束后查看MySQL数据库,按seq倒序排序,返回前4行数据,将命令与查看结果截图并保存。

答案已更新请查收任务二:3-数据采集(20分_答案)

  • 3
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

濯一一

你的鼓励:我最大的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值