爬虫学习路径记录

第1步:视频理论学习

看了阿里云大学的教学视频,课程名称《python爬虫实战》,
链接: link(https://developer.aliyun.com/learning/course/555)
之前听过这老师讲的hive课程,口齿清晰,思路明了,很喜欢,特意找他的课来看的。但是阿里云大学里的这个视频貌似是节选,只能了解个大概。

听完之后的感觉:
1. 老师讲课还是循序渐进地,这个老师很善于引导,会把操作过程中的实际思考路径也跟大家演示和分享,不是强塞知识点。
2. 除了Python,还需要先准备一些网页基础知识。

目前的收获:
1. 爬虫的基本步骤和流程;
2. 伪装uer-agent;
3. 爬到的网页信息需要解析,Xpath对XML进行解析,推荐工具XMLQuire;
4. 还有与爬虫本身没有关系,从老师的讲解中,掌握了很多程序员如何熟悉新工具、新语言、新函数的方法,很受用。

第一遍看视频,没有跟着实操,准备先凭着印象,配合几篇大神的文章,做个简单的实践。

--------------------------------2021年7月9日-------------------------------------------------------------------

第2步:实践

结合工作实际,自己设了一个需求目标,爬取政府招标采购网信息,并写入csv,形成表格。
从实现这个需求的过程中,get了几项实践技能:
1.实践了html页面获取;
2.实践了XPATH解析;
3.完成CSV文件创建和写入。
具体完成代码见另一篇文章:
python爬虫实例(政府招标采购信息爬取并写入CSV)
-------------------------------2021年7月16日-------------------------------------

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值