第一章 爬虫认知

在这里插入图片描述

一 前言

学习目标,是希望你能掌握如下一些可以写在简历上的技能。

  1. 熟练使用Python语言
  2. 掌握网络数据采集技术,熟练使用爬虫工具urllib、requests、xpath、beautifulsoup、re、selenium、aiohttp、scrapy以及scrapy-redis分布式爬虫框架等
  3. 熟悉网页语言html及javascripts,掌握json格式数据处理方法,拥有一定反爬经验积累,理解并熟练掌握各种反爬技巧(UA,IP代理,模拟登录,动态页面,验证码等)
  4. 了解手机app爬虫,掌握Fiddler抓包工具以及Airtest自动化测试框架的使用,安卓逆向
  5. 熟悉掌握数据存储技能MongoDB,MySQL,并配合Python使用,实现数据采集入库
  6. 熟悉多进程多线程异步,提高爬虫效率
  7. 熟悉scrapy+scrapyd+gerapy实现可视化爬虫程序调度
  8. 熟悉celery与apsheduler框架,实现定时更新

此教程大纲可以参考我之前的一篇文章。

二 什么是爬虫

是一种按照一定的规则,自动地抓取

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 4
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值