python爬虫进阶(一):静态网页爬取

一、文章说明本文是在学习过程中的笔记分享,开发环境是win7,Python3,编辑器pycharm,文章中若有错误欢迎指出、积极讨论。另外,推荐一个比较好的爬虫教程二、课程基础1、HTML和CSS爬虫和网页内容处处打交道,首先要掌握一部分前端内容。参考教程:W3school在线教程2、xpath解析网页掌握了上面的知识,下面就可以开始下一步学习了。如何解析网页?这里我推
摘要由CSDN通过智能技术生成

一、文章说明

本文是在学习过程中的笔记分享,开发环境是win7,Python3,编辑器pycharm,文章中若有错误欢迎指出、积极讨论。

另外,推荐一个比较好的爬虫教程

二、课程基础

1、HTML和CSS

爬虫和网页内容处处打交道,首先要掌握一部分前端内容。参考教程:W3school在线教程

2、xpath解析网页

掌握了上面的知识,下面就可以开始下一步学习了。如何解析网页?这里我推荐BeautifulSoupxpath,掌握了这两种解析方法基本上就够了,当然,还有一种必须掌握:正则表达式,有点简单粗暴,但屡试不爽吐舌头

3、http响应状态

2xx:成功

3xx:调转

4xx:客户端错误

5xx:服务

  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值