Python爬虫入门学习笔记(一)

本文介绍了网络爬虫的概念,以及学习Python爬虫所需掌握的基本知识,包括Python基础知识、urllib和urllib2库的用法、正则表达式、Scrapy框架等,推荐了廖雪峰的Python教程作为学习资源。
摘要由CSDN通过智能技术生成

毕设就是与python有关的课题,因此对python产生极大的兴趣,最近想学习爬虫,写写博客记录一下学习过程吧!

一、什么是爬虫?

网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。

二、需要学习什么?

根据网上的资料大概整理为以下几个方面:

  • Python基础知识
  • Python中urllib和urllib2库的用法
  • Python正则表达式
  • Python爬虫框架Scrapy
  • Python爬虫更高级的功能

python的基础学习我推荐看廖雪峰老师的教程,很详细!

廖雪峰的python教程

建议直接学习python3,python2与python3还是有挺多东西不一样的,为了少遇到令人头疼的兼容性问题直接开始学习python3吧!

参考资料:https://cuiqingcai.com/927.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值