Python爬虫教程,简单易懂,学会后还可以做副业赚钱

本文提供了一篇Python爬虫教程,适合初学者。通过讲解准备、编写爬虫程序的步骤,以及提供Python学习资源,帮助读者快速入门并了解如何通过爬虫实践副业。同时,分享了Python所有方向的学习路线、课程视频、电子书、实战案例和互联网企业面试真题。
摘要由CSDN通过智能技术生成

点击免费领取《CSDN大礼包》:

最新全套【Python入门到进阶资料 & 实战源码 & 安装工具】

https://mp.weixin.qq.com/s/9IuSexhanYZ1TMAF1MZIhw


在这里插入图片描述

在这个信息爆炸的时代,要想高效地获取数据,爬虫绝对是首选。而用python做爬虫也十分简单,下面就通过一个简单的小爬虫程序,来一睹写爬虫的基本过程:

一、准备工作

语言:python

IDE:pycharm

首先是要用到的库,因为是刚入门最简单的程序,我们主要就用到下面这两个:

import requests //用于请求网页
import re  //正则表达式,用于解析筛选网页中的信息

其中re是python自带的,requests库需要我们自己安装,在命令行中输入pip install requests即可。

然后随便找一个网站,注意不要尝试爬取隐私敏感信息。

二、编写爬虫程序

开始爬虫前,我们首先应明确两点:

  1. 爬虫的网址;

  2. 需要爬取的内容(数据)。

第一步,爬虫的网址,我们拿某表情包网站来举例子。

在这里插入图片描述

首先肯定要通过python访问这个网站,代码如下:

headers = {
   
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:98.0) Gecko/20100101 Firefox/98.0'
    }
response = requests.get('https://qq.yh31.com/zjbq/',headers=headers)  //请求网页

其中之所以要加headers这一段,是因为有些网页会识别出python请求,然后拒绝,所以我们要换个正常的请求头。可以随便找一个或者f12从网络信息里复制一个。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值