爬虫
文章平均质量分 65
以基础函数为中心,逐步进阶
不屈服的脚步
这个作者很懒,什么都没留下…
展开
-
简单的爬虫学习:requests+BeautifulSoup 3
文章目录前言一、BeautifulSoup1.介绍2.pip 安装3.使用方法二、获取IP代理数据1.选定免费ip代理的网址2.根据网页分析选择数据3.使用requests.get得到网页代码总结 前言 知道如何获取网页的内容,那么现在我们来获取静态网页中我们需要的信息。 这要用到python的一些库:lxml,BeautifulSoup等。 每个库都各有优点,推荐使用BeautifulSoup,本文简单介绍其使用方法。 一、BeautifulSoup 1.介绍 Beautiful Soup是python原创 2021-12-06 23:33:46 · 259 阅读 · 0 评论 -
简单的爬虫学习,requests 2
简单的爬虫学习 文章目录前言一、requests.get()返回对象属性二、requests.get()常用参数总结 前言 requests.get()核心便是通过get获取网页信息 让我们进一步学习get函数 一、requests.get()返回对象属性 statuts_code 状态码 headers 请求头 encoding 编码方式 cookies cookies信息 text 网页代码 url 网址 content 字节码,用来存文件(图片等) 还是以凤凰原创 2021-12-05 23:05:22 · 565 阅读 · 0 评论 -
简单的爬虫学习,1
简单的爬虫学习 文章目录前言一、爬虫需要了解内容二、使用步骤1.引入库2.获取网页源代码总结 前言 想学习爬虫,看看简单的爬虫是怎么样的吧! 一、爬虫需要了解内容 要有python基础+requests库 目标学会requests.get()函数运用 了解html源代码 二、使用步骤 1.引入库 代码如下(示例): import requests 未安装的话,在cmd中运行: pip install requests 2.获取网页源代码 代码如下(示例): (以凤凰网为例) url='ht原创 2021-12-04 10:22:40 · 749 阅读 · 0 评论