2020-12-05

最新推荐文章于 2020-12-28 13:23:34 发布

yzwnbxx

最新推荐文章于 2020-12-28 13:23:34 发布

阅读量59

点赞数

分类专栏：代码学习文章标签： python

本文链接：https://blog.csdn.net/yzwnbxx/article/details/110729183

版权

代码学习专栏收录该内容

16 篇文章 0 订阅

订阅专栏

文章目录

前言
一、数据解析
- 1.聚焦爬虫
- 2.数据解析
二、爬取网页指定图片
- 1.代码部分

前言

今天进入数据解析的学习。

一、数据解析

1.聚焦爬虫

聚焦爬虫：爬取页面中指定的页面内容。
编码流程：
1.指定url
2.发起请求
3.获取响应数据
4.数据解析
5.持久化存储

2.数据解析

数据解析分类：
1.正则
2.bs4
3.xpath
数据解析原理概述：
解析的局部的文本内容都会在标签之间或者标签对应的属性中进行存储。
1.进行指定标签的定位
2.标签或者标签对应的属性中存储的数据值进行提取（解析）

二、爬取网页指定图片

1.代码部分

代码如下：

import requests
if __name__=="__main__"
    #如何爬取图片数据
    url='http://49.235.81.143:3088/zentao/theme/default/images/main/zt-logo.png'
    #content返回的时二进制形式的图片数据，可以用来获取图片数据
    #text（字符串） content（二进制图片） json（）（对象类型）
    img_data=requests(url=url).content
    with open('./candao.jpg','wb') as fp:
        fp.write(img_data)

yzwnbxx

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2020-12-05

文章目录前言一、数据解析1.聚焦爬虫2.数据解析二、爬取网页指定图片1.代码部分前言今天进入数据解析的学习。一、数据解析1.聚焦爬虫聚焦爬虫：爬取页面中指定的页面内容。编码流程：1.指定url2.发起请求3.获取响应数据4.数据解析5.持久化存储2.数据解析数据解析分类：1.正则2.bs43.xpath数据解析原理概述：解析的局部的文本内容都会在标签之间或者标签对应的属性中进行存储。1.进行指定标签的定位2.标签或者标签对应的属性中存储的数据值进行提取（解析）二
复制链接

扫一扫