z1263077395-CSDN博客

原创正则表达式学习笔记（2）

2021-08-25 19:35:25 388

原创正则表达式学习笔记（1）

正则表达式学习笔记一、正则表达式概述正则表达式（regular expression）描述的是一种字符串匹配的模式，也就是说用具备一定特征意义的表达式对字符串进行检查，将符合条件的字符串提取出来的一种表达方式。我们使用的xpath，beautifulsoup等模块提取数据都是通过对html文件进行遍历从而获得想要的数据，在这之前我们需要将requests请求获取到的html字符串转化为html文件（lxml模块的etree；bs4模块的BeautifulSoup），但是使用re正则表达式则可以直接遍

2021-08-25 10:11:58 371

原创 python爬虫之xpath实战：爬取微博热搜

# -*- coding = utf-8 -*-# @Time : 2021/8/23 19:01# @Author : xiao long# @File :weibo.pyimport requestsfrom lxml import etreeurl = 'https://s.weibo.com/top/summary?cate=realtimehot'headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64.

2021-08-24 15:49:52 2371

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 正则表达式学习笔记（2）

原创 正则表达式学习笔记（1）

原创 python爬虫之xpath实战：爬取微博热搜

空空如也

空空如也

原创正则表达式学习笔记（2）

原创正则表达式学习笔记（1）