数据储存学习小结(1)文件储存 TXT文本储存# 保存知乎上“发现”页面的“热门话题”的问题与答案import requestsfrom pyquery import PyQuery as pqurl = 'https://www.zhihu.com/explore'headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) App...
解析库的学习小结(3)pyquery学习 pyquery初始化字符串初始化html = '''<div><ul><li class="item-O">first item</li><li class="item-1"><a
解析库的学习小结(2)bs4学习 BeautifulSoup解析器使用方法python标准库BeautifulSoup(markup, “html.parser”)lxml HTML解析器BeautifulSoup(markup, “lxml”)lxml XML解析器BeautifulSoup(markup, “xml”)html5libBeautifulSoup(markup, “...
解析库的学习小结(1)XPath学习 XPath学习常用匹配规则表达式描述nodename选取此节点的所有子节点/从当前节点选取直接子节点//从当前节点选取子孙节点.选取当前节点..选取当前节点的父节点@选取属性...
学习抓取猫眼电影排行 抓取目标https://maoyan.com/board/4猫眼电影TOP100的电影信息使用requests和正则表达式抓取分析站点url为https://maoyan.com/board/4,打开看到榜单信息等跳转第二页url变为https://maoyan.com/board/4?offset=10,第三页https://maoyan.com/board/4?offset=20,对...
正则表达式学习小结 常用语法表语法描述.匹配任何字符,除了换行符\w匹配总目,数字及下划线\W匹配不是字母,数字及下划线的字符\s匹配任意空白字符,等价于[\t\r\f]\S匹配任意非空字符\d匹配任意数字,等价于[0-9]\D匹配任意非数字的字符\A匹配字符串开头\b匹配·一个字边界, 即字与空格间的位置\B非字边界...
Requests的学习使用小结 基本用法1. GET请求基本案例import requestsr = requests.get('http://www.baidu.com')print(r.text)返回结果应该是一个H5的文档树另外,网页的返回类型实际上是str类型,但是它很特殊,是JSON 格式的。所以,如果想直接解析返回结果,得到一个字典格式的话,可以直接调用json()方法。import re...