xytwo
码龄6年
关注
提问 私信
  • 博客:1,670
    1,670
    总访问量
  • 7
    原创
  • 1,791,998
    排名
  • 0
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2018-10-27
博客简介:

qq_43533532的博客

查看详细资料
个人成就
  • 获得1次点赞
  • 内容获得0次评论
  • 获得1次收藏
创作历程
  • 7篇
    2019年
成就勋章
TA的专栏
  • python
    1篇
  • 一步一步
    2篇
  • 网络爬虫
    2篇
  • 配置
  • 解析库
    3篇
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

数据储存学习小结(1)文件储存

TXT文本储存# 保存知乎上“发现”页面的“热门话题”的问题与答案import requestsfrom pyquery import PyQuery as pqurl = 'https://www.zhihu.com/explore'headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) App...
原创
发布博客 2019.01.31 ·
215 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

解析库的学习小结(3)pyquery学习

pyquery初始化字符串初始化html = '''<div><ul><li class="item-O">first item</li><li class="item-1"><a
原创
发布博客 2019.01.31 ·
149 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

解析库的学习小结(2)bs4学习

BeautifulSoup解析器使用方法python标准库BeautifulSoup(markup, “html.parser”)lxml HTML解析器BeautifulSoup(markup, “lxml”)lxml XML解析器BeautifulSoup(markup, “xml”)html5libBeautifulSoup(markup, “...
原创
发布博客 2019.01.30 ·
188 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

解析库的学习小结(1)XPath学习

XPath学习常用匹配规则表达式描述nodename选取此节点的所有子节点/从当前节点选取直接子节点//从当前节点选取子孙节点.选取当前节点..选取当前节点的父节点@选取属性...
原创
发布博客 2019.01.30 ·
206 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

学习抓取猫眼电影排行

抓取目标https://maoyan.com/board/4猫眼电影TOP100的电影信息使用requests和正则表达式抓取分析站点url为https://maoyan.com/board/4,打开看到榜单信息等跳转第二页url变为https://maoyan.com/board/4?offset=10,第三页https://maoyan.com/board/4?offset=20,对...
原创
发布博客 2019.01.29 ·
353 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

正则表达式学习小结

常用语法表语法描述.匹配任何字符,除了换行符\w匹配总目,数字及下划线\W匹配不是字母,数字及下划线的字符\s匹配任意空白字符,等价于[\t
\r\f]\S匹配任意非空字符\d匹配任意数字,等价于[0-9]\D匹配任意非数字的字符\A匹配字符串开头\b匹配·一个字边界, 即字与空格间的位置\B非字边界...
原创
发布博客 2019.01.29 ·
207 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Requests的学习使用小结

基本用法1. GET请求基本案例import requestsr = requests.get('http://www.baidu.com')print(r.text)返回结果应该是一个H5的文档树另外,网页的返回类型实际上是str类型,但是它很特殊,是JSON 格式的。所以,如果想直接解析返回结果,得到一个字典格式的话,可以直接调用json()方法。import re...
原创
发布博客 2019.01.28 ·
350 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏