python常用模块
jia666666
生活本无趣,有趣的是人
展开
-
爬虫辅助工具--headersformat
爬虫辅助工具--headersformat原创 2022-09-15 10:43:56 · 1632 阅读 · 0 评论 -
Python之re模块
一、正则表达式 re模块是python独有的匹配字符串的模块,该模块中提供的很多功能是基于正则表达式实现的,而正则表达式是对字符串进行模糊匹配,提取自己需要的字符串部分,他对所有的语言都通用。注意: re模块是python独有的 正则表达式所有编程语言都可以使用 re模块、正则表达式是对字符串进行操作 因为,re模块中的方法大都借助于正则表达式,故先学习正则表达式。 (一)常用正则 1、 字符组 在同一个位置可能出现的各种字符组成了一个字符组,在正则表达式中用[]表示 正则 待匹配字符转载 2020-08-09 12:21:49 · 517 阅读 · 0 评论 -
PIL模块使用范例
基础用法 from PIL import Image """ mode : 返回图像的模式,常用模式有: L (luminance) 灰度图像,8位像素,表示黑和白 RGB 3x8位像素,为真彩色图像 RGBA 4x8位像素,有透明通道的真彩色 CMYK 4x8位像素,颜色分离,出版图像 P 8位像素,使用调色板映射到其他模式 1 1位像素,表示黑和白,但是存储的时候每个像素存储为8bit YCbCr:3x8位像素,彩色视频格式 I 32位整原创 2020-07-29 19:01:12 · 374 阅读 · 0 评论 -
Request模块(快速上手)
Request模块的安装 快速上手 发送请求 传递 URL 参数 响应内容 二进制响应内容 JSON 响应内容 原始响应内容 定制请求头 更加复杂的 POST 请求 POST一个多部分编码(Multipart-Encoded)的文件 警告 响应状态码 响应头 Cookie 重定向与请求历史 超时 错误与异常 Request模块的安装 在cmd中,使用如下指令安装req...原创 2018-08-26 13:40:24 · 958 阅读 · 0 评论 -
Beautiful Soup模块详解
【目录】 1 Beautiful Soup 1.1 安装与基础配置 1.2 基本操作 2. 对象的种类 2.1 Tag 2.1.1 Name 2.1.2 Attributes 2.1.3 多值属性 2.2 NavigableString 2.3 BeautifulSoup 2.4 Comment 3. 遍历文档树 3.1 子节点 3.1.1 tag的名字 3.1.2 .cont...转载 2018-08-27 10:32:41 · 3864 阅读 · 1 评论 -
PyQuery库详解
##前言 PyQuery库也是一个非常强大又灵活的网页解析库,如果你有前端开发经验的,都应该接触过jQuery,那么PyQuery就是你非常绝佳的选择,PyQuery 是 Python 仿照 jQuery 的严格实现。语法与 jQuery 几乎完全相同,所以不用再去费心去记一些奇怪的方法了。 >官网地址:http://pyquery.readthedocs.io/en/latest/ j...转载 2018-08-27 16:43:42 · 366 阅读 · 0 评论 -
selenium用法详解
selenium用法详解 selenium主要是用来做自动化测试,支持多种浏览器,爬虫中主要用来解决JavaScript渲染问题。 模拟浏览器进行网页加载,当requests,urllib无法正常获取网页内容的时候 一、声明浏览器对象 注意点一,Python文件名或者包名不要命名为selenium,会导致无法导入 from selenium import webdriver #w...原创 2018-08-27 17:52:15 · 413 阅读 · 0 评论 -
json模块实例详解
Python: Json实例 JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。 数据格式可以简单地理解为键值对的集合(A collection of name/value pairs)。不同的语言中,它被理解为对象(object),纪录(record),结构(struct),字典(dictiona...转载 2018-08-28 21:40:10 · 675 阅读 · 0 评论 -
OS模块详解
OS常见函数列表 函数 描述 os.sep 取代操作系统特定的路径分隔符 os.name 指示你正在使用的工作平台。比如对于Windows,它是’nt’,而对于Linux/Unix用户,它是’posix’。 os.getcwd 得到当前工作目录,即当前python脚本工作的目录路径。 os.getenv()和os.putenv 分别...原创 2018-08-28 20:01:08 · 635 阅读 · 0 评论 -
urlib模块
【目录】 1、最简单 2、使用 Request 3、发送数据 4、发送数据和header 5、http 错误 6、异常处理1 7、异常处理2 8、HTTP 认证 9、使用代理 10、超时 11.自己创建build_opener 12.urlib.resquest.urlretrieve远程下载 13.post请求 14.cookie的使用 1.获取Cookie保存到变量 2.保存co...原创 2018-08-27 11:02:27 · 404 阅读 · 0 评论 -
正则表达式(二)
正则表达式的简单应用 #导入相关的包 import re #查找数字 #r表示字符串不转义 p=re.compile(r'\d+')#数字多次出现 #在字符串hgfhdfhk354563546354674中查找,按照规则p制定的正则进行查找 #返回结果是None表示没有找到,否则会返回match对象 #match把字符串当做一个整体,查看是否满足正则要求 m=p.match('hgfhd...原创 2018-08-06 21:19:11 · 290 阅读 · 1 评论 -
正则表达式(一)
正则表达式 引言: 正则表达式(regular expression)就是用一个“字符串”来描述一个特征,然后去验证另一个“字符串”是否符合这个特征。比如 表达式“ab+” 描述的特征是“一个 ‘a’ 和 任意个 ‘b’ ”,那么 ‘ab’, ‘abb’, ‘abbbbbbbbbb’ 都符合这个特征。 正则表达式可以用来: 验证字符串是否符合指定特征,比如验证是否是合法的邮件...转载 2018-08-06 19:26:39 · 688 阅读 · 1 评论