python
落魚京
5YGa5bCx5a6M5LqL
展开
-
Re正则表达式
官方文档 https://docs.python.org/zh-cn/3/library/re.html 简介 正则表达式,就是使用普通字符(大小写字母、数字···)、转义字符、特殊字符(. * ? + ^ $ [] {} ())组成一个规则,用这个规则对文本的类容完成一个搜索或匹配或替换的功能。 基本语法 import re # 定义字符串 a='doitbyyourself666' # 定义正则表达式 reg='yourself' # 调用正则函数方法 res=re.findall(reg,a)[0]原创 2021-08-11 19:14:18 · 124 阅读 · 0 评论 -
BeautifulSoup爬网页
第三方库 pip install bs4 pip install reaqusts pip install lxml 审源码 脚本 import json import requests from bs4 import BeautifulSoup # 1.定义请求的url和请求头 url = 'https://old.lmonkey.com/t' headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/原创 2021-08-09 22:31:38 · 127 阅读 · 0 评论 -
Xpath实战运用
import requests from lxml import etree #封装类 class GO(): loginurl = 'https://www.abc.com/login' orderurl = 'https://www.abc.com/my/order' headers = {'User-Agent':' '} # 请求对象 req = None # token口令 token = '' #订单号 ordercode = 0 #初始化方法 def _init_(self): #请原创 2021-08-09 16:51:04 · 106 阅读 · 0 评论 -
requests基本使用
res=requests.get(url=‘http://www.baidu.com/’) print(res) # <Response [200]> 状态 print(res.status_code) #200 请求状态码 print(res.content) # b'....' 二进制的文本流 print(res.text)# 获取相应类容 print(res.url)#请求url地址 print(res.request.headers)#请求的头信息 print(res.header原创 2021-08-07 22:08:32 · 90 阅读 · 0 评论 -
python 循环语句小结
** python3 循环 ** for\while while循环 格式注意 while counter <= n:#结尾输入':' 无限循环 可以使用 CTRL+C 来退出当前的无限循环 else使用 while <a>:#条件语句为false时执行else <statement(s)> else: <additional_statement(s)> for语句 一般格式 在这里插入代码片 ...原创 2020-12-04 16:27:52 · 133 阅读 · 0 评论 -
python 运算符-小结
‘//’ 取整除 c**=a等效c=c**a ‘>>’ 运算数的各二进制位全部左移若干位 eg. a=0011 1100 a>>2=0000 1111 ‘~’ 按位反转原创 2020-11-26 21:39:36 · 123 阅读 · 0 评论 -
python3 基本数据类型-小结
python3 基本数据类型 python变量不需要申明 使用前必需赋值 无类型 (=)用来给变量赋值 实例 多个变量赋值 标准数据库类型 不可变数据:Number,String,Tuple 可变数据:List,Dictionary,Set Number 支持类型:int\float\bool\complex 查询变量所指的对象类型->type() 用isinstance判断 “//”返回不大于结果的最大整数 del语句 String 字符串的截取语法格式在这里插入代码片原创 2020-11-25 18:34:51 · 139 阅读 · 0 评论