![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
小点
文章平均质量分 90
MXuDong
假如有一天我变成了流氓,请告诉别人我曾经纯真过!
展开
-
global的作用以及使用方法
global的作用 在编写程序的时候,如果想为一个在函数外的变量重新赋值,并且这个变量会作用于许多函数中时,就需要告诉python这个变量的作用域是全局变量。此时用global语句就可以变成这个任务,也就是说没有用global语句的情况下,是不能修改全局变量的。使用global语句用global语句的使用方法很简单,基本格式是:关键字global,后跟一个或多个变量名>>...原创 2018-06-23 16:30:44 · 38415 阅读 · 1 评论 -
Python中关于URL的处理(基于Python2.7版本)
参考官方文档:https://docs.python.org/3/library/urllib.html点击打开链接1、 完整的url语法格式: 协议://用户名@密码:子域名.域名.顶级域名:端口号/目录/文件名.文件后缀?参数=值#标识2 、urlparse模块对url的处理方法 urlparse模块对url的主要处理方法有:urljoin/urlsplit/urlunsplit/urlp...原创 2018-07-15 09:27:59 · 9044 阅读 · 0 评论 -
Python中__repr__和__str__区别
看下面的例子就明白了class Test(object): def __init__(self, value='hello, world!'): self.data = value>>> t = Test()>>> t<__main__.Test at 0x7fa91c307190>>>> p...转载 2018-08-01 20:56:08 · 117 阅读 · 0 评论 -
Python3中的 jieba分词
jiebaGitHub地址:https://github.com/fxsjy/jieba参考地址:https://www.cnblogs.com/jiayongji/p/7119065.html中文分词对于NLP(自然语言处理)来说,分词是一步重要的工作,市面上也有各种分词库,11款开放中文分词系统比较。1.基于词典:基于字典、词库匹配的分词方法;(字符串匹配、机械分词法)2...原创 2018-08-02 11:36:46 · 3701 阅读 · 0 评论 -
单点登录原理与简单实现 以及单点登录的三种实现方式
单点登录原理与简单实现一、单系统登录机制1、http无状态协议 web应用采用browser/server架构,http作为通信协议。http是无状态协议,浏览器的每一次请求,服务器会独立处理,不与之前或之后的请求产生关联,这个过程用下图说明,三次请求/响应对之间没有任何联系 但这也同时意味着,任何用户都能通过浏览器访问服务器资源,如果想保护服务器的某些资源,必须限制浏览器...转载 2018-08-07 21:46:44 · 9716 阅读 · 0 评论 -
Python的Tqdm模块——进度条配置
tqdm官网地址:https://pypi.org/project/tqdm/Github地址:https://github.com/tqdm/tqdm简介 Tqdm 是一个快速,可扩展的Python进度条,可以在 Python 长循环中添加一个进度提示信息,用户只需要封装任意的迭代器 tqdm(iterator)。 总之,它是用来显示进度条的,很漂亮,使用...原创 2018-10-04 22:35:54 · 126993 阅读 · 19 评论 -
python随机数模块——random
近期遇到了一个很常见又不是很注意的随机数问题(随机数—>伪随机数),在这里特地的写下来作为提醒!随机数一般情况下我们直接使用random,但是random这个随机数有点假(伪随机),解析如下:Python3实现随机数random是用于生成随机数的,我们可以利用它随机生成数字或者选择字符串。 random.seed(x)改变随机数生成器的种子seed。 一般不必特别去设定see...原创 2018-11-17 17:12:28 · 731 阅读 · 0 评论 -
python计时模块——timeit
timeit模块: timeit 模块定义了接受两个参数的 Timer 类。两个参数都是字符串。 第一个参数是你要计时的语句或者函数。 传递给 Timer 的第二个参数是为第一个参数语句构建环境的导入语句。 从内部讲, timeit 构建起一个独立的虚拟环境, 手工地执行建立语句,然后手工地编译和执行被计时语句。 一旦有了 Timer 对象,最简单的事就是调用 timeit(),它...原创 2018-11-17 17:27:00 · 665 阅读 · 0 评论 -
Python3 configparse模块(配置)
Python3 configparse模块(配置)参考:https://www.cnblogs.com/bert227/p/9326313.html https://www.cnblogs.com/dion-90/p/7978081.htmlpython2: https://blog.csdn.net/zhouzhiwengang/article/details/723...原创 2018-12-02 14:44:28 · 802 阅读 · 0 评论 -
Python中常用的处理数据的方法——strip()函数
在python API中这样解释strip()函数:声明:s为字符串,rm为要删除的字符序列s.strip(rm) 删除s字符串中开头、结尾处,位于 rm删除序列的字符s.lstrip(rm) 删除s字符串中开头处,位于 rm删除序列的字符s.rstrip(rm) 删除s字符串中结尾处,位于 rm删除序列的字符注意:1. 当rm为空时,默认删除空白符(包括'\n...原创 2018-06-28 10:11:25 · 1497 阅读 · 0 评论 -
Python中常用的处理数据的方法——split()函数
函数:split()Python中有split()和os.path.split()两个函数,具体作用如下:split():拆分字符串。通过指定分隔符对字符串进行切片,并返回分割后的字符串列表(list)os.path.split():按照路径将文件名和路径分割开函数说明:1、split()函数语法:str.split(str="",num=string.count(str))[n]参数说明:str...原创 2018-06-28 10:02:00 · 1431 阅读 · 0 评论 -
selenium元素等待
元素等待:js代码执行渲染期间,导致数据/标签加载缓慢,如果元素没有加载完成,直接通过find_element去进行定位,会出现元素不存在的异常。3种方法:1. time.sleep(10) 强制性等待,不管元素在设置时间范围内是否加载出来,都必须要等待固定的时间。2. WebDriverWait(10) 智能等待的方法,最多等待10秒,10秒之后仍然没有元素,会抛出异常。10秒内找到这个元素,直...原创 2018-06-23 17:22:23 · 199 阅读 · 0 评论 -
python中group方法以及与groups的区别
python中的group方法group()在正则表达式中用于获取分段截获的字符串,解释如下代码(代码来自网络):import rea = "123abc456"print re.search("([0-9]*)([a-z]*)([0-9]*)",a).group(0) #123abc456,返回整体print re.search("([0-9]*)([a-z]*)([0-9]*)",a)....原创 2018-06-25 16:02:55 · 18563 阅读 · 1 评论 -
爬虫保存cookies时重要的两个参数(ignore_discard和ignore_expires)的作用
代码如下:(由于临时做的实例采用登录云打码平台的cookies)import requestsfrom lxml.html import etreefrom fake_useragent import UserAgentfrom http.cookiejar import LWPCookieJarfrom ydm import shibiesession = requests.Ses...原创 2018-06-19 21:02:10 · 3533 阅读 · 0 评论 -
for遍历列表——将遍历的结果赋给多个变量(元素是元组的列表的遍历)
list = ['11','21','31','41']for a in list: print(a)以上是正常的一般的遍历情况!!!如果想要遍历列表中元组分别赋给几个变量怎么办呢??第一种错误:list = ['11','21','31','41'] for a,b,c,d in list: print(a,b,c)结果:第二种错误:list = ['11','21',...原创 2018-07-03 08:53:49 · 16056 阅读 · 0 评论 -
MySQL数据库的异步写入
注意: 数据库pymysql的commit()和execute()在提交数据时,都是同步提交至数据库,由于scrapy框架数据的解析和异步多线程的,所以scrapy的数据解析速度,要远高于数据的写入数据库的速度。如果数据写入过慢,会造成数据库写入的阻塞,影响数据库写入的效率。通过多线程异步的形式对数据进行写入,可以提高数据的写入速度。使用twsited异步IO框架,实现数据的异步写入。代码中参数格...原创 2018-07-09 21:31:23 · 6590 阅读 · 0 评论 -
POST请求与GET请求(面试题)
一、原理区别一般我们在浏览器输入一个网址访问网站都是GET请求;再FORM表单中,可以通过设置Method指定提交方式为GET或者POST提交方式,默认为GET提交方式。HTTP定义了与服务器交互的不同方法,其中最基本的四种:GET,POST,PUT,DELETE,HEAD,其中GET和HEAD被称为安全方法,因为使用GET和HEAD的HTTP请求不会产生什么动作。不会产生动作意味着GET...原创 2018-07-09 23:05:56 · 3148 阅读 · 0 评论 -
Python中常用的处理数据的方法——replace()方法
replace()方法:描述: Python replace() 方法用于把字符串中指定的旧子字符串替换成指定的新子字符串,如果指定 count 可选参数则替换指定的次数,默认全部替换replace() 方法语法:S.replace(old,new[,count=S.count(old)])参数:old -- 指定的旧子字符串new -- 指定的新子字符串count -- 可选参数,...原创 2018-06-28 09:29:37 · 3372 阅读 · 0 评论 -
Python中常用的处理数据的方法——re.sub()函数 (正则表达式方面的函数)
re.sub的功能: re是regular expression的所写,表示正则表达式 sub是substitute的所写,表示替换; re.sub是个正则表达式方面的函数,用来实现通过正则表达式,实现比普通字符串的replace更加强大的替换功能; 举个最简单的例子: 如果输入字符串是:inputStr = "hello 111 world 111"需要将‘111’...原创 2018-06-28 09:50:36 · 16892 阅读 · 0 评论 -
Python中from from __future__ import *的用法
from __future__ import *参考:https://blog.csdn.net/zzc15806/article/details/81133045我们在读代码的时候,总是会看到代码开头会加上from __future__ import *这样的语句。这样的做法的作用就是将新版本的特性引进当前版本中,也就是说我们可以在当前版本使用新版本的一些特性。 开头加上from _...原创 2019-02-23 15:10:34 · 3152 阅读 · 0 评论