Python
mumu157
这个作者很懒,什么都没留下…
展开
-
解决python中module 'smtplib' has no attribute 'SMTP_SSL'报错问题
python使用邮件出现module 'smtplib' has no attribute 'SMTP_SSL'报错问题,通过安装相关依赖解决原创 2020-02-20 22:31:40 · 7976 阅读 · 2 评论 -
python中map函数的用法
map() 函数接收一个函数 f 和一个 list,并通过把函数 f 依次作用在 list 的每个元素上,得到一个迭代器并返回。需要注意的是,python2中返回的是一个list,但是python中返回的是一个iterator上代码 lis = [1,2,3,4] ite = map(str, lis) lis = list(ite) print(typ...原创 2019-03-03 20:19:49 · 5742 阅读 · 0 评论 -
python中divmod函数的用法
divmod() 函数把除数和余数运算结果结合起来,返回一个包含商和余数的元组divmod是内置函数,不需要导入,可以直接使用 >>> divmod(7,2) (3, 1) >>> divmod(9,2.5) (3.0, 1.5) #实际应用时可以这么写 carry, remainder = div...原创 2019-03-03 23:31:06 · 16591 阅读 · 0 评论 -
python的可变参数 *args 和关键字参数**kw
*args是非关键字参数,传入任意个参数不需要包含参数名,用于tuple**kw是关键字参数,传入任意个参数要带参数名,用于dict例子>>> def f(*args, **kw):... print('args= ',args) #args接收任意个不带参数名的参数... print('kw= ',kw) #kw接收任意个带参数名的参...原创 2019-03-06 21:40:33 · 413 阅读 · 0 评论 -
python中pickle模块的用法
在编程过程中,需要保存一些数据,例如机器学习中训练好的模型,下次使用直接调用即可,pickle模块就是起到这样一个保存模型的作用。pickle.dumps(obj) 将obj对象序列化为string形式pickle.loads(string) 从string中读出序列化前的obj对象>>> import pickle>>> li = [1...原创 2019-03-11 22:50:36 · 630 阅读 · 0 评论 -
用python发邮件
python集成了邮件功能,可以满足各种发邮件的需求,这里以SMTP协议和QQ邮箱为例原创 2019-03-25 21:12:35 · 272 阅读 · 0 评论 -
python中email模块的一些用法
1.parseaddr函数 email.utils.parseaddr(address)是模块中专门用来解析邮件地址的函数,返回一个tuplefrom email.utils import parseaddr>>> c=parseaddr('user<addr@163.com>')>>> type(c)<class 'tuple'...原创 2019-03-23 20:46:59 · 7837 阅读 · 0 评论 -
python自动推送更新的小说
目前在看一部连载小说,每天花时间查更新太麻烦了,毕竟也是学过爬虫的,用python写个小程序自动推送更新还不是美滋滋的原创 2019-03-24 08:36:19 · 1299 阅读 · 0 评论 -
sklearn的train_test_split函数的random_state
我们使用sklearn进行机器学习之前,一般使用train_test_split来进行数据集的分割,其参数random_state代表什么呢?>>>from sklearn.model_selection import train_test_split>>> x = [1,2,3,4,5,6,7,8,9,10]>>> y = [1,...原创 2019-04-11 17:04:21 · 11242 阅读 · 1 评论 -
re匹配中文字符
在进行匹配时常常需要用到re匹配中文字符原创 2019-04-28 10:07:33 · 4918 阅读 · 0 评论 -
使用Pandas库时显示不全(省略)的解决办法
原文:https://blog.csdn.net/weekdawn/article/details/81389865#显示所有列pd.set_option('display.max_columns', None)#显示所有行pd.set_option('display.max_rows', None)#设置value的显示长度为100,默认为50pd.set_option('max_c...转载 2019-04-25 10:55:57 · 1093 阅读 · 0 评论 -
jupyter notebook作图
1.使用matplotlib时显示图像%matplotlib# 跳出窗口生成一个Figure%matplotlib inline# 生在图像直接嵌入笔记2.显示中文plt.rc('font', family='SimHei', size=13)原创 2019-04-25 16:41:33 · 1873 阅读 · 0 评论 -
python中的reduce函数
reduce接受两个参数,第一个是一个函数,函数必须接受两个参数,第二个是序列,reduce把结果继续和序列的下一个元素做累积计算,效果如下: reduce(f, [x1, x2, x3, x4]) = f(f(f(x1, x2), x3), x4)举个栗子>>> from functools import reduce>>> reduce(l...原创 2019-03-05 23:36:45 · 1520 阅读 · 0 评论 -
python中list列表的一些操作
python中list的一些基础操作,包括切片、求和、去重、合并、排序、获取元素索引原创 2019-03-05 18:03:03 · 181 阅读 · 0 评论 -
第一篇博客
开始在MOOC系统学习一下爬虫,记录分享一下1.第一次写博客,测试用欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下...原创 2019-02-03 14:20:53 · 100 阅读 · 0 评论 -
Requests库的一些注意事项
1.Response对象r.text和r.content的区别: #r = requests.get("https://www.baidu.com")r.text 返回的是响应内容的字符串r.content 返回的是响应内容的二进制形式2.Response的编码问题:r.encoding:从返回对象的header中提取charset字段,存储为encoding;若charset不...原创 2019-02-03 18:01:48 · 362 阅读 · 0 评论 -
中英文混合输出时,中文对齐问题的解决
首先总结一下python中format函数的用法举个栗子{0}表示索引位置,:是提示符,+表示填充符号,默认是空格,^表示居中输出,&lt;表示左对齐,&gt;表示右对齐,默认左对齐10表示输出宽度,例子的长度是10看一个有中文的例子没对齐,加个制表符试试还是有问题,放大招:采用中文字符的空格填充 chr(12288)显然好了很多...原创 2019-02-04 12:34:04 · 6459 阅读 · 1 评论 -
Re库的一些使用记录
1.常用函数:re.search(pattern, string, flags = 0): 返回第一个匹配对象re.match(): 从开始匹配,赶回第一个匹配对象re.findall():返回所有匹配对象re.split():按匹配结果分割,返回匹配对象re.finditer():返回匹配对象列表re.sub(): 替换匹配对象pattern:正则表达式字符串,string:被...原创 2019-02-04 17:54:54 · 410 阅读 · 0 评论 -
Python中实现输出进度条
\r 默认将指针返回到最开始后输出(在原位置再次输出),利用此特性可以实现进度条的功能:看看代码 import time for i in range(100): time.sleep(0.5) print('\r'+'▇'*(i//2)+str(i)+'%', end='')看看效果2.改编一下,实现类似转圈的功能上代码: import ...原创 2019-02-04 19:11:50 · 4978 阅读 · 0 评论 -
Scrapy学习
1.爬虫框架结构- 5+2结构:Engine:框架核心,控制模块之间的数据流,根据条件触发事件Downloader:根据请求下载网页Scheduler:对爬取请求进行调度管理Spider:框架核心,解析Downloader返回的响应,生成提取信息和新的请求,需要用户编写配置代码Item Pipelines:清洗、检验和存储数据,需要用户编写配置Downloader Middlewar...原创 2019-02-06 15:58:03 · 280 阅读 · 0 评论 -
爬虫中遇到&nsbp的解决办法
1.为什么用 &nsbp ?在html代码中每输入一个转义字符&nbsp就表示一个空格,输入十个&nbsp,页面中就显示10个空格位置。而在html代码中输入空格,不管输入多少个空格,最终在页面中显示的空格位置只有一个。2.爬虫中如何去除?i.replace(u’\xa0’, ’ ')u以u或U开头的字符串表示unicode字符串Unicode是书...原创 2019-02-07 21:57:55 · 4232 阅读 · 0 评论 -
Scrapy 爬取百度贴吧全站图片
用scrapy写一个爬取百度贴吧的爬虫,以壁纸吧为例。进入壁纸吧,审查元素,找到所有的帖子链接,获取帖子链接代码:results = response.css(&quot;.threadlist_lz.clearfix a::attr(href)&quot;).extract()进入帖子审查元素,获取帖子内所有图片的链接和帖子名称,存入item代码item['url'] = respons...原创 2019-02-18 19:46:29 · 463 阅读 · 0 评论 -
python中的json.dumps()和json.loads()
一、概念理解1、json.dumps()和json.loads()是json格式处理函数(可以这么理解,json是字符串) (1)json.dumps()函数是将一个Python数据类型列表进行json格式的编码(可以这么理解,json.dumps()函数是将字典转化为字符串) (2)json.loads()函数是将json格式数据转换为字典(可以这么理解,json.load...转载 2019-02-13 14:29:59 · 80426 阅读 · 0 评论 -
Numpy中axis参数的用法
numpy.mean(a, axis=0)axis=0表示按列求平均,axis=1表示按行求平均axis没有指定参数时表示所有值的平均举个栗子: import numpy arr = ([1,2], [3,4], [5,6]) arr = numpy.mean(arr) print(arr) arr = numpy.mean(arr, axis...原创 2019-02-25 14:29:58 · 474 阅读 · 0 评论 -
python中enumerate() 函数用法
enumerate() 函数用于将一个可遍历的数据对象返回数据和数据下标用法: enumerate(sequence, [start=0]) #start表示下标起始位置实例&amp;gt;&amp;gt;&amp;gt; nums = [1, 3, 5, 7]&amp;gt;&amp;gt;&amp;gt; list(enumerate(nums))[(0, 1), (1, 3)原创 2019-03-04 23:39:45 · 1363 阅读 · 0 评论 -
解决 tesserocr报错 Failed to init API, possibly an invalid tessdata path :G:\Anaconda3
把tessdata拷贝到对应目录下即可解决问题原创 2018-12-17 20:24:24 · 1023 阅读 · 0 评论