- 博客(25)
- 收藏
- 关注
原创 Python每日一记120>>>按条件筛选列表元素
关于条件列表中进行条件筛选元素,最近开始我们使用的方法是for循环,把满足条件的装进一个列表,但是这样不简洁,且速度慢。那么我们其实可以使用列表解析和filter函数import pandas as pdimport numpy as npimport reimport timefrom random import randint#生成一个随机列表,注意for _ in np.ara...
2019-07-31 17:05:49 1299
转载 Python每日一记119>>>pycharm常用快捷键
总感觉有些时候pycharm使用的时候不是那么顺手,于是网上看了下快捷键的使用最常用的如下链接:https://jingyan.baidu.com/article/636f38bb80e824d6b9461040.html更多的查看以下链接:https://www.cnblogs.com/liangmingshen/p/9297381.html...
2019-07-31 12:01:06 81
原创 Python每日一记118>>>join方法连接字符串
一个列表中含有多个字符串,将其连接成一个字符串,那么我们使用循环相加+就能解决,但是问题是,循环会浪费大量的内存,时间就会被浪费,因为每次相加就会新建一个变量。jion方法则不会出现这个问题。import pandas as pdimport numpy as npimport reimport timea=list(map(lambda x:str(x),np.arange(0,10...
2019-07-31 10:55:07 266
原创 Python每日一记117>>>分割含有多个分割符的字符串
我们知道用split按照单个分隔符分割一个字符串,如果要分割含有多个分割符的字符串,那么我们可以再次分割,直到分割完毕。但是这样显得麻烦,因此呢我们可以使用正则表达的的split方法解决。import pandas as pdimport numpy as npimport rea='abc\hf%aj$$kfh@kij#kf/hak'#正则表达式的方法,[]代表取其中任一个,+表示一...
2019-07-31 10:34:56 169
原创 Python每日一记116>>>递归创建图表(以箱线图为例)
问题:怎么样在数据量一定的情况下,循环画出合适数量的画布,合适数量的子图?源数据如下:问题描述:有两个excel,分别是2019年各部类的消费时间间隔,2018年的各部类消费时间间隔,我想要将2019和2018的各个部类对应画箱线图,如下:问题在于,我要怎么设置每个画布画几个箱线图呢,当然画几个不是难事,问题在于就算知道,难道将源数据分为几个数据,再分别画在几个画布上画几个子图?现...
2019-07-28 14:37:36 299
转载 Python每日一记115>>>关于正则表达式
正则表达式很很重要!以下整理主要知识与相关文章1、正则表达式https://blog.csdn.net/qq744746842/article/details/48423435https://blog.csdn.net/weixin_40907382/article/details/796543722、正则表达式优先级https://blog.csdn.net/dongcheng_/a...
2019-07-27 15:09:17 133
原创 Python每日一记114>>>替换不能用于文件名的字符
因为要循环一些品牌名,并将其作为工作表名字保存,但是循环到一些品牌之后就出现问题了,因为windows明明规则不能包括/\:*?"<>|查找资料,得到结果import rea='1/\:*?"<>|2|*?'print(re.sub(r'[\/\\\:\*\?\"\<\>\|]','', a))#只要存在特殊字符中的一个就替换为空后期将会深入学...
2019-07-26 17:58:32 365
原创 Python每日一记113>>>TypeError: can only concatenate list (not "int") to list
遇到小问题如下:如果想要得到一一对对应的x,y
2019-07-20 00:06:51 2828
转载 Python每日一记112>>>matplotlib次坐标轴和翻转坐标轴
因为量纲不同我们需要用到次坐标轴,因为想要表达方式不同我们需要用到翻转坐标轴,因为就学习了一下1、次坐标轴这里需特别注意,纵坐标的次坐标用twinx(),横坐标的次坐标用twiny()import pandas as pdimport numpy as npimport matplotlib.pyplot as pltx=np.linspace(1,10,10)y1=2*x+1y2...
2019-07-19 23:58:06 4945
原创 Python每日一记111>>>matplotlib复杂子图创建
关于很规矩的子图设置,我们利用以下代码就能创建:import matplotlib.pyplot as pltimport numpy as npimport matplotlib.gridspec as gridspx=np.linspace(-5,5,10)y1=x+1y2=2*x+1y3=3*x+1y4=4*x+1plt.figure()#创建图plt.subplot(...
2019-07-19 10:58:44 184
原创 Python每日一记110>>>关于matplotlib作图的颜色
我们当然会用color参数为图形设置颜色,但是问题在于那么多颜色我们怎么找出那个最合适,最好看的颜色呢?答案是:没有捷径,除非你是专业配色的,知道数字对应的颜色,但是呢也是有小技巧的。好了,先来看看颜色的几种方式1、color=‘red’,直接赋值颜色名字2、color=‘RGB’,如color=‘1,1,1’3、color=’#0f0f0f’,十六进制颜色其中RGB和十六进制颜色我们...
2019-07-18 23:45:30 327
原创 Python每日一记109>>>matplotlib数据标注
想要为数据加上数据标签,可以灵活使用text,这个其实也可以标注任何文字直接上代码了:import matplotlib.pyplot as pltimport numpy as npx=np.linspace(-5,5,10)y=2*x+1plt.figure()#创建图plt.bar(x,y,color='cyan')for x1,y1 in zip(x,y): if ...
2019-07-18 23:35:38 618
原创 Python每日一记108>>>matplotlib坐标轴设置相关知识
直接上代码了:import matplotlib.pyplot as pltimport numpy as npx=np.linspace(-5,5,10)y=2*x+1plt.figure()#创建图plt.plot(x,y)plt.xlim((-5,5))#设置x轴范围plt.ylim((-5,5))#设置y轴范围plt.xticks([1,2,3,4,5,6],['a','...
2019-07-18 20:11:46 210
原创 Python每日一记107>>>会员数据分析之RFM模型实现
RFM模型:R:最近一次消费时间,常用时间基准减上次消费时间的间隔表示F:消费频次M:消费金额计算得到三个指标后,进行整合计算,可以直接相加,或者加权的方式,但是首要的任务是计算RFM的三个指标源数据如下:因为时间不是日期,但是交易次数要按天数计算,因此要转化数据,变成一个卡号对应日期和金额,也就是说要汇总。好了直接上代码了import pandas as pdimport nu...
2019-07-17 11:28:14 1129 2
原创 Python每日一记106>>>函数中*args 和**kwargs的用法
之前有了解过自定义函数中,参数使用*args 和**kwargs的用法,其实非自定义函数中,也就是所有函数中,我们都可以这样传入参数,昨天切实感受到了这样做的便利性。简单来说,*args 代表传入一个元祖,**kwargs表示传入一个字典。接下来,看看厉害一点的:好了接下来最酷的地方来了:...
2019-07-16 18:05:51 111
原创 Python每日一记105>>>matpoltlib描述数据分布情况之箱线图和直方图
如果要画描述数据分布的图,那么直方图和箱线图是个不错的选择。excel2016版本之前不能画直方图和箱线图!!!这里简单的说一下,直方图适合于看单列数据分布情况,很直观,箱线图适合对多列数据进行对比,对比其分布情况。直接上代码了:如果要查看具体的参数:关于柱状图(或条形图)和直方图的区别,参考一下链接,记住直方图描述连续性数据分布情况,柱状图对分类数据进行可视化,每个类别对应一个...
2019-07-16 10:47:30 535
原创 Python每日一记104>>>pandas条件筛选时出现的小问题
FutureWarning: elementwise comparison failed; returning scalar instead, but in the future will perform elementwise comparisonresult = method(y)以上问题,及解决方法:要记住,Python很聪明,但是呢,有时也是会出现无法识别的问题,因此最好明确的告诉...
2019-07-13 14:36:57 5899 3
原创 Python每日一记103>>>TypeError: Index(...) must be called with a collection of some kind, '卡号' was passed
准确的说,dropna中的subset接受的值必须是array顺便说一下,drop_duplicates(subset=""),接受的值可以是string,或者sequnence。也就是说,当只有某一列时,可以subset=“卡号”,并不必须是subset=【“卡号”】...
2019-07-12 22:20:48 1622
原创 Python每日一记102>>>异常try....except语句
未来得路将会孤独前行,愿其他人、事都好,便是晴天。接下来简单得记录一下异常处理,在没有接触到try…except语句之前,大概的异常处理还停留在if -----else—语句来进行判断,但是很多异常可能根本就不是if—else能解决的,因为很多异常可能根本无法用if判断,无法返回真假,另外如果需要考虑的异常很多,那就很可能嵌套很多if语句,那除非你有超强的编程能力,否则很有可能出现错误的。但是...
2019-07-08 20:13:01 333
原创 Python每日一记101>>>shutil模块压缩与解压缩以及同文件路径压缩多个压缩文件的问题
好啦,101-200的文章阶段记录开始啦,新的开始,加油!上一篇文章写到了递归遍历所有文件,提到了压缩包的问题,现在就来介绍一下:python解压缩文件常用shutil模块直接上代码:压缩文件内多个压缩文件!!!!如果我们不将压缩文件放置在本路径下:现在假设我们就放在源路径下,我们看看解压缩的情况我们点开这个压缩文件看一看:接下来我们将解压缩出来的解压缩文件再次...
2019-07-07 12:14:11 363
原创 Python每日一记100>>>遍历目录下的所有文件(多层次)的两种方法以及os.walk深度理解
这是自己的第100篇文章,还是给自己一个鼓励,从零基础做到现在这样,自己还是很开心的,希望以后继续保持,最好能保持到老,直到老的眼花,手抖,那个时候回想起来,不知会不会别有一番滋味。好了接下来记录一下遍历目录下的所有文件的两种方法:第一种方法利用递归算法;第二种方法利用os.walk()方法。源数据如下:我要返回所有的最终文件,包括的路径、扩展名,注意时最终文件记录两个方法之前先记录一下...
2019-07-07 02:28:28 971
原创 Python每日一记99>>>TypeError: Index(...) must be called with a collection of some kind, 1 was passed错误解决
今天实践中突然遇到问题,简单记录一下:其实,index对象包括index和columns,必须要是集合类型的,可以是{},[],,也就是说,上述案例也可以columns={1},但是不能是元祖columns=(1)。...
2019-07-06 20:38:08 16841
原创 Python每日一记98>>>利用二进制实现图片读取与拷贝
今天休假一天,开心。看到一篇是视频,利用二进制实现图片的读取和拷贝,这里就简单的记录一下。首先需要理解的是什么是文本文件,什么是二进制文件:文本文件就是可以用记事本打开,且不出现乱码的文件,非文本文件就是无法用记事本打开,或者打开出现乱码的文件,而这再一定程度上可以理解为是二进制文件,需要注意的是,word文档不是文本文件,因为利用记事本打开会出现乱码。我们的图片也是一个二进制文件接...
2019-07-05 11:42:16 1304
原创 Python每日一记97>>>如何更好的推送营销信息给会员
在公司上晚班,听着音乐,学习python,想要解决更好的为会员推送营销信息,并增加会员回店率。要解决这个问题,就需要解决在某个时间点,会员之前的最近一次消费与这个时间点的间隔。原数据包括:...
2019-07-04 23:45:06 142
原创 Python每日一记96>>>文件操作之中文乱码问题
直接上代码为了深入的理解,我们还是做一个图,看看到底出现了什么问题:关于各种编码的类型,大家可以去自行百度,以下给一篇参考链接https://blog.csdn.net/zxh2075/article/details/53064160最后如果以后学习中出现了乱码问题,就要进行解码再编码的处理了。...
2019-07-04 10:32:09 79
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人