![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pandas
数据加工者
这个作者很懒,什么都没留下…
展开
-
1、图形使用(柱状图)记录
import numpy as npimport pandas as pdimport randomimport matplotlib.pyplot as plt#随机100名1-10岁儿童ages=[random.randrange(1,11) for x in range(100)]#随机性别sex=[''.join(random.sample(('male','female'),1)) for x in range(100)]df=pd.DataFrame([x for x in ra原创 2020-10-10 00:12:35 · 184 阅读 · 1 评论 -
正则表达式
正则表达式 regex1、表达一位数字字符:\d\d 是一个正则表达式, 表示一位数字字符,即任何一位 0 到 9 的数字。1234-123-1234:\d\d\d\d-\d\d\d-\d\d\d\d字符分类 [0-5] 只匹配数字 0 到 52、数字匹配模式多次:\d{n}1234-123-1234:\d\d\d\d-\d\d\d-\d\d\d\d=\d{4}-\d{3}-\d{4}3、括号分组:(\d{3})-(\原创 2020-09-08 23:57:40 · 1250 阅读 · 0 评论 -
python记录之程序打包成可执行文件exe
记录下使用pyinstaller将.py打包成可执行文件(.exe)过程1、安装pyinstallerpip installpyinstaller2、执行打包操作打开cmd进入.py存放的目录下 ,执行以下命令:pyinstaller -F File.pypyinstaller -F FileList.specFile.py要打包的文件打包过程中可能遇到的报错(尤其使用到pandas时)RecursionError: maximum recursion depth ...原创 2020-07-05 14:16:40 · 187 阅读 · 0 评论 -
pandas记录之端午节的淘宝粽子交易分析
1、列名中有空格去除空格strip():删除字符串前后的空白;lstrip():删除字符串前面(左边)的空白;rstrip():删除字符串后面(右边)的空白。这三个方法只是返回空白被删除之后的副本,没改变字符串本身2、价格为string,必有非数值数据,付款人数71行缺失数据,发货地址3行缺失数据未完待续,持续更新...原创 2020-07-01 23:59:22 · 213 阅读 · 0 评论 -
pandas记录之时间序列
生成时间序列pd.data_range(start/end/periods(个数)/freq(间隔) 参数4选3pd.date_range(start='20200101',periods=3,freq='D')Out[3]:DatetimeIndex(['2020-01-01', '2020-01-02', '2020-01-03'], dtype='datetime64[ns]', freq='D')pd.date_range(start='20200101',periods=3,freq.原创 2020-06-29 23:57:43 · 125 阅读 · 0 评论 -
pandas记录之分类数据
数据分组标签化pd.cut(data,bins,labels=lable)需对数据进行分组时比较实用pd.cut(np.random.randint(0,60,5), [0,10,30,60], right=False, labels=['0-10区间','10-30区间','30-60区间'])Out[4]:[30-60区间, 30-60区间, 30-60区间, 10-30区间, 30-60区间]Categories (3, object): [0-10区间 < 10-30区间 <.原创 2020-06-27 13:26:54 · 160 阅读 · 0 评论 -
pandas记录之文本数据
特殊字符数据在收集的过程中由于各种原因,汇总的数据会出现一些出乎预料的问题#数据中有特殊字符309 0-396 9`485 /7Name: col2, dtype: string在进行数值统计时很头痛,一般情况下就是根据报错信息逐个replacedf.loc[df['col2'].str.contains('0-'),'col2']='0'df.loc[df['col2'].str.contains('9`'),'col2']='9'一个两个还好,第三个出现时,已.原创 2020-06-26 23:49:41 · 206 阅读 · 0 评论 -
pandas记录之缺失数据
数据读取(带数据类型)import pandas as pddf=pd.read_csv('data/Missing_data_two.csv').convert_dtypes()df.info()<class 'pandas.core.frame.DataFrame'>RangeIndex: 36 entries, 0 to 35Data columns (total 6 columns): # Column Non-Null Count Dtype --- -.原创 2020-06-22 23:47:08 · 1023 阅读 · 0 评论