- 博客(10)
- 收藏
- 关注
原创 Linux服务器离线安装python3.7(pip3自动安装)实操记录
1、官网下载python3.7安装包、zlib安装包2、将安装包放在服务器上,cd到安装包目录3、先安装zlibtar -zxvf zlib-1.2.13.tar.gzcd zlib-1.2.13./configuremakesudo make install注:如果执行sudo make install 指令时提示:XXX(用户名) is not in the sudoers file原因:当前用户没有加入到sudo的配置文件中解决方案:切换换到root用户,编辑配置文件v
2023-06-22 08:47:33 1691 1
原创 1、图形使用(柱状图)记录
import numpy as npimport pandas as pdimport randomimport matplotlib.pyplot as plt#随机100名1-10岁儿童ages=[random.randrange(1,11) for x in range(100)]#随机性别sex=[''.join(random.sample(('male','female'),1)) for x in range(100)]df=pd.DataFrame([x for x in ra
2020-10-10 00:12:35 173 1
原创 正则表达式
正则表达式 regex1、表达一位数字字符:\d\d 是一个正则表达式, 表示一位数字字符,即任何一位 0 到 9 的数字。1234-123-1234:\d\d\d\d-\d\d\d-\d\d\d\d字符分类 [0-5] 只匹配数字 0 到 52、数字匹配模式多次:\d{n}1234-123-1234:\d\d\d\d-\d\d\d-\d\d\d\d=\d{4}-\d{3}-\d{4}3、括号分组:(\d{3})-(\
2020-09-08 23:57:40 1194
原创 python记录之程序打包成可执行文件exe
记录下使用pyinstaller将.py打包成可执行文件(.exe)过程1、安装pyinstallerpip installpyinstaller2、执行打包操作打开cmd进入.py存放的目录下 ,执行以下命令:pyinstaller -F File.pypyinstaller -F FileList.specFile.py要打包的文件打包过程中可能遇到的报错(尤其使用到pandas时)RecursionError: maximum recursion depth ...
2020-07-05 14:16:40 179
原创 pandas记录之端午节的淘宝粽子交易分析
1、列名中有空格去除空格strip():删除字符串前后的空白;lstrip():删除字符串前面(左边)的空白;rstrip():删除字符串后面(右边)的空白。这三个方法只是返回空白被删除之后的副本,没改变字符串本身2、价格为string,必有非数值数据,付款人数71行缺失数据,发货地址3行缺失数据未完待续,持续更新...
2020-07-01 23:59:22 205
原创 pandas记录之时间序列
生成时间序列pd.data_range(start/end/periods(个数)/freq(间隔) 参数4选3pd.date_range(start='20200101',periods=3,freq='D')Out[3]:DatetimeIndex(['2020-01-01', '2020-01-02', '2020-01-03'], dtype='datetime64[ns]', freq='D')pd.date_range(start='20200101',periods=3,freq.
2020-06-29 23:57:43 120
原创 pandas记录之分类数据
数据分组标签化pd.cut(data,bins,labels=lable)需对数据进行分组时比较实用pd.cut(np.random.randint(0,60,5), [0,10,30,60], right=False, labels=['0-10区间','10-30区间','30-60区间'])Out[4]:[30-60区间, 30-60区间, 30-60区间, 10-30区间, 30-60区间]Categories (3, object): [0-10区间 < 10-30区间 <.
2020-06-27 13:26:54 143
原创 pandas记录之文本数据
特殊字符数据在收集的过程中由于各种原因,汇总的数据会出现一些出乎预料的问题#数据中有特殊字符309 0-396 9`485 /7Name: col2, dtype: string在进行数值统计时很头痛,一般情况下就是根据报错信息逐个replacedf.loc[df['col2'].str.contains('0-'),'col2']='0'df.loc[df['col2'].str.contains('9`'),'col2']='9'一个两个还好,第三个出现时,已.
2020-06-26 23:49:41 196
原创 pandas记录之缺失数据
数据读取(带数据类型)import pandas as pddf=pd.read_csv('data/Missing_data_two.csv').convert_dtypes()df.info()<class 'pandas.core.frame.DataFrame'>RangeIndex: 36 entries, 0 to 35Data columns (total 6 columns): # Column Non-Null Count Dtype --- -.
2020-06-22 23:47:08 1017
原创 大量表格数据(>10万条)快速导入Oracle
因工作原因,需要将几十万条表格数据整理并导入Oracle数据库中,数据通过Python整理后,原计划通过python直接写入数据库中,因数据库连接不稳定,考虑到数据库连接会中断,用python按条写入,执行效率较低(个人python能力有限),预计十几万条数据全部写完,至少几个小时,效率太低,在网上查到一个觉得比较快的方法(100万条数据,一分钟大概写入1万条数据,且未受服务器连接不稳定的影响),...
2020-04-22 23:31:53 1633 3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人