自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 Linux服务器离线安装python3.7(pip3自动安装)实操记录

1、官网下载python3.7安装包、zlib安装包2、将安装包放在服务器上,cd到安装包目录3、先安装zlibtar -zxvf zlib-1.2.13.tar.gzcd zlib-1.2.13./configuremakesudo make install注:如果执行sudo make install 指令时提示:XXX(用户名) is not in the sudoers file原因:当前用户没有加入到sudo的配置文件中解决方案:切换换到root用户,编辑配置文件v

2023-06-22 08:47:33 1691 1

原创 1、图形使用(柱状图)记录

import numpy as npimport pandas as pdimport randomimport matplotlib.pyplot as plt#随机100名1-10岁儿童ages=[random.randrange(1,11) for x in range(100)]#随机性别sex=[''.join(random.sample(('male','female'),1)) for x in range(100)]df=pd.DataFrame([x for x in ra

2020-10-10 00:12:35 173 1

原创 正则表达式

正则表达式 regex1、表达一位数字字符:\d\d 是一个正则表达式, 表示一位数字字符,即任何一位 0 到 9 的数字。1234-123-1234:\d\d\d\d-\d\d\d-\d\d\d\d字符分类 [0-5] 只匹配数字 0 到 52、数字匹配模式多次:\d{n}1234-123-1234:\d\d\d\d-\d\d\d-\d\d\d\d=\d{4}-\d{3}-\d{4}3、括号分组:(\d{3})-(\

2020-09-08 23:57:40 1194

原创 python记录之程序打包成可执行文件exe

记录下使用pyinstaller将.py打包成可执行文件(.exe)过程1、安装pyinstallerpip installpyinstaller2、执行打包操作打开cmd进入.py存放的目录下 ,执行以下命令:pyinstaller -F File.pypyinstaller -F FileList.specFile.py要打包的文件打包过程中可能遇到的报错(尤其使用到pandas时)RecursionError: maximum recursion depth ...

2020-07-05 14:16:40 179

原创 pandas记录之端午节的淘宝粽子交易分析

1、列名中有空格去除空格strip():删除字符串前后的空白;lstrip():删除字符串前面(左边)的空白;rstrip():删除字符串后面(右边)的空白。这三个方法只是返回空白被删除之后的副本,没改变字符串本身2、价格为string,必有非数值数据,付款人数71行缺失数据,发货地址3行缺失数据未完待续,持续更新...

2020-07-01 23:59:22 205

原创 pandas记录之时间序列

生成时间序列pd.data_range(start/end/periods(个数)/freq(间隔) 参数4选3pd.date_range(start='20200101',periods=3,freq='D')Out[3]:DatetimeIndex(['2020-01-01', '2020-01-02', '2020-01-03'], dtype='datetime64[ns]', freq='D')pd.date_range(start='20200101',periods=3,freq.

2020-06-29 23:57:43 120

原创 pandas记录之分类数据

数据分组标签化pd.cut(data,bins,labels=lable)需对数据进行分组时比较实用pd.cut(np.random.randint(0,60,5), [0,10,30,60], right=False, labels=['0-10区间','10-30区间','30-60区间'])Out[4]:[30-60区间, 30-60区间, 30-60区间, 10-30区间, 30-60区间]Categories (3, object): [0-10区间 < 10-30区间 &lt.

2020-06-27 13:26:54 143

原创 pandas记录之文本数据

特殊字符数据在收集的过程中由于各种原因,汇总的数据会出现一些出乎预料的问题#数据中有特殊字符309 0-396 9`485 /7Name: col2, dtype: string在进行数值统计时很头痛,一般情况下就是根据报错信息逐个replacedf.loc[df['col2'].str.contains('0-'),'col2']='0'df.loc[df['col2'].str.contains('9`'),'col2']='9'一个两个还好,第三个出现时,已.

2020-06-26 23:49:41 196

原创 pandas记录之缺失数据

数据读取(带数据类型)import pandas as pddf=pd.read_csv('data/Missing_data_two.csv').convert_dtypes()df.info()<class 'pandas.core.frame.DataFrame'>RangeIndex: 36 entries, 0 to 35Data columns (total 6 columns): # Column Non-Null Count Dtype --- -.

2020-06-22 23:47:08 1017

原创 大量表格数据(>10万条)快速导入Oracle

因工作原因,需要将几十万条表格数据整理并导入Oracle数据库中,数据通过Python整理后,原计划通过python直接写入数据库中,因数据库连接不稳定,考虑到数据库连接会中断,用python按条写入,执行效率较低(个人python能力有限),预计十几万条数据全部写完,至少几个小时,效率太低,在网上查到一个觉得比较快的方法(100万条数据,一分钟大概写入1万条数据,且未受服务器连接不稳定的影响),...

2020-04-22 23:31:53 1633 3

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除