pandas
文章平均质量分 51
python-行者
这个作者很懒,什么都没留下…
展开
-
python-数据分析-(12)pandas数据清洗、缺失值、重复值、异常值处理常见方法
一.导入模块 import pandas as pdfrom scipy.interpolate import interp1d 二.读取excel文件 data=pd.read_excel(r'E:\pythonwork\数据分析\11.数据清洗\人事终表 (1).xlsx').tail(10)print(data)''' Unnamed: 0 部门 姓名 应发数 发放时间 绩效 合计工资108 108 讲解员(6人.原创 2021-01-08 13:53:16 · 4651 阅读 · 0 评论 -
python-数据分析-(11)pandas聚合函数、透视表、交叉表、表格合并常见操作
一 聚合函数1. numpy、pandas使用的统计方式在数组中经常使用的聚合方式data[['counts', 'ches_name']].agg([np.mean, np.std])agg({'xx':np.mean, 'xx2':[np.sum, np.std]})2. 在pandas或者numpy中没有现成的函数可以使用,可以使用transform自定义函数如: 将指定列的全部数据 * 2方式一data['counts'].transform(lambda x: x*2)方式二原创 2021-01-04 21:31:11 · 2497 阅读 · 16 评论 -
python-数据分析-(10)pandas时间处理、字符串处理、分组聚合、去重排序常见操作
pandas在数据清洗过程,难不了会特定的列或者行进行操作,就需要特殊的指令操作,在这里收集了常见的操作指令。希望能在工作中帮给您一定的帮助。我这本文章中先导入包,读取了本地的一个文件,内容有字符串、时间。# import导入模块import pandas as pdimport numpy as np# 读取Excel文件data = pd.read_excel('./meal_order_detail.xlsx')print(data.shape) # (2779, 19) 查看结构原创 2020-12-31 21:21:39 · 3004 阅读 · 0 评论 -
python-数据分析-(8)pandas初识
pandaspandas是基于Numpy的一种工具,该工具是为解决数据分析任务而创建的,pandas纳入了大量库和一些标准的数据模型,提供了高效的操作大型数据集所需要的的工具,pandas提供了大量能使我们快速便捷地处理数据的函数和方法。表格数据操作(增删改查)实现多个表格的处理数据清洗操作:缺失值、重复值、异常值、数据标准化、数据转换的操作实现所有的excel的特殊操作:生成透视表、交叉表完成统计分析一、pandas的创建import pandas as pd1、表结构数据,构建D原创 2020-12-30 18:27:45 · 1275 阅读 · 15 评论 -
python-数据分析-(9)pandas(Excel、csv)文件读写操作,常见参数分析
一、pandas中Excel文件常见操作基本语法# import导入模块import pandas as pdimport numpy as np# 读取文件,在这里我读取的是本地文件,也可以直接传入绝对路径s1 = pd.read_excel('./meal_order_detail.xlsx') s2 = pd.read_excel('C:\Users\Administrator\Documents\Tencent Files\1661157270\FileRecv\meal_orde原创 2020-12-31 20:31:12 · 2234 阅读 · 0 评论