数据分析
文章平均质量分 55
-清风明月-
这个作者很懒,什么都没留下…
展开
-
Python数据分析库pandas高级接口dt的使用详解
Series对象和DataFrame的列数据提供了cat、dt、str三种属性接口(accessors),分别对应分类数据、日期时间数据和字符串数据,通过这几个接口可以快速实现特定的功能,本文着重讨论日期时间数据,先看一个完整的案例:import pandas as pd import numpy as np# 产生一个时间序列,从2021-5-1 00:00:00 到 2021-5-10 00:02:00 频率是日date = pd.date_range(start='2021-5-1 .原创 2021-05-11 16:36:08 · 1552 阅读 · 0 评论 -
Python中的*使用
*在Python中有很广泛的用途分两大类:第一类:单个*1.算数运算c = 90 * 3print(c)2702.函数形参假设有函数定义如下:def add(a,b): passadd(*args):* 的作用其实就是把序列 args 中的每个元素,当作位置参数传进去。比如上面这个代码,如果 args 等于 (23,35) ,那么这个代码就等价于 add(23,35) 。3.重复某个字符串或者列表第二类:多个*...原创 2021-05-10 14:25:22 · 123 阅读 · 0 评论 -
pandas读写csv excel pinkle 的性能比较
在数据分析工作中,csv、excel、pinkle这三种格式的文件经常会被用到,但是pandas读取这3种格式的数据究竟性能如何呢,我准备了13列 17519行的excel数据测试了一下,结果是这样: csv xls pickle 字节数MB 1.26 1.09 1.13 读数据耗费时间:秒 0.044 4.992 0.009 写数据耗费时间:秒 0.336 15.982 0.01 从这个测试结果可以得到以下结论.原创 2021-05-08 16:39:34 · 2145 阅读 · 0 评论 -
Pandas 横向数据汇总实例
在某些情况下需要对Excel中的数据做横向汇总,此时使用Pandas的将体现出很强的优势,请看下面的数据:表格中有5个子类别:类别1----类别5,每一行中至少有1个类别的值是1,表示当前行有多个类别类别属性两个汇总列:汇总类别1,汇总类别2汇总要求1. 类别1列中等于1的值,要替换成字符串 A类; 类别2列中等于1的值,要替换成字符串 B类; 类别3列中等于1的值,要替换成字符串 C类; 类别4列中等于1的值,要替换成字符串 D类; 类别5列中等于1的值,...原创 2021-04-27 11:48:27 · 1511 阅读 · 2 评论 -
python获取Pandas列名的几种方法
本文汇总了几种获得CSV Excel 文件字段列表的的方法,一起来看看吧下面几种方法的代码基于这样的测试数据:import pandas as pdfile = r'E:\数据分析\pandas_02\data.csv'df = pd.read_csv(file,engine='python')df1.通过columns字段获取,返回一个numpy型的arrayfields = df.columns.valuesprint(fields)['品牌' '价格..原创 2021-04-13 15:15:25 · 8584 阅读 · 0 评论