![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pandas
文章平均质量分 79
huahuahuahhhh
一步一步,慢慢来
展开
-
pandas(八)--实战一下
收到一批数据,数据形式。采集数据的间隔时间是10分钟,全天采集数据,每天的数据量是144条。原创 2023-11-28 11:49:03 · 490 阅读 · 0 评论 -
pd.melt
一、函数pd.melt( ['frame', 'id_vars=None', 'value_vars=None', 'var_name=None', "value_name='value'", 'col_level=None']melt: V (使)熔化,融化pd.melt将多列数据进行融合。二、参数id_vars: tuple, list, or ndarray, optional用作标识符的列value_vars:tuple, list, or ndarray, optional如果没有原创 2020-09-28 18:05:44 · 3146 阅读 · 0 评论 -
python--pandas 分位数
pandas 分位数 df.quantile(q=0.75)计算分位数:pos=1+(n−1)∗ppos = 1+(n-1)*ppos=1+(n−1)∗p = integer + float(整数部分 + 小数部分) ans = df[integer-1] + float * (df[integer - df[integer - 1])举个例子:定义一个DataFramedf ...原创 2019-06-20 14:42:57 · 26537 阅读 · 0 评论 -
pandas将表中的字符串转成数值型
在用pd.read_csv读数据时,将要转换数据类型的列名和类型名构成字典,传给dtypeimport numpy as npimport pandas as pdpath = 'house_data.csv'col = ['CRIM', 'ZN', 'INDUS', 'CHAS', 'NOX', 'RM', 'AGE', 'DIS', 'RAD', 'TAX', 'PTR...原创 2019-11-01 21:01:09 · 13933 阅读 · 0 评论 -
python中利用matplotlib画图
介绍三种比较简单的方法plt.plot()s.plot() s是pandas的Series对象df.plot() df是pandas的DataFrame对象plt.plot()#绘制y关于x的变化关系.x,y是成对出现的。可以省略x,则y是关于y的个数的函数关系。当y是Series或DataFrame对象对象时,不出现x[fmt]]可以设置线性,颜色,样式等。Plot y......原创 2019-06-28 14:18:58 · 2760 阅读 · 0 评论 -
pandas(七) -- 数据分组
数据分组官方文档分组统计 - groupby功能根据某些条件将数据拆分成组对每个组单独使用函数将结果合并到一个数据结构中根据单列或多列分组 .groupby()分组后的对象执行数值计算函数 .sum(),.mean()…分组后对象同时使用多个函数 --agg()。df.groupby(by=None, axis=0, level=None, as_index=True...原创 2019-06-24 17:38:33 · 346 阅读 · 0 评论 -
pandas(六) -- 合并、连接、去重、替换
pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None,left_index=False, right_index=False, sort=True,suffixes=('x', 'y'), copy=True, indicator=False) left : DataFrameright : Data...原创 2019-06-24 10:44:22 · 1386 阅读 · 0 评论 -
pandas(五) -- 文本处理
文本处理.–使用字符串处理函数先将pandas的series对象转成strings对象,再使用字符串相关函数。s = pd.Series(['A','b','C','bbhello','123',np.nan,'hj'])0 A1 b2 C3 bbhello4 1235 NaN6 ...原创 2019-06-21 17:54:04 · 1967 阅读 · 3 评论 -
中文时间转成非中文
datetime 时间格式转换 https://www.cnblogs.com/qisq/p/7614398.html原始数据 df使用apply搭配lambda函数,运行极快。df[‘数据获取日期’] = df[‘数据获取日期’].apply(lambda x:time.strptime(x,’%Y年%m月%d日’))df[‘数据获取日期’] = df[‘数据获取日期’].app...原创 2019-06-26 15:47:32 · 217 阅读 · 0 评论 -
pandas(一)-- Series创建及索引
pandas Series 构建通过数组的方法ar = [90.0,92.0,89.0,65.0]s = pd.Series(ar,index=['Jack','Marry','Tom','Zack'],dtype = np.float64)print(s)通过字典的方法dic = {'Jack':90.0,'Marry':92.0,'Tom':89.0,'Zack':6...原创 2019-06-18 17:14:36 · 681 阅读 · 0 评论 -
pandas(二) -- Dataframe创建及索引
Dataframe创建由数组/list组成的字典data1 = {'a':[1,2,3], 'b':[3,4,5], 'c':[5,6,7]}df1 = pd.DataFrame(data1)print(df1)输出 a b c0 1 3 51 2 4 62 3 5 7添加索引df1 = pd.Data...原创 2019-06-19 15:06:50 · 2029 阅读 · 0 评论 -
pandas(三) -- DataFrame的基本操作
DataFrame的基本操作数据查看、转置、 添加、修改、删除值 / 对齐 / 排序1. 查看、转置、 添加、修改df.head()#查看df头部元素df.tail()#查看df的最后几个元素df.T#转置df.loc[4] = 20 # df索引为4的行的值设为20,如果df无索引为4的行,则添加这行df['e'] = 20 #df列名为‘e’的值设为20,如果df列名为‘e...原创 2019-06-19 16:57:55 · 422 阅读 · 0 评论 -
pandas(四) -- 数值计算
数值计算df = pd.DataFrame({'key1':[4,5,3,np.nan,2], 'key2':[1,2,np.nan,4,5], 'key3':[1,2,3,'j','k']}, index = ['a','b','c','d','e'])print(df) key...原创 2019-06-21 16:16:59 · 405 阅读 · 0 评论 -
pandas 读csv 报错 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xca in position 0: invalid cont
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xca in position 0: invalid continuation byte解码错误。将csv 用记事本打开,保存时,编码方式选择‘utf-8’原创 2019-06-25 11:35:13 · 3266 阅读 · 0 评论