pandas
醉糊涂仙
这个作者很懒,什么都没留下…
展开
-
dataframe删除多列同时为空的行
1,先左右填充数据#向右填充数据df.fillna(method='ffill', axis=1)#向左填充数据df.fillna(method='bfill',axis=1)注:一行全为空的数据定然不会被填充2,指定删除某一列为空的行注:经过填充,定然一列为空一行都为空df.dropna(subset=['colname'])...原创 2020-01-14 20:15:42 · 3286 阅读 · 1 评论 -
dataframe删除指定列为空的行
df.dropna(subset=['colname'])原创 2020-01-14 20:10:55 · 4336 阅读 · 0 评论 -
dataframe查看每一列空值个数
df.info(verbose=True, null_counts=True)原创 2020-01-14 20:09:21 · 11439 阅读 · 0 评论 -
python画概率分布图
import seaborn as snssns.kedplot(df, shade = True)原创 2019-10-29 17:49:08 · 8387 阅读 · 1 评论 -
DataFrame某一列按照条件筛选,另一列赋值
--电压小于95V或者大于110V并且是三相三线的数据vol_if_exception设置为1--判断条件无论大小一定要用括号括起来,不然会报错df.loc[((df.vol_avg_daily < 95) | (df.vol_avg_daily > 110)) & (df.wiring_mode == '2'), 'vol_if_exception'] = 1...原创 2019-10-29 16:47:08 · 17335 阅读 · 1 评论 -
DataFrame时间加减一段时间
--加一天df['data_date'] + pd.Timedelta(days=1)--减一天df['data_date'] - pd.Timedelta(days=1)原创 2019-10-29 11:22:15 · 7722 阅读 · 0 评论 -
plan shapes are not aligned
这个问题,笔者是出现在dataframe执行concat拼接的时候出现的。最后排查,两个dataframe的列标号不一致。需将行索引和列索引全部重置参考博文https://blog.csdn.net/u010916338/article/details/96427880...原创 2019-07-22 18:51:28 · 12918 阅读 · 0 评论 -
dataframe重置列索引列号列标(非列名)
1,dataframe可以重置行索引data.reset_index(drop=True)2,那么只需要将dataframe转置即可,就可以借助行索引重置来达到列索引重置的目的data.T.reset_index(drop=True).T注:什么情况下,才会用到行列索引重置?(1)dataframe非常大,笔者就碰到过几万列的dataframe,每个列都赋予列名工程量很大,不如...原创 2019-07-18 11:47:19 · 9781 阅读 · 0 评论 -
pandans对某一列进行独热编码
需求:将数据集一列进行独热编码(1)如果所有取值都出现在所在列,则:from sklearn.preprocessing import OneHotEncoderenc = OneHotEncoder(sparse = False)result = enc.fit_transform(data[[41]]) #41指的是列标为41的那一列数据(2)如果所有取值未完全出现在所在列...原创 2018-11-06 09:02:06 · 3495 阅读 · 0 评论 -
dataframe按照条件选取行
转载地址:https://blog.csdn.net/u100k/article/details/51394486 在使用dataframe处理数据的时候碰到了按照条件选取行的问题,单个条件时可以使用:df[df[‘one’] > 5]如果多个条件的话需要这么写:import numpy as npdf[np.logical_and(df[‘one’]> 5,df[‘...转载 2018-09-03 11:07:17 · 2315 阅读 · 0 评论 -
Series和DataFrame
Series和DataFrame都是Pandas中的数据类型 Series可以认为是一维数组 DataFrame可以认为是二维数组&gt;&gt;&gt; from pandas import Series,DataFrame&gt;&gt;&gt; import pandas as pdSeries只有行索引&gt;&gt;&gt; obj原创 2018-08-22 14:26:10 · 1675 阅读 · 0 评论 -
pandas来历以及应用
pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。 Pandas最初被作为金融数据分析工具而开发出来,因此,pandas为时间序列分析提供了...转载 2018-08-16 20:19:08 · 2958 阅读 · 1 评论