pandas常用操作方法
- 数据去重及重置索引
data1 = data.drop_duplicates(keep='first', inplace=False)
data2 = data1.reset_index(drop=True)
- 去掉time列里面数据是0的所在行记录
data1 = data[~data['time'].isin([0])]
- 用0或其他数值填充缺失值,以0为例
data = data.fillna(0)
- 按列筛选数据,在data表中筛选时间列 t1<time<t2的所有行数据
subData_1 = data.loc[data['time'] > t1]
subData_2 = subData_1.loc[subData_1['time'] < t2]
- 统计data表中第二列每个元素出现的个数
data1= data.iloc[:, 1]
count = dict(data1.value_counts())
count_1= pd.DataFrame(list(count.items()), columns = ['value', 'number'])
- value值在小数点后保留3位
percent = '%.3f' % (val