Pandas记录

1.import pandas as pd

data=pd.read_csv(r'fpace')   #绝对路径,相对路径

2.类型

type(data)

data

3.删除month_id量列

4.data.info()

#空白值填充

#data.loc[(条件)&(条件)]

data.loc[(data.)&(条件)]

#取不是空白值的df=df[~df['客座率同比'].isna()]

1.pandas筛选数字子集

ioc:根据索引数字筛选

loc:根据索引名称筛选

(行)

(列)

(单个条件筛选)

(多个条件筛选)

[使用query函数,直接写条件]

isin函数的使用(同类:isin&apply&groupby&)

2.数据按指定列排序

升序

降序

ascending=False

3.删除

drop函数

4.分组

groupby函数

5.取特定的列

(有括号的)

(没括号的)

分类提取:['列名']['行名']

6.groupby的用法

总共几个人

7.查看函数有什么功能

8.set_index和reset_index的使用(bilibili卡卡农王)

设置新的索引

df.set.index('tag')

drop函数的使用

  ---drop = false时,保留新设索引列在表格中

inplace函数的使用

----没有使用inplace函数时,数据框不发生变化

reset_index函数的使用

------重设索引列

替换掉原有的索引列并重新设置

9.drop函数的使用

10.axis = 1-----列

     axis = 0-----行

11.删除列的方法

12.查看索引:df.index

13.同比环比

14.Future Waring

解决办法

将[]改为[[]]

15.

plt.rcParams['axes.unicode_minus'] = False # 显示负号

16.jupyter notebook创建新的python文件没有反应:

解决方法:可能是某个插件与其冲突

17.shape[0]为行数,shape[1]为列数

18.

pandas如何取出表中一列数据所有的值并转换为array类型

 

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

df = pd.read_csv(r'C:\Users\y:\Documents\tencent files\2718089067\filerecv\市场数据_加盐.csv')

df = df.groupby(['year_id'])[['客座率','旅客量']].mean()

#取表中的第3列的所有值

col=df.iloc[:,0]

#取表中的第3列的所有值

arrs=col.values

#输出结果

print(arrs)

19.日期数据处理

20.

Python报错AttributeError: 'NoneType' object has no attribute 'append'

例如:insert函数

 

21.

pandas的insert插入一列

22.

字典形式python给excel添加一列

dic = {

    'date':pd.date_range(start='2015-1-1',periods=213,freq='W')

}

df = pd.DataFrame(dic)

23.缺失值处理,将上一值套用

df.fillna(method = 'pad')

df.fillna(method = 'ffill')#使用下一值套用

df.fillna(method = 'bfill')

23.

有条件的替换值

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值