1.import pandas as pd
data=pd.read_csv(r'fpace') #绝对路径,相对路径
2.类型
type(data)
data
3.删除month_id量列
4.data.info()
#空白值填充
#data.loc[(条件)&(条件)]
data.loc[(data.)&(条件)]
#取不是空白值的df=df[~df['客座率同比'].isna()]
1.pandas筛选数字子集
ioc:根据索引数字筛选
loc:根据索引名称筛选
(行)
(列)
(单个条件筛选)
(多个条件筛选)
[使用query函数,直接写条件]
isin函数的使用(同类:isin&apply&groupby&)
2.数据按指定列排序
升序
降序
ascending=False
3.删除
drop函数
4.分组
groupby函数
5.取特定的列
(有括号的)
(没括号的)
分类提取:['列名']['行名']
6.groupby的用法
总共几个人
7.查看函数有什么功能
8.set_index和reset_index的使用(bilibili卡卡农王)
设置新的索引
df.set.index('tag')
drop函数的使用
---drop = false时,保留新设索引列在表格中
inplace函数的使用
----没有使用inplace函数时,数据框不发生变化
reset_index函数的使用
------重设索引列
替换掉原有的索引列并重新设置
9.drop函数的使用
10.axis = 1-----列
axis = 0-----行
11.删除列的方法
12.查看索引:df.index
13.同比环比
14.Future Waring
解决办法
将[]改为[[]]
15.
plt.rcParams['axes.unicode_minus'] = False # 显示负号
16.jupyter notebook创建新的python文件没有反应:
解决方法:可能是某个插件与其冲突
17.shape[0]为行数,shape[1]为列数
18.
pandas如何取出表中一列数据所有的值并转换为array类型
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
df = pd.read_csv(r'C:\Users\y:\Documents\tencent files\2718089067\filerecv\市场数据_加盐.csv')
df = df.groupby(['year_id'])[['客座率','旅客量']].mean()
#取表中的第3列的所有值
col=df.iloc[:,0]
#取表中的第3列的所有值
arrs=col.values
#输出结果
print(arrs)
19.日期数据处理
20.
Python报错AttributeError: 'NoneType' object has no attribute 'append'
例如:insert函数
21.
pandas的insert插入一列
22.
字典形式python给excel添加一列
dic = {
'date':pd.date_range(start='2015-1-1',periods=213,freq='W')
}
df = pd.DataFrame(dic)
23.缺失值处理,将上一值套用
df.fillna(method = 'pad')
df.fillna(method = 'ffill')#使用下一值套用
df.fillna(method = 'bfill')
23.
有条件的替换值