Pandas
1. DataFrame
1.1 新建
可以先新建一个dict,再通过dict直接创建DataFrame
1.2 df.drop()
drop()默认axis=0,即默认删除行,直接传入行的index就行
axis=1删除列
1.3 索引重新排序reset_index()
记得reset_index(drop=True)删除新建的列index
1.4 对于筛选数据时,从DataFrame中选取在列表中存在的值
df[df['教室名称'].isin(list(cr0['房间名称']))]
其中,isin中不能为Series,需要转换为list或其他
1.5 选择行或列
df['A'] # 选择列
df[['A']] # 选择行列
1.6 一列分裂成多列
针对不同处理需求不同操作,这里提供两个相关方法
- 第一种方法是Series的split操作,一般数据中有字符分割符时用,如:‘1,2,3,4’
函数
Series.str.split(pat=None, n=-1, expand=False)
例子
df = df['attrs'].str.split(',', expand=True)
然后用pd.concat把多列加回
pd.concat([], axis=1, names=new_names)
- 第二种方法是用切片自己加上去,注意后面加的str
kb['周'] = kb['课时'].str[0:13]
read_excel读取,把字符串自动转化成了数字
设置参数dtype
read_excel('filepath', dtype={'col_name': str})