1.基本语法
1)查询指定行
1)[i,:]
和[i:i,:]
的区别
2)i:i
就是取第i
行,这和普通索引,不包含尾巴有很大的区别
df.loc[i:i,:] 返回的才是数据框
df.loc[i,:]返回的不是数据框
2)查询指定列
df.loc[:,"column_name"] # 返回指定列
df.loc[:,["column_name",]] # 返回多个指定列
2.使用函数
3.去除重复数据
df.drop_duplicates(subset=['brand', 'style'], keep='last')
参数 | 描述 |
---|---|
subset | column label or sequence of labels, optional,指定去重的列,默认所有列一起比较 |
keep | {‘first’, ‘last’, False}, default ‘first’,保留哪一个 |
inplacebool | default False |
ignore_indexbool | default False,If True, the resulting axis will be labeled 0, 1, …, n - 1. |
4.其他
df.head()
df.tail()
参考:
https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.drop_duplicates.html?highlight=drop_dup#pandas.DataFrame.drop_duplicates