1.读取数据
- df=pd.read_csv('query-869.csv') ,也可以用 read_csv 直接读取 text 文件也可以。
- 读取excel 的话,df = pd.read_excel("query-577.xlsx")
- 读取 tsv ,需要有分隔符, df2 =pd.read_csv('name.tsv', sep='\t')
2.查看有所有的列名 & 修改列名
- df.columns 或者 df.columns.values , 转为list形式, list(df.columns)
- df.rename(columns={'date_id':'date'}, inplace = True)
把 列名 date_id 改为 date ,再 df.columns 查看
3.查看 unique 的的元素 & 去除空的行
- df['zt'].unique() ,查看 到 zt 这1列有 4个 不同的元素
- df.dropna(axis=0, how='any', inplace=True) ,原先 180962行减少到180879行,现在 zt 也不再有 nan