1 读取excel文件:
pd.read_excel('./data/xxx.xlsx')
2 读取csv文件:pd.read_csv()
(1)读取前10行某两列数据:
pd.read_csv('data1.csv', encoding='gbk', usecols=['positionName', 'salary'], nrows=10)
(2)读取数据并在读取数据时将'xxx'列大于10000的为改为高:
pd.read_csv('data2.csv', converters={'薪资水平':lambda x : '高' if float(x) > 10000 else '低'})
(3)读取数据,并把第一列作为索引:
pd.read_csv('xxx.csv', index_col = 0)
(4)读取数据,并设置前三列为合适的索引:
pd.read_csv(filepath6, sep='\s+', parse_dates=[[0,1,2]])
3 读取tsv文件:pd.read_csv()
pd.read_csv('xxx.tsv', sep = '\t')
4 dataframe保存为csv文件
df.to_csv('xxx.csv')
5 读取时显示所有的行列:pd.set_option()
(1)显示所有列:
pd.set_option('display.max_columns', None)
pd.set_option('display.max_columns', 5) #最多显示5列
(2)显示所有行:
pd.set_option('display.max_rows', None)
pd.set_option('display.max_rows', 10)#最多显示10行
(3)显示小数位数:
pd.set_option('display.float_format',lambda x: '%.2f'%x) #两位
(4)显示宽度:
pd.set_option('display.width', 100)
(5)设置小数点后的位数:
pd.set_option('precision', 1)
(6)是否换行显示:
pd.set_option('expand_frame_repr', False)
# True就是可以换行显示。设置成False的时候不允许换行