-----导入
出现(SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position 2-3: truncated \UXXXXXXXX escape)
开头加个 r 就可以了
import pandas as pd
ccf=pd.read_csv(r'C:\Users\pc\Desktop\tc\sample_submission.csv')first_rows = ccf.head(n=5)
print(first_rows)
导入多sheet excel
import pandas as pd
#使用pandas读取excel文件
xls_file=pd.ExcelFile('./data/workbook.xls')xls_file.sheet_names
#显示出读入excel文件中的表名字
table1=xls_file.parse('first_sheet')
table2=xls_file.parse('second_sheet')
xlsx_file=pd.ExcelFile("./demo.xlsx")
x1=xlsx_file.parse(0)x2=xlsx_file.parse(1)
#excel文件的写出#data.to_excel("abc.xlsx",sheet_name="abc",index=False,header=True) #
该条语句会运行失败,原因在于写入的对象是np数组而不是DataFrame对象,只有DataFrame对象才能使用to_excel方法。
DataFrame(data).to_excel("abc.xlsx",sheet_name="123",index=False,header=True)
#excel文件和pandas的交互读写,主要使用到pandas中的两个函数,一个是pd.ExcelFile函数,一个是to_excel函数
修改索引排序,从1开始
ccf.columns = ['a', 'b', 'c', 'd']
ccf.index=range(1,ccf.shape[0]+1)
---参数不接受一维数组
age_scale_param = scaler.fit(df['Age']) df['Age_scaled'] = scaler.fit_transform(df['Age'], age_scale_param) fare_scale_param = scaler.fit(df['Fare']) df['Fare_scaled'] = scaler.fit_transform(df['Fare'], fare_scale_param)
---修改后
age_scale_param = scaler.fit(df['Age'].values.reshape(-1, 1))
df['Age_scaled'] = scaler.fit_transform(df['Age'].values.reshape(-1, 1), age_scale_param)fare_scale_param = scaler.fit(df['Fare'].values.reshape(-1, 1))
df['Fare_scaled'] = scaler.fit_transform(df['Fare'].values.reshape(-1, 1), fare_scale_param)
print(df)