文件导入
txt与csv文件读取为dataframe
利用pandas 里的read_table
1、读取txt,且重命名表头
import pandas as pd
df = pd.read_table('.../data.txt',names=['a','b','c'],header=None,encoding='utf-8').astype(str)
2、读取csv,且重命名表头,跳过第一行(原表头)
datacol = ['A','B','C']
train = pd.read_csv('data.csv',sep = ',', header=None, names = datacol, na_values='?',skiprows=1)
3、查询文件编码格式
data = pd.read_csv('data.csv')
data.dtypes
4、文件导出为csv
4_1不识别中文
data.to_csv('E:\\data\\data.csv', encoding='utf-8', index=False)
4_2识别中文
data.to_csv('E:\\data\\data.csv', encoding='utf_8_sig', index=False)
5、构造新列