from csv import reader
def pre_process(file):
'''数据预处理函数'''
with open(file, 'r', encoding='utf-8') as f:
'''数据按行读取'''
data = list(reader(f))
'''转化为numpy数组'''
data = np.array(data)
return data
1.2 encoding = ’latin-1‘
解决部分数据格式无法以 'utf-8' 编码形式转换的错误
from csv import reader
def pre_process(file):
'''数据预处理函数'''
with open(file, 'r',encoding='latin-1') as f:
'''数据按行读取'''
data = list(reader(f))
'''转化为numpy数组'''
data = np.array(data)
return data
1.3 特殊情况
若采用情况2的编码 'latin-1' 仍然无法使用,可以增加 errors='ignore'
from csv import reader
def pre_process(file):
'''数据预处理函数'''
with open(file, 'r', encoding='utf-8', errors='ignore') as f:
'''数据按行读取'''
data = list(reader(f))
'''转化为numpy数组'''
data = np.array(data)
return data
三、 函数调用实例
2.1 调用举例
根据代码所在位置,给定csv文件位置,进行调用
'''给定数据集'''
file = 'csv/abc.csv'
data = pre_process(file)
四、完整代码
此处代码文件xxx.py 需要自己对齐 file 路径使用
from csv import reader
def pre_process(file):
'''数据预处理函数'''
with open(file, 'r',encoding='latin-1') as f:
'''数据按行读取'''
data = list(reader(f))
'''转化为numpy数组'''
data = np.array(data)
return data
'''给定数据集'''
file = 'csv/abc.csv'
data = pre_process(file)