如果不用pandas库,我们该怎样读取外部数据呢?今天我们以csv文件为例,做一个简单的分!
主要是用到csv下的reader方法,所以我们先从csv下导入reader方法。
1、打开文件并导入
打开导入数据文件后,有做一个判断是否为空行的处理,如果为空行则跳过。
for row in game:
if not row:
continue
game_data.append(row)
这里有个点需要注意:打开文件的时候最好是指定格式,一般utf-8,如果不指定那么在读取的文件内容中包含中文就可能会报错,比如这样
2、数据类型转换
由上面函数方法读取的数据是以字符串的形式存在的,如果是做数据分析,机器学习,大多数时候我们要的是数值类型的数据。所以我们还可以需求做数据类型转换。
其它类型的文件数据读取的方法也大致类似,相信大家可以自己写出来的
下面是完整代码!
from csv import reader
def read_csv(file_path):
game_data = []
with open(file_path, 'r', encoding='utf-8') as file:
game = reader(file)
print(type(game))
for row in game:
if not row:
continue
game_data.append(row)
return game_data
def data_type_conversion(data,column):
data1 = data[1:]
for row in data1:
row[column] = float(row[column].strip())
if __name__ == '__main__':
data = read_csv(r"D:\数据文件(1)\game - copy.csv")
for i in range(len(data[0])):
data_type_conversion(data, i)
好了,简单分享到这啦!