前言
一、区别
csv.reader():适合简单的CSV文件读取任务,轻量但需要手动处理数据。
csv.reader()返回一个reader对象,该对象将遍历csv文件中的行。从csv文件中读取的每一行都作为字符串列表返回。
pandas.read_csv():适合复杂的数据分析和处理任务,提供强大的数据操作功能和便捷接口。
pandas.read_csv()返回一个dataframe
二、代码演示
1. pandas.read_csv()
代码如下(示例):
import pandas as pd
df = pd.read_csv('file.txt', sep=' ', quoting=csv.QUOTE_NONE)
print(df)
2.csv.reader()
代码如下(示例):
import csv
with open('/home/yin/DREAMwalk-main/DREAMwalk-main/demo/new_2023_11_3_jiaqi/stitch_herbpro_cutoff/drug_disease_f.txt', 'r') as file:
reader = csv.reader(file, delimiter=' ', quoting=csv.QUOTE_NONE)
for row in reader:
print(row)
三、参数总结
sep:Pandas用来指定字段分隔符(如空格、制表符、逗号等)。
delimiter:csv.reader用来指定字段分隔符。
quoting:两者都可以使用,用来指定如何处理引用字符(如双引号)。
encoding:Pandas用来指定文件编码(例如’GB18030’,适用于中文编码)。
但是对于csv.reader来说,需要先以指定的编码打开文件,然后将文件对象传递给 csv.reader()