Python爬虫——csv数据存取/数据处理

本文介绍了Python内置的csv模块以及pandas库在数据存取和处理中的应用,包括如何合并多个csv文件,数据的滤空、去重、填充,以及object类型数据的处理,如字符串和日期类型的转换。
摘要由CSDN通过智能技术生成

1. Python内置csv模块

常用模式 含义
r 只读
r+

读写

rb 二进制 读
rb+ 二进制 读写
w 只写
w+ 读写
wb 二进制 写
wb+ 二进制 读写
a 追加
a+ 读写
ab 二进制 读
ab+ 二进制 读写

注意:1. 使用“w”模式。文件若存在,会覆盖原文件;文件若不存在,会创建新文件。

           2. 使用“a”模式。默认把要写入的数据追加到文件末尾;如果文件不存在,将自动创建。

eg1. with open 方法

import csv

with  open('test.csv','w') as csvFile:
    writer = csv.writer(csvFile)
    #先写columns_name
    writer.writerow(["index","a_name","b_name"])
    #写入多行用writerows
    writer.writerows([[1,2,3],[0,1,2],[4,5,6]])
 
#用reder读取csv文件
with open('test.csv','w') as csvFile:
    reader = csv.reader(csvFile)
    for line in reader:    # 通过迭代器访问文件
        print(line)

eg2. open 方法

import csv

# 创建/打开一个csv文件
f = open('小说.csv', 'w', encoding='utf-8-sig', newline='')
# 基于文件对象构建csv写入对象
csv_write = csv.writer(f)
# 构建csv列表头
csv_write.writerow(["title", "score", "evaluator", "href"])
for i  in csv_write:
    
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值