Python 基础知识梳理

数据抽取主要有以下几种方式

方式一、request 包

rs 模块的正则匹配
符号( .)表示重复零次或多次
符号( ?)表示重复零次或一次
符号( {n})表示重复n次
符号( .*) 表示贪婪匹配
符号( .*?) 表示惰性匹配
单独获取正则中的内容给分组起名字,如上图中 (?P.*?)

异常处理

1)错误信息:request() got an unexpected keyword argument ‘header’
处理方案:request 模块关键字是 headers,检查写的是否正确
2)错误信息:ValueError: I/O operation on closed file.
处理方案:代码语法未对齐,在for循环执行完毕,才关闭IO流
3)错误代码:UnicodeEncodeError: ‘gbk’ codec can’t encode character ‘\xf6’ in position 30: illegal multibyte sequence
处理方案:执行编码方式,即 f = open(“data.csv”, mode=“w”,encoding=“utf-8”)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值