用Oracle PLSQL做彩票开奖数据爬虫(二、读取网页数据)

本文介绍如何使用Oracle PLSQL的utl_http包爬取彩票开奖数据,解决了utl_http请求限制1999个字符的问题,通过设置HTTP头模拟浏览器请求并处理中文乱码,成功存储大量网页数据。
摘要由CSDN通过智能技术生成

用Oracle PLSQL做彩票开奖数据爬虫(二、读取网页数据)

通过配置ACL,我们已经可以获取到网页数据。
可是,我们发现utl_http.request函数返回的数据并不全,最多只能返回1999个字符。
这里写图片描述
幸运的是Oracle当然已经准备了一套完整的工具来保证满足我们的需求,主要是提供了几个函数,可以把网页数据存入lob类型的字段里。我这里写了一个存储过程,用来爬某期双色球的开奖结果。
这里写图片描述
这段代码主要是发送一个request请求,得到response。其中注意2个header的设置,第一个是模拟浏览器发出请求,因为很多网站都做了反爬虫技术,来判断请求方是人还是机器,并进行拦截;第二个主要解决乱码问题,在上文中我们也看到,返回的数据里面中文显示都是乱码,至于为什么用“

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值