爬取石油价格数据

爬取石油价格数据,直接上代码。

一 导包

import pandas as pd
import requests
from bs4 import BeautifulSoup
from io import StringIO
import pymysql
import datetime

二 代码


## 1 获取数据
# 发起HTTP请求
url = 'https://www.zuixinyoujia.com/guonei/'
response = requests.get(url)
response.encoding='gbk'
# 解析HTML
soup = BeautifulSoup(response.text, 'html.parser')
## 获取油价时间
time = datetime.datetime.now().strftime('%Y-%m-%d %H:%M:%S')
## 找到对应的数据
data = []
data_province = soup.find_all('tr')
for row in data_province:
    value = row.text.strip()
    data.append(value)
list_data = str(data).replace('\\n' ,',').replace(',,',',').replace("'","").replace("]","")
new_data = list_data[24:]
StringIO = StringIO(new_data.replace(", ","\n"))
df = pd.read_csv(StringIO,sep=",")
df['时间'] = time
print("查看数据爬取情况:\n",df)
## 将数据保存
path = 'E:\工作\数据收集\石油价格' + '\\' + "石油价格" + str(time).replace('/',"-")[0:10] + ".csv"
df.to_csv(path)

有帮到铁子们可以点点关注 收藏一下。
在这里插入图片描述

  • 4
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
当涉及到爬取网页数据时,有几种常见的方法和工具可以使用。以下是一个简单的教程,介绍了一种常见的爬取网页数据的方法: 1. 选择合适的编程语言:爬取网页数据通常需要使用编程语言来编写代码。常见的选择包括Python、Java和JavaScript等。其中,Python是最受欢迎的语言之一,因为它有许多强大的库和框架可以用于爬虫开发。 2. 安装必要的库和工具:对于Python来说,你可以使用一些流行的库来进行网页数据爬取,例如Requests、BeautifulSoup和Scrapy等。你可以使用pip命令来安装这些库。 3. 发送HTTP请求:使用HTTP请求库(如Requests)发送HTTP请求到目标网页。你可以发送GET请求获取网页内容,或者发送POST请求提交表单数据。 4. 解析网页内容:使用HTML解析库(如BeautifulSoup)解析网页内容。这样你就可以提取出你感兴趣的数据,例如标题、链接、文本等。 5. 存储数据:将提取到的数据存储到合适的地方,例如数据库、CSV文件或者Excel表格中。 6. 处理反爬机制:有些网站可能会采取反爬机制,例如限制访问频率、验证码等。你可能需要使用代理IP、用户代理、验证码识别等技术来绕过这些限制。 7. 遵守法律和道德规范:在进行网页数据爬取时,务必遵守相关的法律和道德规范。尊重网站的隐私政策和使用条款,并确保你的爬虫行为不会对网站造成过大的负担。 希望以上教程对你有所帮助!如果你有任何进一步的问题,请随时提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值