爬虫3_获取汇率数据

本文介绍了如何使用Python爬虫分别从三个网站抓取美元、英镑和欧元对人民币的汇率数据,并通过解析网页、数据格式转换后存储到MySQL数据库中。爬取过程包括导入相关包、获取网页数据、调整日期格式以及将数据存入数据库。
摘要由CSDN通过智能技术生成

1 爬取的内容

根据需要美元,英镑,以及欧元对人民币的汇率,网站比较简单。分为三个网站,地址如下,获取当日页面里的数据,没有太多复杂的解析。三个网站的规则是一样的,里面的解析方法也和步骤也是相同的。
欧元对人民币
英镑对人民币
美元对人民币

1.1 爬取的界面

在这里插入图片描述
网页右键点击,选择检查,查看网页代码,找到标题和对应数据所在的位置,下面就进行相关数据的获取在这里插入图片描述

2 爬取的过程

2.1 导入需要的包

a0_mysql是我上一个文章里, 爬虫2_python连接mysql数据库代码,主要是连接数据库,将获取到的数据直接导入到数据库里。

# coding: utf-8
from pathlib import Path
import os
import pandas as pd
import requests
from bs4 import BeautifulSoup
import warnings
warnings.filterwarnings('ignore')
import os
from a0_mysql import del_sql,get_sql_data,to_sql
# 可以自定义代理,一般本地使用就没有用到代理,如果是一些工作内容或者其他内网需要开通,会需要个代理。
proxies = {
   'http': "http://代理地址", 'https': 'https://代理地址'}

2.2 获取网页数据

'''
输入:
url:     网页地址
headers:  一般的头部信息
proxn:    是否使用代理,如果是true,则使用代理

输出:     如1.1中的表格里的数据
'''
def get_data(url, headers , proxn):
	# 是否使用代理
    if proxn =='true':
        req = requests.get(url=url, headers=headers, proxies=proxies)
    else:
        req = requests.get(url=url, headers=headers)
    soup = BeautifulSoup(req.text, 'lxml')
    # 在检查中找到数据存放在 该class value 下
    body = soup.find_all(class_='genTbl closedTbl historicalTbl')
  • 1
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值