2021-07-02山东大学暑期实训第一周2

该博客介绍了为爬取阿里云、腾讯云、华为云和百度云的价格数据所做的准备工作。作者使用selenium和ChromeDriver模拟浏览器进行爬取,已成功打开网页。下一步将进行数据爬取,重点是华为云的数据抓取。
摘要由CSDN通过智能技术生成


前言

这次主要展示需要爬取的网页及内容和前期的准备工作。


一、需要爬取的网页

1、阿里云

阿里云价格网页

阿里云服务器详情
阿里云具有“价格下载”的按钮和查询历史价格的API,因此获取数据并不是很困难。

2、腾讯云

腾讯云价格网页

腾讯云服务器详情
腾讯云也具有“导出全部”的按钮,因此获取数据有相对较容易。

3、华为云

华为云价格网页

华为云服务器详情
华为云并没有导出按钮,就需要编写爬虫程序。

4、百度云

百度云价格网页

百度云服务器详情
百度云也需要编写爬虫程序。

二、爬虫准备工作

我使用selenium模拟浏览器进行爬取,这需要先下载对应版本的Chromedrive。

Chromedrive镜像网站

下载、解压、安装
在这里插入图片描述
引入库

代码如下:

from selenium import webdriver
import time
import warnings
import pandas as pd
import csv
warnings.filterwarnings("ignore")
driver=webdriver.Chrome(executable_path=r"C:\Users\dell\AppData\Local\Google\Chrome\Application\chromedriver.exe")
#driver.get("https://piao.qunar.com/ticket/list.htm?keyword=%E6%B3%B0%E5%AE%89&region=&from=mpl_search_suggest")
driver.get("https://www.huaweicloud.com/pricing.html?tab=detail#/ecs")
time.sleep(3)

可以正常打开网页,说明安装成功

总结

这次主要展示需要爬取的网页及内容和前期的准备工作,下次就可以爬取数据,而我主要负责华为云的数据爬取。

springboot034基于Springboot+Vue在线商城系统设计与开发毕业源码案例设计 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值