2021-07-02山东大学暑期实训第一周2


前言

这次主要展示需要爬取的网页及内容和前期的准备工作。


一、需要爬取的网页

1、阿里云

阿里云价格网页

阿里云服务器详情
阿里云具有“价格下载”的按钮和查询历史价格的API,因此获取数据并不是很困难。

2、腾讯云

腾讯云价格网页

腾讯云服务器详情
腾讯云也具有“导出全部”的按钮,因此获取数据有相对较容易。

3、华为云

华为云价格网页

华为云服务器详情
华为云并没有导出按钮,就需要编写爬虫程序。

4、百度云

百度云价格网页

百度云服务器详情
百度云也需要编写爬虫程序。

二、爬虫准备工作

我使用selenium模拟浏览器进行爬取,这需要先下载对应版本的Chromedrive。

Chromedrive镜像网站

下载、解压、安装
在这里插入图片描述
引入库

代码如下:

from selenium import webdriver
import time
import warnings
import pandas as pd
import csv
warnings.filterwarnings("ignore")
driver=webdriver.Chrome(executable_path=r"C:\Users\dell\AppData\Local\Google\Chrome\Application\chromedriver.exe")
#driver.get("https://piao.qunar.com/ticket/list.htm?keyword=%E6%B3%B0%E5%AE%89&region=&from=mpl_search_suggest")
driver.get("https://www.huaweicloud.com/pricing.html?tab=detail#/ecs")
time.sleep(3)

可以正常打开网页,说明安装成功

总结

这次主要展示需要爬取的网页及内容和前期的准备工作,下次就可以爬取数据,而我主要负责华为云的数据爬取。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值