用Jupyter—Notebook爬取网页数据实例10

用selenium库爬取优信二手车信息

上代码
在这里插入图片描述

#引入selenium、 pandas、openpyxl库
from selenium import webdriver
import pandas as pd
import openpyxl
#定义存储变量
mingcheng=[]
gongli=[]
diqu=[]
#获取网页源代码
for i in range(1,6):
    url='https://www.xin.com/hangzhou/baoma/i'+str(i)
    browser=webdriver.Chrome()
    browser.get(url)
#解析源代码,提取所需数据信息     
    for i in browser.find_elements_by_class_name('across'):
        mingcheng.append(i.find_elements_by_class_name('pad')[0].find_elements_by_tag_name('span')[0].text)
        gongli.append(i.find_elements_by_class_name('pad')[0].find_elements_by_tag_name('span')[1].text)
        diqu.append(i.find_elements_by_class_name('pad')[0].find_elements_by_tag_name('span')[2].text)
pd.DataFrame({'名称':mingcheng,'公里':gongli,'地区':diqu})
data=pd.DataFrame({'名称':mingcheng,'公里':gongli,'地区':diqu})  
writer=pd.ExcelWriter('youxin.xlsx')
data.to_excel(writer,'爬虫数据')
writer.save()
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Jupyter Notebook是一个开源的交互式编程环境,被广泛用于数据分析和数据科学项目。在期末大作业数据收集这个问题中,可以利用Jupyter Notebook来完成以下任务: 1. 数据源的选择:在期末大作业中,首先需要确定数据的来源。这可以是公共数据集、实验数据、网络虫获数据等等。在Jupyter Notebook中可以使用合适的第三方库(如Pandas、Numpy等)来加载和处理数据。 2. 数据收集方法:根据数据源的不同,收集数据的方法也会有所不同。可以使用Jupyter Notebook中的代码单元格来编写数据收集的代码。如果数据来自于公共数据集,可以使用Pandas库提供的接口来读数据。如果数据需要通过网络虫获,可以使用Python中的相关库(如BeautifulSoup、Selenium等)来实现。 3. 数据清洗和预处理:在数据收集之后,往往需要进行数据清洗和预处理,以便后续的数据分析和建模。可以使用Jupyter Notebook中的代码单元格来编写相关代码,使用Pandas库等进行数据清洗、去重、填充缺失值等操作。 4. 数据可视化:在数据收集之后,可以使用Jupyter Notebook中的可视化库(如Matplotlib、Seaborn等)来对数据进行可视化分析。可以绘制折线图、柱状图、散点图等,来展示数据的分布、趋势、关联等信息。 5. 数据存储:在期末大作业完成后,可以将整理好的数据保存到合适的格式(如CSV、Excel、数据库等)中,以便其他人或后续工作使用。在Jupyter Notebook中,可以使用相关库(如Pandas的to_csv()函数)来实现数据的存储。 综上所述,Jupyter Notebook可以作为一个强大的工具,帮助完成期末大作业中的数据收集工作。它提供了编程环境和丰富的第三方库,能够方便地进行数据加载、处理、清洗、可视化和存储等操作。同时,Jupyter Notebook具有交互性和可重复性,方便数据收集过程的迭代和修改。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值