python 抓取网页数据

本文介绍如何使用Python的BeautifulSoup库抓取中关村在线手机销量数据。通过分析HTML结构,提取手机型号、价格和销量信息,并对结果进行分析。红米和魅蓝销量领先,大神系列受认可,低价手机市场占比较大。
摘要由CSDN通过智能技术生成

利用python进行简单的数据分析


在中关村在线进行抓取数据,所使用的网页是这个页面http://detail.zol.com.cn/cell_phone_index/subcate57_0_list_0-1000_0_7_2_0_1.html

1、首先要进行分析网页的HTML,我们所要抓取的数据是根据销量排名的手机信息,所以主要需要抓取手机的型号、价格、销量,按照“由小见大”的方法来获取所需要的html信息,如下图所示:



由上可以看出手机型号所在的HTML标签是“h3”,手机价格是在div中的class属性为“price-row”,手机的评价在class为“comment-num”中


  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值