利用python进行简单的数据分析
在中关村在线进行抓取数据,所使用的网页是这个页面http://detail.zol.com.cn/cell_phone_index/subcate57_0_list_0-1000_0_7_2_0_1.html
1、首先要进行分析网页的HTML,我们所要抓取的数据是根据销量排名的手机信息,所以主要需要抓取手机的型号、价格、销量,按照“由小见大”的方法来获取所需要的html信息,如下图所示:
由上可以看出手机型号所在的HTML标签是“h3”,手机价格是在div中的class属性为“price-row”,手机的评价在class为“comment-num”中