【新手向】爬取链家二手房信息并可视化

爬取链家二手房信息

步骤

  1. 定义一个url,程序向指定网站发送网络请求
  2. 接收网站响应并解析响应结果response html
  3. 根据需求筛选网站响应结果
  4. 将筛选之后得到的数据保存本地存储

代码

import requests
import pandas as pd
from lxml import etree 
from pyecharts.charts import Bar

url = 'https://cs.lianjia.com/ershoufang/'
response = requests.get(url)   #<Response [200]>:请求状态码  2XX:请求成功 3XX:请求重定向 4XX:请求出现错误 5XX:服务器内部错误
html_text = response.content.decode()

html = etree.HTML(html_text)  #解析html
ershoufang = []
div_list = html.xpath('.//div[@class="info clear"]')
for div in div_list:
    name = div.xpath('.//div[@class="positionInfo"]/a/text()')[0]
    price = div.xpath('.//div[@class="unitPrice"]/span/text()')[0].replace('元/平米','').replace('单价','')
    ershoufang.append([name,float(price)])
    #print(ershoufang)
    
title = ['小区名称','小区单价(元/平米)']
table = pd.DataFrame(ershoufang,columns = title)
table.to_excel('C:\\Users\\ThinkPad\\Desktop\\面试\\ershoufang.xlsx') #保存到本地excel文件
#可视化
bar = Bar()
bar.add_xaxis(list(table['小区名称']))
bar.add_yaxis('长沙二手房房价',list(table['小区单价(元/平米)']))
a = bar.render()

可视化结果

在这里插入图片描述

©️2020 CSDN 皮肤主题: 深蓝海洋 设计师:CSDN官方博客 返回首页