【新手向】爬取链家二手房信息并可视化

本文向新手介绍如何爬取链家网站的二手房信息,并进行数据可视化。通过定义URL,发送网络请求,解析HTML,筛选所需数据,最后将数据保存并进行可视化展示。
摘要由CSDN通过智能技术生成

爬取链家二手房信息

步骤

  1. 定义一个url,程序向指定网站发送网络请求
  2. 接收网站响应并解析响应结果response html
  3. 根据需求筛选网站响应结果
  4. 将筛选之后得到的数据保存本地存储

代码

import requests
import pandas as pd
from lxml import etree 
from pyecharts.charts import Bar

url = 'https://cs.lianjia.com/ershoufang/'
response = requests.get(url)   #&l
下面是一个简单的示例代码,可以实现从链家网站上爬取二手房信息,并将其存储到本地的 csv 文件中,同时使用 pandas 和 matplotlib 库对数据进行可视化并保存为图片。 ```python import requests from bs4 import BeautifulSoup import pandas as pd import matplotlib.pyplot as plt # 爬取链家二手房信息,并将其存储到本地的 csv 文件中 url = 'https://bj.lianjia.com/ershoufang/' headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} res = requests.get(url, headers=headers) soup = BeautifulSoup(res.text, 'html.parser') house_list = soup.select('.sellListContent li') data = [] for house in house_list: title = house.select('.title a')[0].text.strip() price = house.select('.priceInfo .totalPrice span')[0].text.strip() data.append([title, price]) df = pd.DataFrame(data, columns=['Title', 'Price']) df.to_csv('lianjia.csv', index=False, encoding='utf-8') # 使用 pandas 和 matplotlib 库对数据进行可视化并保存为图片 data = pd.read_csv('lianjia.csv') price = data['Price'].astype(float) plt.hist(price, bins=20, color='skyblue') plt.xlabel('Price') plt.ylabel('Count') plt.title('Distribution of House Prices') plt.savefig('price_distribution.png') ``` 以上示例代码中,我们首先使用 requests 和 BeautifulSoup 库爬取链家二手房信息,并将其存储到本地的 csv 文件中。然后使用 pandas 和 matplotlib 库对数据进行可视化,并将可视化结果保存为图片。如果需要进行更复杂的数据处理和可视化操作,可以参考 pandas 和 matplotlib 官方文档,或者查找相关的教程和示例代码。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值