Python 小项目 01 爬虫项目 爬取链家网南京地区二手房信息

SpiderLianjia

介绍

python爬虫小程序,爬取链家网南京地区普通住宅二手房数据。

代码下载: https://gitee.com/lihaogn/SpiderLianjia

1 程序设计

1.1 开发环境
  • 操作系统:macOS Mojave
  • 软件需求:Python 3.6、MongoDB 3.6.2
1.2 基本功能
  1. 爬取链家网中南京市二手房普通住宅分类前40页的详细信息
  2. 绘制出鼓楼区不同装修情况的二手房的建筑面积与总价的关系图
1.3 程序流程图
1.3.1 爬取数据

在这里插入图片描述

1.3.2 数据处理与图绘制

在这里插入图片描述

1.4 数据库设计
1.4.1 数据表设计
字段名字段数据类型
标题名称String
房屋总价String
小区名称String
行政区域String
房屋地址String
房屋户型String
所在楼层String
建筑面积String
户型结构String
套内面积String
建筑类型String
房屋朝向String
建筑结构String
装修情况String
梯户比例String
配备电梯String
产权年限String

2 使用说明

2.1 安装与配置

2.1.1 安装Python
  1. 访问官网,进入下载页面,选择对应操作系统的版本进行下载,之后安装即可。

  2. 配置环境变量:

    Windows系统在安装时直接选择添加环境变量即可。

  3. 打开终端或命令提示符,输入以下指令来安装第三方库文件:

pip install lxml
pip install beautifulsoup4
pip install matplotlib
pip install numpy
pip install pandas
pip install pymongo
pip install requests
2.1.2 安装MongoDB
  1. 访问官网,进入下载页面下载软件,之后安装即可。macOS下载的是压缩包,解压即可。

  2. 配置环境变量:
    macOS需要在主目录.bash_profile文件中添加MongoDB所在的安装路径。

    添加的语句为:

    MONGODB_HOME=”你安装MongoDB的绝对路径”
    PATH=”$ MONGODB_HOME/bin:$PATH

2.2 操作说明

2.2.1 运行数据库服务
  1. Windows系统,需要打开安装目录,双击mongod.exe来运行数据库服务。
  2. macOS,打开终端,输入“mongod”指令来运行数据库服务。
2.2.2 爬取数据并入库
  1. 打开终端或命令提示符,输入指令进入项目文件夹

  2. 运行以下指令,进行爬取数据:

    python spider_work.py
    
2.2.3 绘制关系图
  1. 打开终端或命令提示符,输入指令进入项目文件夹

  2. 运行以下指令,进行绘图操作:

    python dataAnalyse.py
    

3 结果展示

3.1 数据库截图

在这里插入图片描述

3.2 绘图

在这里插入图片描述

  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值