![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
快乐的冲浪码农
这个作者很懒,什么都没留下…
展开
-
基于北京二手房价数据的探索性数据分析和房价评估——房价评估模型构建
数据分析项目——北京二手房价数据分析 第一步:获取数据(在这里获取这个实验的数据集!!) 第二步:数据读取和数据预处理 第三步:数据的可视化分析 第四步:构建房价评估模型(决策树、随机森林等) 文章目录1 数据预处理1.1 分解户型列1.2 特征选取1.3 分类数据转换2 数据特征相关性分析3 建立模型3.1 划分数据集3.2 决策树模型学习曲线构建模型决策树可视化3.3 随机森林学习曲线构建模型3.4 k-近邻模型4 测试4.1 测试用例4.2 测试 1 数据预处理 1.1 分解户型列 通过上述分析,原创 2020-11-20 20:47:04 · 2819 阅读 · 4 评论 -
基于北京二手房价数据的探索性数据分析和房价评估——数据的可视化分析
文章目录1 区域因素1.1 各区域内二手房的分布情况1.2 各区域内二手房的单价情况1.3 各区域内二手房的总价情况2 小区因素2.1 小区房源数量分布2.2 小区总房价对比3 面积因素3.1 各个面积区间内房屋的数量3.2 面积与房屋总价的关系4 户型因素4.1 户型统计4.2 户型与总价的关系5 热度、观看人数因素5.1 热度因素5.2 观看人数因素6 发布时间因素6.1 不同发布时间的房屋数量6.2 不同发布时间的房屋总价 由于图表分析无法更加直观的分析各个因素与房屋价格的关系,因此在进行数据的预处原创 2020-11-20 20:34:22 · 3177 阅读 · 2 评论 -
基于北京二手房价数据的探索性数据分析和房价评估——数据的读取和预处理
文章目录1 读取数据1.1 导入数据1.2 列重命名2 数据预处理2.1 统一数据格式2.2 数据列的拆分2.3 处理缺失值2.4 处理重复值 1 读取数据 在本阶段需要导入数据集中的数据,并且对数据进行初步观察,为了方便后续的操作,对数据集中的中文字段进行修改。 1.1 导入数据 使用pandas的.read_csv方法读取数据集bj.csv,编码方式为gbk data = pd.read_csv('./数据集/bj.csv', encoding='gbk') 1.2 列重命名 data = data.原创 2020-11-20 19:51:26 · 1426 阅读 · 0 评论 -
基于北京二手房价数据的探索性数据分析和房价评估——项目设计和数据的获取
数据分析项目——北京二手房价数据分析 第一步:获取数据(在这里获取这个实验的数据集!!) 第二步:数据读取和数据预处理 第三步:数据的可视化分析 第四步:构建房价评估模型(决策树、随机森林等) 下载地址: ...原创 2020-11-20 20:49:47 · 1224 阅读 · 2 评论 -
【速查手册】Pandas........(持续更新)
记录一些使用频率较高的,便于查阅 文章目录Pandas1、关键缩写和包导入2、导入数据3、导出数据4、创建测试对象5、查看、检查数据6、数据选取7、数据清理8、数据处理:Filter、Sort和GroupBy9、数据合并10、数据统计 Pandas 1、关键缩写和包导入 在这个速查手册中,我们使用如下缩写: df:任意的Pandas DataFrame对象 s:任意的Pandas Series对象 同时我们需要做如下的引入: import pandas as pd import numpy as n.原创 2020-11-07 10:51:40 · 109 阅读 · 0 评论