![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
分析
2020重新做人
这个作者很懒,什么都没留下…
展开
-
对广州链家网二手房数据进行分析
上一篇我们利用了python抓取了链家网广州地区的历史二手房数据,上一篇爬虫文章。这次将如何对数据进行分析。问题定义对于数据分析,第一步是定义问题,由于数据的获已经固定,所以问题固定住了是在广州地区二手房的问题上,所以我们有如下的问题:广州二手房各地区的房价概况各因素对房价的影响程度给定一定条件后的大概房价是多少数据预处理首先将数据从数据库中导出转为csv文件。在Excel中进行...原创 2019-06-12 18:06:50 · 5712 阅读 · 5 评论 -
数据降维:PCA主成分分析降维示例及函数参数解释
文章目录主成分分析(PCA)介绍PCA转化步骤PCA示例sklearn中的PCAPCA优缺点优点缺点主成分分析(PCA)介绍PCA也被叫做卡尔胡宁-勒夫转换(KLT),是一种用户在高维空间发现模式的技术。PCA常被用于探索和可视化高纬度数据集。PCA可以压缩数据,也就是所谓的数据降维。数据降维是指在保留重要信息的同时消除那些“无用信息量的信息”。PCA关注的是线性相关性,如果一个数据矩阵的列空...原创 2019-08-01 00:30:24 · 6316 阅读 · 0 评论 -
数据挖掘实战(二):信用卡欺诈检测
此次信用卡欺诈是采用科赛数据科学社区一个项目的数据集来分析的,具体的数据集可以在这里下载 传送门数据集有100多M,使用excel打开会有有些卡顿,所以直接在python观察文章目录数据集解读数据探索数据规范化数据集划分模型创建模型训练评估总结与不足数据集解读数据集名称数据类型特征数实例数值缺失相关任务信用卡欺诈检测数据集数值数据31284807无不平...原创 2019-08-08 23:39:24 · 5214 阅读 · 3 评论 -
数据挖掘实战:信用卡违约率分析建模
这次做一个信用卡违约率的分析项目,具体的数据集可以在这里下载 数据集传送门文章目录提出问题数据集解读数据探索数据处理建模分析缺点与不足提出问题总体的违约率情况怎样什么样的人群容易违约违约模型的准确率怎样数据集解读这是一个台湾银行2005年的信用卡数据,首先观察数据集,了解一下个字段含义:字段含义ID客户IDLIMIT_BAL可透支金额(新台币)...原创 2019-08-06 12:38:22 · 6677 阅读 · 1 评论