![](https://img-blog.csdnimg.cn/20190906084942245.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
Python数据分析与挖掘实战
文章平均质量分 50
郭大侠写leetcode
这个作者很懒,什么都没留下…
展开
-
《Python数据分析与挖掘实战》笔记(一):数据挖掘基础
目录一、数据挖掘的基本任务二、数据挖掘建模过程三、常用的数据挖掘建模工具一、数据挖掘的基本任务 利用分类与预测、聚类分析、关联规则、时序模式、偏差检测、智能推荐等方法,帮助企业提取数据中蕴含的商业价值,提升企业的竞争力。二、数据挖掘建模过程定义挖掘目标:任务目标和完成效果数据取样:相关性、可靠性、有用性数据探索:数据质量分析、数据特征分析数...原创 2017-06-05 13:56:32 · 2109 阅读 · 0 评论 -
《Python数据分析与挖掘实战》笔记(二):Python2.7语法和第三方库
目录Python2.7语法基本操作数据结构函数式编程第三方库Numpy——提供数组支持,以及相应的高效的处理函数Scipy——提供矩阵支持,以及矩阵相关的数值计算模块Matplotlib——数据可视化工具Pandas——数据分析和探索工具StasModels——统计建模Scikit-Learn——机器学习库Keras——神经网络、深度学习库Gen...原创 2017-06-05 17:12:15 · 1154 阅读 · 0 评论 -
《Python数据分析与挖掘实战》笔记(三):数据探索
一、数据质量分析原创 2019-09-06 09:57:52 · 153 阅读 · 0 评论 -
《Python数据分析与挖掘实战》笔记(四):数据预处理
一、数据清洗缺失值处理(1)删除记录(2)不处理(3)数据插补均值、中位数、众数插补使用固定值最近临插补回归方法插值法:拉格朗日插值法,牛顿插值法异常值处理(1)删除记录(2)不处理(3)数据插补二、数据集成数据集成就是将多个数据源合并存放在一个一致的数据存储中的过程实体识别(1)同名异意(2)异名同意(3)单位不一致冗余属性识别(1)同一属性多次出现...原创 2019-09-06 10:52:30 · 371 阅读 · 0 评论 -
Python数据分析——基于CART决策树的用户识别
项目要求 传统的偷漏税分析是通过人工检测来进行的,对人的依赖性太大,为了提高偷漏税的判别效率,拟决定先根据商户的纳税数据进行初步的自动判断,对于判别为偷漏税的用户再进行人工检测。数据集 本文提供的数据集指标类型如下,一共124条记录。数据探索 对数据集进行缺失值分析,未发现缺失值import...原创 2017-07-02 13:27:04 · 2158 阅读 · 0 评论