![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python数据挖掘
*Slime*
这个作者很懒,什么都没留下…
展开
-
数据挖掘(简单分析)
处理“单连续变量”缺失值:df.isnull() #df就是加载进来的数据,DataFrame类型的异常值: 箱型图模型画图:核密度估计:sns.kdeplot()直方图图:sns.distplot()判断方法:df.info()分类:连续型(continuous)和标称型或分类变量(categorical) f= r'movies_metadata.csv' df =...原创 2019-04-03 21:24:48 · 1838 阅读 · 0 评论 -
Python超基础学习笔记
一些易忘记的知识点a**b #a的b次幂range(a,b,c) #表示以a为首项,c为公差且不超过b-1的等差数列lambda 内行函数f = lambda x : x + 2 #定义函数f(x)=x+2数据结构1)列表(用方括号,列表可以被修改)容器里是什么都行不能复制b=a(相当于b就是a)要b = a[ : ]有关的函数是list2)元组(用圆括号,元组不可以...原创 2019-04-10 19:47:45 · 134 阅读 · 0 评论 -
python学习笔记-数据挖掘(数据分析)
数据质量分析 主要任务: 检查脏数据脏数据包括:缺失值异常值不一致的值重复数据及含有特殊符号(如#,&,*)的数据。1)缺失值分析:2)异常值分析:样例:import matplotlib.pyplot as pltimport numpy as npimport pandas as pdimport matplotlib as mplimport s...原创 2019-04-11 13:41:30 · 899 阅读 · 0 评论 -
学习笔记-数据预处理(数据挖掘)
数据预处理与本文有关的代码和数据包在以下百度云网盘中,欢迎大家下载实践。链接:https://pan.baidu.com/s/1O9DXGSGNlT2fkHX1woBpBA提取码:m69u 主要内容:数据清洗数据集成数据变换数据规约 ## 数据清洗对象:无关数据,重复数据,平滑噪声数据,筛选掉与挖掘主题无关的数据,处理缺失值,异常值等。1)缺失值处理方法:删除记录,数据插...原创 2019-04-16 17:36:09 · 865 阅读 · 0 评论