![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
呼噜娃娃
生活没有偶然
展开
-
python数据挖掘与分析实战—1、2、3
一、数据挖掘的建模过程:1.1定义挖掘目标:1.1.1动态的菜品推荐1.1.2客户进行细分,关注最有价值的客户1.1.3基于菜品的历史销售情况,对菜品销量进行预测,预备原材料1.1.4基于大数据,优化选址,菜式调整1.2数据取样随机抽样,分类抽样,等距抽样1.3数据探索1.3.1异常值分析1.3.2缺失值分析1.3.3相关性分析1.3.4周期性分析原创 2017-04-30 18:14:00 · 2565 阅读 · 1 评论 -
python数据分析与挖掘实践—拉格朗日插值法
缺失值处理:举止,中位数,众数插补法使用固定值(规定的标准值)最近邻插补法回归方法插值法插值法有拉格朗日差值和牛顿插值法。一个较大的区别是,当节点增减的时候,拉格朗日插值必须重新计算,牛顿法则 可以避免这一点。下面是python scipy中的lagrange插值函数的使用,使用某个插值点前后的5个值x=[0,1,2,3,4,6,7,8,9,10],y=[y0,y1原创 2017-04-30 20:36:50 · 7666 阅读 · 13 评论 -
python数据分析与挖掘实战-4
数据预处理 1数据清洗 1.1缺失值处理 1.2异常值处理 删除 视为缺失值 平均值修正原创 2017-05-01 18:32:30 · 1555 阅读 · 0 评论 -
Python数据分析与挖掘实战—挖掘建模
常用的分类与预测算法1回归模型分类1线性回归---自变量因变量线性关系,最小二乘法求解2非线性回归--自变量因变量非线性关系,函数变换为线性关系,或非线性最小二乘方法求解3logistic回归--因变量一般有1和0两种取值,将因变量的取值范围控制再0-1范围内4岭回归--自变量之间具有多重共线性5主成分回归--自变量之间具有多重共线性一般自变量和因变量之间存在线性关系的原创 2017-05-02 23:10:04 · 3013 阅读 · 0 评论 -
python数据分析与挖掘实战—聚类算法对比
#-*-coding:utf-8-*-import numpy as npimport matplotlib.pyplot as pltfrom sklearn import datasetsx1,y1=datasets.make_circles(n_samples=5000,factor=.6,noise=0.05)x2,y2=datasets.make_blobs(n_sampl原创 2017-05-07 14:50:02 · 1938 阅读 · 0 评论