- 博客(5)
- 资源 (5)
- 收藏
- 关注
原创 python数据变换
1.规范化将数据进行标准化处理,将数据按照比例进行缩放,使之落入一个特定的区域,便于进行综合分析。 1.最小-最大规范化 线性变换,将数值映射到【0,1】之间。 2.零-均值规范化 均值为0,标准差为1,标准正太分布,目前用到最多的方法 3.小数定标规范化 映射到【-1,1】之间#-*- coding: utf-8 -*-#数据规范化import pandas as p
2016-09-30 10:52:02 3420
原创 python数据清洗
1.缺失值的处理对于数据中缺失的值,可以有3种方法处理: 1.删除。比如餐厅的营业额,有几天去装修了,确实没营业,可以删除 2.不处理:有一些模型可以将缺失值作为一种特殊的值,可以直接建模。 3.补上: 均值/中位数/众数:一般情况吧 固定值:比如工资啊,补贴啊 最近临插补:最近的值,相邻的,补上下面是拉格朗日插值法 原理可以参考下面的博客 http://blog.csdn.net/
2016-09-26 17:07:59 4204
原创 python贡献度分析以及相关性分析小例子
贡献度又称帕累托,80%的利润来自20%的最畅销的产品,而其他80%的产品只产生了20%的利润。#-*- coding: utf-8 -*-#菜品盈利数据 帕累托图from __future__ import print_functionimport pandas as pd#初始化参数dish_profit = 'E:/PythonMaterial/chapter3/chapter3/de
2016-09-21 14:48:23 18422 2
原创 python数据质量分析小例子
数据和代码下载地址: http://pan.baidu.com/s/1kVg3KuN#-*- coding: utf-8 -*-import pandas as pdcatering_sale = 'E:/PythonMaterial/chapter3/chapter3/demo/data/catering_sale.xls' #餐饮数据#因为是xls文件,所以用read_excel方法,返
2016-09-20 16:45:15 6347 2
原创 在Windows中安装一些python的第三方库
这些库尽量建一个专门的文件夹集中存放 如果Python是32位的,那么库也装32位的,我的电脑是64位的,但装了32位的Python,反正也可以用 1.安装Numpy https://sourceforge.net/projects/numpy/files/NumPy/](https://sourceforge.net/projects/numpy/files/NumPy/)[ 在这里网址里
2016-09-12 14:38:48 8929 1
Ad-hoc network on Android.pdf
2013-12-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人