数据分析
文章平均质量分 66
yehui_qy
这个作者很懒,什么都没留下…
展开
-
数据分布-泊松分布
泊松分布的现实意义是什么?为何现实生活多数服从于泊松分布?一、基础概念 在一个时间段内事件平均发生的次数服从泊松分布,这个次数在泊松分布中用lambda表示(与指数分布里面的意义一样,是一个时间段内事件平均发生的次数)。泊松分布(Poisson)是指某段连续的时间内某件事情发生的次数,而且“某件事情”发生所用的时间是可以忽略的。假如你把“连续的时间”分割成无数小份,那么每个小份之间都是相互独立翻译 2016-11-18 15:14:27 · 9516 阅读 · 0 评论 -
tensorboard的使用
tensorboard启动pip show tensorflowpython tensorboard/**.py –logdir=”tensorboard数据分析原创 2017-10-18 11:10:16 · 538 阅读 · 0 评论 -
weka使用
简介 集数据预处理、学习算法(分类、回归、聚类、关联分析)和评估方法等为一体的综合性数据挖掘工具。weka下载链接:https://sourceforge.net/projects/weka/files/weka-3-8/3.8.1/weka-3-8-1-oracle-jvm.dmg/download?use_mirror=nchc入口界面 Explorer (探索环境)Knowledge原创 2017-02-23 22:06:34 · 1382 阅读 · 0 评论 -
weka使用调研
简介 集数据预处理、学习算法(分类、回归、聚类、关联分析)和评估方法等为一体的综合性数据挖掘工具。weka下载链接:https://sourceforge.net/projects/weka/files/weka-3-8/3.8.1/weka-3-8-1-oracle-jvm.dmg/download?use_mirror=nchc入口界面 Explorer (探索环境)Knowledge翻译 2017-02-20 15:04:24 · 777 阅读 · 0 评论 -
多种数据过滤与降维算法
数据过滤1. 缺失值比率 (Missing Values Ratio) 方法的是基于包含太多缺失值的数据列包含有用信息的可能性较少。因此,可以将数据列缺失值大于某个阈值的列去掉。阈值越高,降维方法更为积极,即降维越少。2. 低方差滤波 (Low Variance Filter) 与上个方法相似,该方法假设数据列变化非常小的列包含的信息量少。因此,所有的数据列方差小的列被移除。需要注意的一点转载 2017-01-10 15:58:21 · 9222 阅读 · 1 评论 -
统计学相关基础
大纲原创 2017-01-09 14:44:35 · 575 阅读 · 0 评论 -
机器学习-常见的数据预处理
背景常见的数据预处理方法转载 2016-12-21 20:36:36 · 19966 阅读 · 1 评论 -
机器学习-数据归一化
定义数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。两种常用的归一化方法 min-max标准化Z-score标准化方法优点归一化后加快了梯度下降求最优解的速度转载 2016-12-21 17:09:52 · 11698 阅读 · 0 评论 -
libsvm使用
libsvm原创 2016-12-06 18:57:02 · 722 阅读 · 0 评论 -
基本统计与统计分析
相关矩阵-相关系数 与协方差的区别是:协方差的绝对值大小不能评判相关性强弱,而相关系数弥补了这个缺点。 相关矩阵也叫相关系数矩阵,是由矩阵各列间的相关系数构成的。也就是说,相关矩阵第i行第j列的元素是原矩阵第i行和第j列的相关系数。这里的相关系数是指皮尔逊相关系数。 著名统计学家卡尔·皮尔逊设计了统计指标——相关系数。相关系数是用以反映变量之间相关关系密切程度的统计指标。相关原创 2016-12-01 16:37:14 · 815 阅读 · 0 评论 -
高维数据可视化
tsne- import tensorflow as tfimport mathfrom sklearn import datasetsfrom sklearn.manifold import TSNEimport numpy as npimport matplotlib.pyplot as plt#n_components 维数#iris_dataset = datasets.l原创 2017-10-26 15:19:18 · 2511 阅读 · 0 评论