高维数据可视化

tsne - import tensorflow as tf import math from sklearn import datasets from sklearn.manifold import TSNE import numpy as np import matplotlib.pyplo...

2017-10-26 15:19:18

阅读数 1125

评论数 0

tensorboard的使用

tensorboard启动 pip show tensorflow python tensorboard/**.py –logdir=” tensorboard数据分析

2017-10-18 11:10:16

阅读数 259

评论数 0

weka使用

简介 集数据预处理、学习算法(分类、回归、聚类、关联分析)和评估方法等为一体的综合性数据挖掘工具。weka下载链接:https://sourceforge.net/projects/weka/files/weka-3-8/3.8.1/weka-3-8-1-oracle-jvm.dmg/down...

2017-02-23 22:06:34

阅读数 554

评论数 0

weka使用调研

简介 集数据预处理、学习算法(分类、回归、聚类、关联分析)和评估方法等为一体的综合性数据挖掘工具。weka下载链接:https://sourceforge.net/projects/weka/files/weka-3-8/3.8.1/weka-3-8-1-oracle-jvm.dmg/down...

2017-02-20 15:04:24

阅读数 400

评论数 0

多种数据过滤与降维算法

数据过滤1. 缺失值比率 (Missing Values Ratio) 方法的是基于包含太多缺失值的数据列包含有用信息的可能性较少。因此,可以将数据列缺失值大于某个阈值的列去掉。阈值越高,降维方法更为积极,即降维越少。 2. 低方差滤波 (Low Variance Filter) 与上个方...

2017-01-10 15:58:21

阅读数 3151

评论数 0

计算广告领域的几大经典问题

大纲

2017-01-09 14:55:13

阅读数 340

评论数 0

机器学习技能树

大纲

2017-01-09 14:51:32

阅读数 663

评论数 0

特征工程基础

大纲

2017-01-09 14:47:25

阅读数 265

评论数 0

机器学习基础

大纲

2017-01-09 14:45:22

阅读数 218

评论数 0

统计学相关基础

大纲

2017-01-09 14:44:35

阅读数 440

评论数 0

机器学习-常见的数据预处理

背景常见的数据预处理方法

2016-12-21 20:36:36

阅读数 11497

评论数 1

机器学习-数据归一化

定义 数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。 两种常用的...

2016-12-21 17:09:52

阅读数 8452

评论数 1

libsvm使用

libsvm

2016-12-06 18:57:02

阅读数 487

评论数 0

基本统计与统计分析

相关矩阵-相关系数 与协方差的区别是:协方差的绝对值大小不能评判相关性强弱,而相关系数弥补了这个缺点。 相关矩阵也叫相关系数矩阵,是由矩阵各列间的相关系数构成的。也就是说,相关矩阵第i行第j列的元素是原矩阵第i行和第j列的相关系数。这里的相关系数是指皮尔逊相关系数。 著名统...

2016-12-01 16:37:14

阅读数 406

评论数 0

crond定时任务

定时任务 sudo touch /etc/cron.d/yehui sudo vim /etc/cron.d/yehui 47 14 * * * root bash /home/a/husky/apps/ecpm_algo_n_cmopeval/bin/mlp common_main_flow&...

2016-11-28 15:46:17

阅读数 217

评论数 0

机器学习-多分类问题

决策树和svm用于多分类的表现上的差异:

2016-11-18 15:53:37

阅读数 8854

评论数 0

数据分布-泊松分布

泊松分布的现实意义是什么?为何现实生活多数服从于泊松分布? 一、基础概念 在一个时间段内事件平均发生的次数服从泊松分布,这个次数在泊松分布中用lambda表示(与指数分布里面的意义一样,是一个时间段内事件平均发生的次数)。 泊松分布(Poisson)是指某段连续的时间内某件事情发生的次数,而且“...

2016-11-18 15:14:27

阅读数 3724

评论数 0

sql

显示表中除了partition意外的所有列 select t.`(ds)?+.+` from table t; wm_concat(‘;’,cust_id) 聚合 yin count(DISTINCT ) ,统计非空 coalesce(a,0) 相当于if(a=null,0,a) SELECT ...

2016-07-26 17:11:07

阅读数 407

评论数 0

maven test debug 方法

在配置化自动化测试方法的执行依赖于maven test指定的配置文件的场景下,需要由maven test来触发的集成测试,无法直接采用idea debug test方法的方式;这种情况下可以采用maven debug的方式来debug代码,可以分为远程debug和本地debug两种模式,本文以远程...

2016-07-21 07:39:43

阅读数 3205

评论数 0

一些链接

测试

2016-07-19 10:25:43

阅读数 315

评论数 1

提示
确定要删除当前文章?
取消 删除
关闭
关闭