- 博客(5)
- 资源 (3)
- 收藏
- 关注
原创 hive待续
hiveuse database;进入数据库show tables;显示所有表desc tablename;查看表结构drop table tablename;删除表create talbe tablename(id bigint, name string); 创建表insert overwrite talbe tablename select 100, 'hell
2015-10-27 23:42:16 321
原创 数据分析——数据标准化
一、为何要将数据标准化?为了消除量纲影响和变量自身变异大小和数值大小的影响,故将数据标准化。 由于不同变量常常具有不同的单位和不同的变异程度。不同的单位常使系数的实践解释发生困难。例如:第1个变量的单位是kg,第2个变量的单位是cm,那么在计算绝对距离时将出现将两个事例中第1个变量观察值之差的绝对值(单位是kg)与第2个变量观察值之差的绝对值(单位是cm )相加的情况。
2015-10-27 17:07:08 4741
原创 大嘴巴漫谈笔记-抽样分布与假设检验
大嘴巴漫谈笔记-抽样分布与假设检验总体分布:所有元素出现概率的分布.样本分布:选择的样本在随机变量上的对应的频次分布,抽样分布:样本的函数分布,是样本统计量的概率分布【统计量是样本的函数,如:均值、求和、方差】 总体思想:借助样本估计总体如何借助样本数据估计总体未知参数?答:参数估计 参数估计常用两种方法:样本数据值叫观测值总体数据值叫理论论
2015-10-25 21:52:05 985
原创 R连接SQL SERVER
1.配置SQL SERVER ODBC数据源操作系统搜索odbc/系统DSN/配置/server填远程服务器的IP...2.R代码Sys.setenv(JAVA_HOME='D:\\Programe Files\\WorkRelated Programs\\Java\\jdk1.7.0_21\\jre')library(rJava)library(RODBC)c
2015-10-15 17:30:00 704
原创 大数据之数据挖掘理论笔记 聚类问题之K-means
大数据之数据挖掘理论笔记 聚类问题之K-means推荐参考博文: http://www.cnblogs.com/leoo2sk/archive/2010/09/20/k-means.html 推荐参考博文: http://blog.csdn.net/cyxlzzs/article/details/7416491 试过了,确实可运行。http://blog.csdn.net
2015-10-06 15:46:51 1679
20news-bydate.tar.gz
2016-08-03
eclipse平台python开发
2016-07-24
scipy , gensim for python2.7 (windows)
2016-03-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人