自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (3)
  • 收藏
  • 关注

原创 hive待续

hiveuse database;进入数据库show tables;显示所有表desc tablename;查看表结构drop table tablename;删除表create talbe tablename(id bigint, name string); 创建表insert overwrite talbe tablename select 100, 'hell

2015-10-27 23:42:16 321

原创 数据分析——数据标准化

一、为何要将数据标准化?为了消除量纲影响和变量自身变异大小和数值大小的影响,故将数据标准化。  由于不同变量常常具有不同的单位和不同的变异程度。不同的单位常使系数的实践解释发生困难。例如:第1个变量的单位是kg,第2个变量的单位是cm,那么在计算绝对距离时将出现将两个事例中第1个变量观察值之差的绝对值(单位是kg)与第2个变量观察值之差的绝对值(单位是cm )相加的情况。

2015-10-27 17:07:08 4741

原创 大嘴巴漫谈笔记-抽样分布与假设检验

大嘴巴漫谈笔记-抽样分布与假设检验总体分布:所有元素出现概率的分布.样本分布:选择的样本在随机变量上的对应的频次分布,抽样分布:样本的函数分布,是样本统计量的概率分布【统计量是样本的函数,如:均值、求和、方差】 总体思想:借助样本估计总体如何借助样本数据估计总体未知参数?答:参数估计 参数估计常用两种方法:样本数据值叫观测值总体数据值叫理论论

2015-10-25 21:52:05 985

原创 R连接SQL SERVER

1.配置SQL SERVER   ODBC数据源操作系统搜索odbc/系统DSN/配置/server填远程服务器的IP...2.R代码Sys.setenv(JAVA_HOME='D:\\Programe Files\\WorkRelated Programs\\Java\\jdk1.7.0_21\\jre')library(rJava)library(RODBC)c

2015-10-15 17:30:00 704

原创 大数据之数据挖掘理论笔记 聚类问题之K-means

大数据之数据挖掘理论笔记   聚类问题之K-means推荐参考博文: http://www.cnblogs.com/leoo2sk/archive/2010/09/20/k-means.html 推荐参考博文: http://blog.csdn.net/cyxlzzs/article/details/7416491  试过了,确实可运行。http://blog.csdn.net

2015-10-06 15:46:51 1679

20news-bydate.tar.gz

from sklearn.datasets import fetch_20newsgroups操作时需要下载文本数据20newsgroups,若发生下载url获取失败,应对方法:打开site-packages/sklearn/datasets下的twenty_newsgroups.py文件,找到download_20newsgroups方法,注释掉其中url相关苦干行控制下载的语句。运行后提示c://user//...,按提示在c://user//...下新建文件夹scikit_learn_data,将20news-bydate.tar.gz解压好的文件放入即可。

2016-08-03

eclipse平台python开发

1.把zip解压到eclipse目录下,把features和plugins覆盖; 重启eclipse后在eclipse的window->perperence里能够看到pydev,点击Interpreter -Python, NEW Python Interpreters, 输入python安装路径; 2.测试的话:new->other project->pydev->选择pydev project,创建"HelloPython"工程,"HelloPython"包,上测试代码。

2016-07-24

scipy , gensim for python2.7 (windows)

scipy , gensim for python2.7 (windows) 安装参考http://blog.csdn.net/houxiaoqin/article/details/50887858

2016-03-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除