自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (2)
  • 收藏
  • 关注

转载 常用分类算法

分类算法通常需要经过两步:训练和分类。如下:训练:训练集——>特征选取——>训练——>分类器分类:新样本——>特征选取——>分类——>判决最初的数据挖掘分类应用大多都是在这些方法及基于内存基础上所构造的算法。目前数据挖掘方法都要求具有基于外存以处理大规模数据集合能力且具有可扩展能力。下面对几种主要的分类方法做个简要介绍:(1)决策树决策树归纳是经典的分类算法。它采用自顶

2012-02-23 00:26:49 1787

原创 统计学笔记

基本概念1. 直方图按方块的面积衡量所占的比例(一般没有纵向刻度,可能会有密度尺度)2. 平均数和中位数中位数:直方图上左右两边面积相等3. 均方根(Root mean square)r.m.s = sqrt(n1^2 + n2^2 + ...)4. 标准差指出数列中的数离它们的平均数有多远s.d. = sqrt((与平均数的偏差)^2的平均数)

2012-02-08 20:14:48 1854

转载 hive QL(HQL)简明指南

同事整理的,大部分原文摘过来,有少量改动。1. 基本数据类型tinyint , smallint, int, bigint, float, double, boolean: true/false, string2. 基础运算符与函数A IS NULL         空A IS NOT NULL     非空    A LIKE B     模糊匹配A RLIKE B

2012-02-06 14:59:05 4671

豆瓣备份工具

所有的东西都在配置文件里,主要包括: accesstoken:这个初始为空,需要通过oauth认证之后才能得到 accesstokensecret:同上 apikey: 豆瓣API的api key。我的是0e9de689fedd51532bd9b39dfc97f3f9,也可以自己申请一个,然后填自己的。 apisecret: 豆瓣API的secret。我的是379697627fa46e08,也可以自己申请一个,然后填自己的。 username:如果在公司局域网内有代理,需要填这个。通常是域帐户名(或你电脑的登录名,如果你的电脑是连到域里的)。如果没用代理就填空。 password:域帐户的登录密码,如果没用代理就填空。 domain:登录域,如果没用代理就填空。 proxyserver:代理服务器。注意不需要http://前缀。直接例如:proxyserver.dangdang.com,即可。如果没用代理就填空。 port:代理端口,如果没用代理就填0。 userid:豆瓣的用户ID。如e.neverme或1341234567。 这些都填了之后,点“备份”就行啦。由于豆瓣API的限制,每分钟只能请求40次,所以其实每做一个请求,程序都会sleep几秒(不然就被封了)。如果你的东西非常多,那可能需要一些时间。 目前已知的问题是豆邮只有标题没有内容,我说没有备份。其他应该都还好。

2013-02-15

豆瓣电台桌面版,同步MSN正在播放的音乐

豆瓣电台桌面程序,能在MSN上显示正在收听的音乐。

2010-02-24

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除