自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (2)
  • 收藏
  • 关注

原创 2015课外书 书单

我决定把2015年每个月看的和专业不太相关的书都贴在这个博客里,以激励自己多看课外书。1月:《黑天鹅:如何应对不可预知的未来》 作者:(美)塔勒布 著,万丹,刘宁

2015-02-05 20:01:53 803

原创 开源软件学习之Crab

最新实现了协同过滤的简单代码,正好知道有个用python写的开源项目,就下载下来对比学习一下。Crab的官网: http://muricoca.github.io/crab/一、安装前一篇博文:http://blog.csdn.net/joyce0625/article/details/42340831二、使用我打算先走通一条线,先以us

2015-01-03 21:57:28 1730

原创 Windows 7下安装python recommender Crab步骤

最近用代码实现了item-base CF 和user-based CF, 想与开源软件里的代码比较一下,就找到了用Python写的Crab,官网上写得也不是太清楚,有些链接也存在问题,就在这里简单说明下步骤官网: http://muricoca.github.io/crab/一、安装(1)搭建C/C++编译环境MinGW: http://www.metsky.com

2015-01-02 13:32:41 1908

原创 总结14,展望15

做的事:2-4月:完成了 微博中机器用户的分类研究5-7月: deep learning, 6月底去北京参加了一个ADL7月底 - 9月:线性代数、PRML 10月,11月基本在忙实习,从11月份开始看coursera上的机器学习基石课程以及princeton的算法课6月15日-11月15日:康明斯商务智能部的实习12月初:去深圳参加了NLPCC 期间还学习了古筝,去云

2015-01-01 09:21:46 1150

原创 特征值分解与奇异值分解

特征值分解和奇异值分解是重要的线代知识,在大量算法里面出现,特意在这里总结一下。*特征值分解定义::特征值:对应的特征向量目标:将一个矩阵分解成过程:方法:算出A的特征值,组成Σ;算出每个特征值对应的特征向量(彼此正交),组成S含义:对一个N阶对称方阵进行特征分解,就是产生了该空间的N个标准

2014-12-30 17:45:01 1977

原创 Recsys 2014 Automating Readers’ Adivsory to make book recommendations for K-12 Readers

作者:Maria Soledad Pera           Yie-Kai NgBrigham Young University名词说明:K:Kindergadom   12:12年级,相当于国内高三现在的系统存在的问题:1.     没有考虑读者的阅读能力,对于青少年的确该考虑到2.     受到信息保密等限制,目前很多推荐基于的信息都是拿不到的(交互、历史)

2014-12-17 14:26:09 817

原创 数据结构算法应用

1.问题: 对一组长度为N的数组,找到其中排序为第K个的数   回答:采用快速排序的方法import java.util.*;public static Comparable select (Comparable[] a, int K){     if(k= a.length)     { throw new IndexOutOfBoundsException("k

2014-12-13 16:43:45 591

原创 K Nearest-Neighbour 总结

K nearest-neighbour methods 理论依据:主要是基于相似性 算法步骤:(1)       数据归一化处理(2)       找到待分类点或者待预测点的K个最近邻①    相关数据:欧氏距离②    文本:余弦相似度(3)       预测①  分类概率最大的那个类别就是要找的类别②  数值预测K个最近邻的平均值

2014-09-07 16:40:57 1604

原创 Random Forest 学习笔记整理

这篇文章是自己对学习random forest的整理,里面参考了很多其他博主的成果,非常感谢,他们的原文链接详见参考文献。Random Forest,顾名思义,Random就是随机抽取,Forest就是说这里不止一棵树,而由一群决策树组成的一片森林,连起来就是用随机抽取的方法训练出一群决策树来完成分类任务。RF用了两次随机抽取,一次是对训练样本的随机抽取;另一次是对变量的随机抽取。

2014-05-07 16:13:49 8776 3

原创 查看Hadoop-1.2.1里面的例子jar并对WordCount进行修改

1.查看Hadoop-1.2.1里面的例子jar进入 /usr/program/hadoop-env/ hadoop-1. 2.1/bin目录下,直接用hadoop命令可以看到所有可以使用的命令比如hadoop中的已经有的jar包比如:显示某个jar包的使用参数2.修改wordcount.java代码它在h

2014-05-03 12:19:22 2651

原创 Linux(centos) 中jdk 下载与安装

今天在搭建Hadoop的伪分布集群时发现,网上的

2014-05-02 21:05:18 1228

RC4算法 C++实现

RC4算法的代码实现,所用的语言是C++,内含RC4.cpp等文件

2012-04-16

Copula理论及应用实例

Copula理论及matlab应用实例 Copula theory and instances with detailed code

2012-04-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除