自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 node.js 垃圾回收

  V8脚本引擎   垃圾回收机制   1.scavenge scavenge主要采用了cheney算法。 cheney算法采用复制的方式实现。主要用于新生代内存(由于新生代内存生命周期短)。 优点:时间效率高,空间换取时间。 过程:将内存分为一分为二,两部分semispace,分别为 From和To。垃圾回收时,检查From内存中存活的对象复制到To中,释放From空间,并将...

2016-01-28 15:55:27 90

原创 机器学习

         机器学习三要素:模型、目标、算法,model  cost function       著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。作者:周小涛链接:http://www.zhihu.com/question/24900876/answer/65176508来源:知乎Linear Regression的cost function是最小二乘,即但是...

2015-12-04 17:38:10 92

原创 最小二乘法

最小二乘法:残差平方和最小,拟合曲线   一.背景    5月9号到北大去听hulu的讲座《推荐系统和计算广告在视频行业应用》,想到能见到传说中的项亮大神,特地拿了本《推荐系统实践》求签名。讲座开始,主讲人先问了下哪些同学有机器学习的背景,我恬不知耻的毅然举手,真是惭愧。后来主讲人在讲座中提到了最小二乘法,说这个是机器学习最基础的算法。神马,最基础,我咋不知道呢! 看来以后还是要对自己有...

2015-12-04 16:58:14 151

原创 Datamining

  数据集 1.一般特性    a 维度 dimensionality  b 稀疏性 sparsity    c 分辨率 resolution   2 记录数据      a 事物数据或者购物篮数据 transaction data   b 数据矩阵 data matrix  or pattern matrix   3 数据质量                 测试误差...

2015-10-10 14:01:38 160

原创 scala

1. until与to的区别 : until (), to [] 2. scala支持包对象,可添加工具函数或者常量 3. scala 闭包 与 java 匿名类 4. 重写 override ,suiper.父类 5. 限定当前对象课件 private【this】 6. 构造顺序 :被调用的方法或者常量可能会被重写,导致混乱- 解决办法: ...

2015-08-31 21:28:33 159

原创 java 静态内部类、局部内部类、匿名内部类

.java 静态内部类、局部内部类、匿名内部类 匿名内部类:一个匿名内部类一定是在new的后面,用其隐含实现一个接口或实现一个类,没有类名,根据多态,我们使用其父类名。因他是局部内部类,那么局部内部类的所有限制都对其生效。匿名内部类是唯一一种无构造方法类。大部分匿名内部类是用于接口回调用的。匿名内部类在编译的时候由系统自动起名Out$1.class。如果一个对象编译时的类型是接口,...

2015-08-31 16:25:23 116

原创 Suffix Tree

http://blog.csdn.net/g9yuayon/article/details/2574781 在文本T里查询T是否包含子串P(复杂度同流行的KMP相当)。 文本T里找出最长重复子串。比如abcdabcefda里abc同da都重复出现,而最长重复子串是abc。 找出字符串S1同S2的最长公共子串。注意不是常用作动态规划例子的LCS哈。比如字符串acdfg同akdfc的最长公共...

2015-08-20 10:33:08 121

原创 PageRank 学习

文献词权的计算: 文献内频率 * 反文献频率 表示 词权与文献内出现频率成正比,同时与此词在文献集合中出现的频率成反比。 关键字与文献匹配的 计算方法,点积公式: 早起的情报检索都是以词频为词权,缺点两个词频相同的网页可能质量相差很远,人为网页堆砌关键字。 PageRank基本原理:情报检索理论中,引文分析方法,是...

2013-08-12 01:35:58 95

原创 decision Tree

CART Classification and Regression Tree CART(Classification And Regression Tree)算法采用一种二分递归分割的技术,将当前 的样本集分为两个子样本集,使得生成的决策树的每个非叶子节点都有两个分支。因此,CART算法生成的决策树是结构简洁的二叉树。 以下是算法描述:其中T代表当前样本集,当前候选属性集用T...

2013-06-04 01:23:06 106

原创 Naive Bayes

Naive Bayes 朴素贝叶斯

2013-06-03 17:30:47 68

原创 KNN

KNN K-nearest neighbor KNN 是对训练数据集在特征空间进行划分,重要度量 K值得选择,距离度量 和 分类决策规则 距离度量: Minkowski distance 欧式距离 Euclidean distance 曼哈顿距离 KD树 - 平衡树 构造KD树,KD树的最近邻搜索 ...

2013-06-03 17:29:27 68

原创 perception

linear classification model 线性分类模型 stochastic gradient descent 随即梯度下降

2013-06-03 17:24:11 235

原创 Statistical 英语-1

supervised learning semi-supervised leaning unsupervised learning reinforcement learning 强化学习 hypothesis space 假设空间 parameter space 参数空间 likelihood loss function 似然损失函数 quadratic loss ...

2013-06-03 17:20:41 167

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除