- 博客(13)
- 收藏
- 关注
原创 node.js 垃圾回收
V8脚本引擎 垃圾回收机制 1.scavenge scavenge主要采用了cheney算法。 cheney算法采用复制的方式实现。主要用于新生代内存(由于新生代内存生命周期短)。 优点:时间效率高,空间换取时间。 过程:将内存分为一分为二,两部分semispace,分别为 From和To。垃圾回收时,检查From内存中存活的对象复制到To中,释放From空间,并将...
2016-01-28 15:55:27 90
原创 机器学习
机器学习三要素:模型、目标、算法,model cost function 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。作者:周小涛链接:http://www.zhihu.com/question/24900876/answer/65176508来源:知乎Linear Regression的cost function是最小二乘,即但是...
2015-12-04 17:38:10 92
原创 最小二乘法
最小二乘法:残差平方和最小,拟合曲线 一.背景 5月9号到北大去听hulu的讲座《推荐系统和计算广告在视频行业应用》,想到能见到传说中的项亮大神,特地拿了本《推荐系统实践》求签名。讲座开始,主讲人先问了下哪些同学有机器学习的背景,我恬不知耻的毅然举手,真是惭愧。后来主讲人在讲座中提到了最小二乘法,说这个是机器学习最基础的算法。神马,最基础,我咋不知道呢! 看来以后还是要对自己有...
2015-12-04 16:58:14 151
原创 Datamining
数据集 1.一般特性 a 维度 dimensionality b 稀疏性 sparsity c 分辨率 resolution 2 记录数据 a 事物数据或者购物篮数据 transaction data b 数据矩阵 data matrix or pattern matrix 3 数据质量 测试误差...
2015-10-10 14:01:38 160
原创 scala
1. until与to的区别 : until (), to [] 2. scala支持包对象,可添加工具函数或者常量 3. scala 闭包 与 java 匿名类 4. 重写 override ,suiper.父类 5. 限定当前对象课件 private【this】 6. 构造顺序 :被调用的方法或者常量可能会被重写,导致混乱- 解决办法: ...
2015-08-31 21:28:33 159
原创 java 静态内部类、局部内部类、匿名内部类
.java 静态内部类、局部内部类、匿名内部类 匿名内部类:一个匿名内部类一定是在new的后面,用其隐含实现一个接口或实现一个类,没有类名,根据多态,我们使用其父类名。因他是局部内部类,那么局部内部类的所有限制都对其生效。匿名内部类是唯一一种无构造方法类。大部分匿名内部类是用于接口回调用的。匿名内部类在编译的时候由系统自动起名Out$1.class。如果一个对象编译时的类型是接口,...
2015-08-31 16:25:23 116
原创 Suffix Tree
http://blog.csdn.net/g9yuayon/article/details/2574781 在文本T里查询T是否包含子串P(复杂度同流行的KMP相当)。 文本T里找出最长重复子串。比如abcdabcefda里abc同da都重复出现,而最长重复子串是abc。 找出字符串S1同S2的最长公共子串。注意不是常用作动态规划例子的LCS哈。比如字符串acdfg同akdfc的最长公共...
2015-08-20 10:33:08 121
原创 PageRank 学习
文献词权的计算: 文献内频率 * 反文献频率 表示 词权与文献内出现频率成正比,同时与此词在文献集合中出现的频率成反比。 关键字与文献匹配的 计算方法,点积公式: 早起的情报检索都是以词频为词权,缺点两个词频相同的网页可能质量相差很远,人为网页堆砌关键字。 PageRank基本原理:情报检索理论中,引文分析方法,是...
2013-08-12 01:35:58 95
原创 decision Tree
CART Classification and Regression Tree CART(Classification And Regression Tree)算法采用一种二分递归分割的技术,将当前 的样本集分为两个子样本集,使得生成的决策树的每个非叶子节点都有两个分支。因此,CART算法生成的决策树是结构简洁的二叉树。 以下是算法描述:其中T代表当前样本集,当前候选属性集用T...
2013-06-04 01:23:06 106
原创 KNN
KNN K-nearest neighbor KNN 是对训练数据集在特征空间进行划分,重要度量 K值得选择,距离度量 和 分类决策规则 距离度量: Minkowski distance 欧式距离 Euclidean distance 曼哈顿距离 KD树 - 平衡树 构造KD树,KD树的最近邻搜索 ...
2013-06-03 17:29:27 68
原创 perception
linear classification model 线性分类模型 stochastic gradient descent 随即梯度下降
2013-06-03 17:24:11 235
原创 Statistical 英语-1
supervised learning semi-supervised leaning unsupervised learning reinforcement learning 强化学习 hypothesis space 假设空间 parameter space 参数空间 likelihood loss function 似然损失函数 quadratic loss ...
2013-06-03 17:20:41 167
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人