isaacke-CSDN博客

原创 node.js 垃圾回收

V8脚本引擎垃圾回收机制 1.scavenge scavenge主要采用了cheney算法。 cheney算法采用复制的方式实现。主要用于新生代内存（由于新生代内存生命周期短）。优点：时间效率高，空间换取时间。过程：将内存分为一分为二，两部分semispace，分别为 From和To。垃圾回收时，检查From内存中存活的对象复制到To中，释放From空间，并将...

2016-01-28 15:55:27 90

原创机器学习

机器学习三要素：模型、目标、算法，model cost function 著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。作者：周小涛链接：http://www.zhihu.com/question/24900876/answer/65176508来源：知乎Linear Regression的cost function是最小二乘，即但是...

2015-12-04 17:38:10 92

原创最小二乘法

最小二乘法：残差平方和最小，拟合曲线一.背景 5月9号到北大去听hulu的讲座《推荐系统和计算广告在视频行业应用》，想到能见到传说中的项亮大神，特地拿了本《推荐系统实践》求签名。讲座开始，主讲人先问了下哪些同学有机器学习的背景，我恬不知耻的毅然举手，真是惭愧。后来主讲人在讲座中提到了最小二乘法，说这个是机器学习最基础的算法。神马，最基础，我咋不知道呢！看来以后还是要对自己有...

2015-12-04 16:58:14 151

原创 Datamining

数据集 1.一般特性 a 维度 dimensionality b 稀疏性 sparsity c 分辨率 resolution 2 记录数据 a 事物数据或者购物篮数据 transaction data b 数据矩阵 data matrix or pattern matrix 3 数据质量测试误差...

2015-10-10 14:01:38 160

原创 scala

1. until与to的区别： until (), to [] 2. scala支持包对象，可添加工具函数或者常量 3. scala 闭包与 java 匿名类 4. 重写 override ，suiper.父类 5. 限定当前对象课件 private【this】 6. 构造顺序：被调用的方法或者常量可能会被重写，导致混乱- 解决办法： ...

2015-08-31 21:28:33 159

原创 java 静态内部类、局部内部类、匿名内部类

.java 静态内部类、局部内部类、匿名内部类匿名内部类：一个匿名内部类一定是在new的后面，用其隐含实现一个接口或实现一个类，没有类名，根据多态，我们使用其父类名。因他是局部内部类，那么局部内部类的所有限制都对其生效。匿名内部类是唯一一种无构造方法类。大部分匿名内部类是用于接口回调用的。匿名内部类在编译的时候由系统自动起名Out$1.class。如果一个对象编译时的类型是接口，...

2015-08-31 16:25:23 116

原创 Suffix Tree

http://blog.csdn.net/g9yuayon/article/details/2574781 在文本T里查询T是否包含子串P（复杂度同流行的KMP相当）。文本T里找出最长重复子串。比如abcdabcefda里abc同da都重复出现，而最长重复子串是abc。找出字符串S1同S2的最长公共子串。注意不是常用作动态规划例子的LCS哈。比如字符串acdfg同akdfc的最长公共...

2015-08-20 10:33:08 121

原创 PageRank 学习

文献词权的计算：文献内频率 * 反文献频率表示词权与文献内出现频率成正比，同时与此词在文献集合中出现的频率成反比。关键字与文献匹配的计算方法，点积公式：早起的情报检索都是以词频为词权，缺点两个词频相同的网页可能质量相差很远，人为网页堆砌关键字。 PageRank基本原理：情报检索理论中，引文分析方法，是...

2013-08-12 01:35:58 95

原创 decision Tree

CART Classification and Regression Tree CART(Classification And Regression Tree)算法采用一种二分递归分割的技术，将当前的样本集分为两个子样本集，使得生成的决策树的每个非叶子节点都有两个分支。因此，CART算法生成的决策树是结构简洁的二叉树。以下是算法描述：其中T代表当前样本集，当前候选属性集用T...

2013-06-04 01:23:06 106

原创 Naive Bayes

Naive Bayes 朴素贝叶斯

2013-06-03 17:30:47 68

原创 KNN

KNN K-nearest neighbor KNN 是对训练数据集在特征空间进行划分，重要度量 K值得选择，距离度量和分类决策规则距离度量： Minkowski distance 欧式距离 Euclidean distance 曼哈顿距离 KD树 - 平衡树构造KD树，KD树的最近邻搜索 ...

2013-06-03 17:29:27 68

原创 perception

linear classification model 线性分类模型 stochastic gradient descent 随即梯度下降

2013-06-03 17:24:11 235

原创 Statistical 英语-1

supervised learning semi-supervised leaning unsupervised learning reinforcement learning 强化学习 hypothesis space 假设空间 parameter space 参数空间 likelihood loss function 似然损失函数 quadratic loss ...

2013-06-03 17:20:41 167

isaacke的博客