自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

原创 关于暂时转博客的声明

在这里写博客也有一段时间了,遗憾的是越来越感到困难,尤其是放图片的内容竟然还要上传而不能直接写,公式的话好像是可以用Latex编辑的不过我暂时还没有学怎么弄。加上之前博客账户被入侵,文章被删,考虑到备份的重要性。看到网上好多人离线写博客,使用windows live writer写不仅可以在本地保存,同时也能够方便的添加图片公式,于是在本地配置了一下并且成功发出了一篇测试文。本来以为今后可以方便的

2015-06-13 17:40:40 411

原创 一个关于PCA的疑问

我们知道PCA干的事情是把n维的样本投影到k维,同时丢失的信息能够达到最少。为什么说principal component是covariance matrix的特征值中最大的前k个对应的特征向量上的分量?解释:对于一组样本数据,如果它们的方差越大,说明它们蕴含的信息越多,可以参考熵的概念理解。那么PCA需要做的事情就是当投影到k维的时候,每个维度上的方差都能够越大越好。这要怎么实现呢?

2015-06-10 21:21:05 462

原创 (ML foundation 7)VC dimension & Model complexity

https://www.evernote.com/shard/s271/sh/cd20f4a2-d1df-4393-82e8-2242020a7918/05de29d8938b844629508fef962d0b96

2015-06-08 17:07:06 506

原创 (ML Foundation 8)Error measure

https://www.evernote.com/shard/s271/sh/fb4250dc-99bc-4c8a-ad5b-f1ef6513de52/7470664a1365114cd0cfc16eb3506076

2015-06-08 17:06:54 714

原创 (ML foundation)break point & VC bound

https://www.evernote.com/shard/s271/sh/609293f5-edbb-4175-867f-7927d9d4b8cb/3415c55234a70055ca2c4ec65ad118aa

2015-06-08 17:03:23 626

原创 Infinite size of Hypothesis set and growth funciton

https://www.evernote.com/shard/s271/sh/ee55f417-6784-41b3-9a62-3f9b45381e56/e9fd1e1671a5e82bb776595e403c32df

2015-06-08 17:01:07 352

原创 Hoeffding inequality and bound

https://www.evernote.com/shard/s271/sh/6194c340-b58c-4f53-8b90-a036bba07e9f/d24d11a19b2ac2406061bc7b0f863a51

2015-06-08 16:48:49 488

原创 最大子序列问题

给定一个数列,其中的数有正有负,求这个数列中的某一个子序列使得它们的和最大。例如:-2, 11, -4, 13, -5, 2, -5, -3, 12, -9 这个数列中,子序列和最大为21-2 ,11, -4, 13, -5, -2 和为20思路:traverse整个数组用sum存储当前位置及其之前的数字之和因为每次循环都会求得一个sum,用max存储最大的

2015-03-19 20:22:42 418

原创 最小生成树(Prim)

public class Mst { int numberofNode; int[] lowcost; ArrayList closedSet; ArrayList edge; ArrayList V; int[][] map;//无向图 public Mst(int numberofNode){ map = new int[numberofNode][numberofNode]

2015-02-13 01:24:37 395

原创 TOP K问题

前面的文章提到查找最小的k个元素。这里将题目改为查找最大的k个元素。这个题目较之前更具有实际意义,例如我们可以设计搜索引擎的热门查询统计,返回海量的搜索记录中最常被搜索的词条。我们认为在数据集中出现次数最多的为最热门的搜索词条。下面是一道百度的面试题    搜索引擎会通过日志文件把用户每次检索使用的所有检索串都记录下来,每个查询串的长度为1-255字节。    假设目前

2015-02-05 00:48:19 432

原创 [LeetCode]Two Sum

Given an array of integers, find two numbers such that they add up to a specific target number.The function twoSum should return indices of the two numbers such that they add up to the target, whe

2015-02-04 15:52:43 254

原创 Quicksort

此前用Java写了个快排的程序,这里用的是C++写的。Quicksort1. Divide & Conquer2. Sort in-place, which is usage efficient (other eg. insertion sort,  O(n^2)), mergesort is not in-place sort because it needs extra s

2015-02-04 10:32:45 314

原创 A*算法. Knight Moves

为了说明A*算法,通过求解一个问题引入Knight Moves中国象棋里,马的走法是按照“日”字行走,如下图所示,最多有8个方向可以选择。这是跳一步可以到达的8个格子。对问题进行抽象,把每个格子看成一个点的坐标。目标:马从起点x1,y1到x2,y2,怎样走所需的步数最少,路线是怎样的。每步的跳跃造成的马坐标的变化可能为{{-2,-1},{-2,1},{2,-1},{

2015-02-02 15:24:20 404

原创 动态的内部类不能在静态方法中直接声明对象

在定义一个内部类,编译时出现:No enclosing instance of type A is accessible. Must qualify the allocation with an enclosing instance of type A(e.g.  x.new A() where x is an instance of A)出错的地方是我在实例化一个内部类对象的时候

2015-01-30 11:28:44 661

原创 Dijkstra算法

由于学校的机器学习课程马上要讲搜索,涉及到A*算法,索性自己先找来资料读。A*算法是启发式算法的一种,启发式算法是在当前节点搜索下一个节点的时候,利用一个启发式函数,选择cost最少的点,作为下一个去到的地方。(这里是说有很多个点可以选择作为下一跳,但我们想找到一个best point)A*算法可以在平面上,找到一条经过多个节点的,成本最少的路径。f(n) = g(n)

2015-01-29 11:25:24 536

原创 KMP

字符匹配问题。因为项目需要,在字符串中查找是否有某段特定的字符出现,想起前段时间看的KMP算法,于是总结一下以免忘记了。例如:字符串s: BDABCDABACD. 模式串p: ABA,因为s中有一小段字符串与模式串ABA相同,在s的第6位(初始为0),否则查找失败。给s和p分别设置一个指针i,j = 0一般的匹配过程是:一开始BDABCDABACDABA发现s[0]

2015-01-26 14:28:22 367

原创 查找最小的k个元素

目标:给定一个整型序列,找到最小的k个元素例如:3,2,5,6,2,1,7,8 。若k=3,则返回1,2,3思路1. quickSort先对序列进行排序,花费O(nlog)时间,然后取出k个元素,花费O(k)时间,所以总的时间为O(k+nlogn)2. 首先遍历序列前k个元素,存放到一个数组中,利用选择或交换排序,找出这k个数中的最大数k_max,所花O(k)时间。然后再遍

2015-01-26 00:45:52 686

原创 字符串包含问题

问题描述:两个字符串S1和S2,假设S1长度大于等于S2长度,判断S2是否为S1的一个子集。例如:S1=ABCDEFGHI, S2=ACEFG,由于S2中的每个元素都出现在S1中,说明S1包含S2.若S2=ACEFGK, 由于K不在S1中,因此S1不包含S2。设S1长度为m,S2长度为n方法1:Brute-Force 两个for loop,复杂度为O(m*n)

2015-01-25 01:14:11 402

原创 左旋字符串

目标:rotate(s,m)将字符串s的前m位左旋至末尾。例:s = abcdefghijkrotate(s,3) = defghijkabc思路:1. 假设字符串s需要调整位置,设置指针p1指向s起点,p2指向起点+m的位置,这里p1->a, p2->d。2. 交换p1和p2指向的元素,同时让p1++, p2++。 这样的动作持续 k = (n-m) - (n%m) 次,

2015-01-24 22:10:18 459

原创 辗转相除法

GCD:辗转相除法,求两个正整数的最大公约数。gcd(m,n) = gcd(n,m mod n)   [a>b且 a mod b不等于0]步骤:1. 求余数r = m%n 2. 若r=0,则算法结束,此时的n就为m和n的最大公约数。3. 否则,令m = n, n = r,返回第一步。

2015-01-24 20:05:47 327

原创 Algorithm: Bags, Queues, and Stacks

Stack. Examine the item most recently added   LIFO: last in first outQueue. Examine the item least recently added  FIFI: first in first outStack pop:Stack push:Using ar

2015-01-03 11:08:20 449

原创 data structure in python

data structure in python1. list(数组) order, changeableincluding 2-dimension & 3-dimensionote: x represents element in list, i represents index or location1.append(x) add x into the list o

2014-10-26 14:22:35 573

原创 kNN coding and some corrections in comments

from numpy import *from os import listdir  #used in the handwritting exampleimport operatordef createDataSet():        group=array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])        labels=['A','A'

2014-09-16 01:40:34 410

原创 WEKA Notes

WEKA’s datasetFormat: .arffcomments by %definition of parameter by @E.g@relation Glass@attribute ‘Si’ numeric@attribute ‘Type’ {***,***,***}lesson 1.4

2014-09-04 01:12:40 835

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除