- 博客(7)
- 收藏
- 关注
原创 最长回文子串
简单来说,就是顺着和逆着读相同的子串;例如erabcba的最长回文串是abcba方法一: 动态转移方程:P[i][j]记录i—j是否为回文串(true false),P[i][j]=P[i-1][j-1](if a[i]==a[j]); 枚举子串的长度l,通过对每个字符开始l长的子串判断是否为回文串; 同时注意单个字符的回文串是;且若相邻两个字符相同,则这两个字符的回文串是2;以上两种情况要单
2015-07-07 15:08:28 288
原创 最长共公共子序列和最长公共子串
参考:http://www.cnblogs.com/zhangchaoyang/articles/2012070.html最长公共子序列最长公共子序列与最长公共子串的区别在于最长公共子序列不要求在原字符串中是连续的,比如ADE和ABCDE的最长公共子序列是ADE。我们用动态规划的方法来思考这个问题如是求解。首先要找到状态转移方程:符号约定,C1是S1的最右侧字符,C2是S2的最右侧字符,S1‘是从S
2015-07-07 11:39:35 486
原创 最长不降子序列
比如arr={1,5,8,2,3,4}的最长不降子序列是1,2,3,4 动态规划的思路:用P[i]去记录以i结尾的最长的不降子序列的长度,比如arr中,P[0]=1;P[1]=2;P[2]=3;P[3]=2;P[4]=3;P[5]=4; 那P是如何生成的:首先P数组初始化每个值都为1,因为每个数自身也算做长度为1的不降子序列;其次在算P[i+1]时要去找从0-i中哪些数比a[i+1
2015-07-07 11:01:38 385
原创 最大子序列和
参考:http://www.cnblogs.com/zhangchaoyang/articles/2012070.html最大子序列是要找出由数组成的一维数组中和最大的连续子序列。比如{5,-3,4,2}的最大子序列就是 {5,-3,4,2},它的和是8,达到最大;而 {5,-6,4,2}的最大子序列是{4,2},它的和是6。思路:用数组P[i]记以i结尾的子序列的和,max记当前子序列的最大和,e
2015-07-07 10:14:58 446
原创 机器学习实战 朴素贝叶斯
朴素贝叶斯的思想是对样本属于每一个类别的情况求概率,认为概率最高的类别就是这个样本的类别。所以它可以用来解决多类别的问题,同时也只能对标称型的数据处理。 在理解它是怎么分类之前,需要掌握条件概率的理论。如果把这种分类方法与条件概率结合起来理解的话,就是P(类别|样本)=P(样本|类别)*P(类别)/P(样本)。和我们的理解一样,如果要判断这个样本的类别,就去判断已知这个样本属于某个类别的概率,
2015-05-14 22:06:59 343
原创 机器学习实战 决策树
决策树的引出: 前一节学到了knn,在分析代码后总结到knn有一个缺点是无法给出数据的内在含义,比如说无法去研究特征的含义 只是单纯的知道特征大小。而决策树就可以非常容易的去理解数据。总结: 1.复杂度不高,输出结果容易理解(对特征的描述),可以处理不相关特征 2.缺点是会产生过度匹配 3.只适用于标称型数据(比如是否这种选择性的特征,或合格 良好 优秀这种可用有限的离散数字描述的特征),如
2015-05-07 10:53:07 291
原创 机器学习实战 k-近邻算法
边看书边看代码,结合自己的理解总结。 概括: 1.思想:计算测试样本与训练集对应特征值之间的距离(文中用的是欧式距离),认为与测试样本距离最近的k个样本可以用来描述这个测试样本,取这k个训练样本中出现最多次的类别,作为这个测试样本的类别。 2.优点:精度高,对异常值不敏感 3.缺点:复杂度高 4.适用范围:数值型和标称型 (数值型主要是指它的目标变量可以从无限的数值集合中取值,标称型指的
2015-05-07 09:20:24 370
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人