算法 数据结构
文章平均质量分 60
程序员杰
半路出家的程序猿,吼吼
展开
-
K-Means 算法
最近在学习一些数据挖掘的算法,看到了这个算法,也许这个算法对你来说很简单,但对我来说,我是一个初学者,我在网上翻看了很多资料,发现中文社区没有把这个问题讲得很全面很清楚的文章,所以,把我的学习笔记记录下来,分享给大家。 在数据挖掘中, k-Means 算法是一种 cluster analysis 的算法,其主要是来计算数据聚集的算法,主要通过不断地取离种子点最近均值的算法。原创 2013-10-29 21:08:27 · 1254 阅读 · 0 评论 -
多核编程技术好书推荐
多核程序设计技术——通过软件多线程提升性能 , 作 者: (孟加拉)阿克特(Akhter,S.),(美)罗伯茨(Roberts,J.) 著,李宝峰,富弘毅,李韬 译本书从原理、技术、经验和工具等方面为读者提供关于多核程序设计技术的全方位解释。本书由三大部分组成:第一部分包括第1~4章,介绍软件多线程的 内容;第二部分包括第5章和第6章,其中讨论用于编写并行程序的常用编程API:第三部分原创 2013-11-15 16:52:06 · 1359 阅读 · 0 评论 -
字符串模式匹配:Sunday算法
1,Sunday算法是Daniel M.Sunday于1990年提出的一种比BM算法搜索速度更快的算法。 2,Sunday算法其实思想跟BM算法很相似,只不过Sunday算法是从前往后匹配,在匹配失败时关注的是文本串中参加匹配的最末位字符的下一位字符。如果该字符没有在匹配串中出现则直接跳过,即移动步长= 匹配串长度+ 1;否则,同BM算法一样其移动步长=匹配串中最右端的该字符到末尾的距离+原创 2013-10-12 21:04:10 · 695 阅读 · 0 评论 -
遗传算法
转自:http://www.cnblogs.com/heaad/ 遗传算法 ( GA , Genetic Algorithm ) ,也称进化算法 。 遗传算法是受达尔文的进化论的启发,借鉴生物进化过程而提出的一种启发式搜索算法。因此在介绍遗传算法前有必要简单的介绍生物进化知识。一.进化论知识 作为遗传算法生物背景的介绍,下面内容了解即可: 种群(Popula转载 2013-11-27 17:59:29 · 748 阅读 · 0 评论 -
分治算法-最近点对问题、大整数相乘
分治算法一、基本概念 在计算机科学中,分治法是一种很重要的算法。字面上的解释是“分而治之”,就是把一个复杂的问题分成两个或更多的相同或相似的子问题,再把子问题分成更小的子问题……直到最后子问题可以简单的直接求解,原问题的解即子问题的解的合并。这个技巧是很多高效算法的基础,如排序算法(快速排序,归并排序),傅立叶变换(快速傅立叶变换)…… 任何一个可以用计算原创 2013-11-09 11:24:51 · 1723 阅读 · 0 评论 -
淘宝搜索算法综述之一:淘宝搜索的特点
淘宝有十亿商品,挂靠在几千个叶子类目,上百个一级类目,十几个行业下面,如何能让用户快速的找到符合意图的商品,是淘宝搜索需要解决的首要问题。淘宝搜索从大的架构或流程上来说,与传统的搜索引擎有不少相似的地方。由于淘宝搜索面对的是站内卖家上传的商品,这些商品挂靠在人工整理的类目属性体系下,所以除了不需要像传统搜索引擎一样有爬虫对网页进行收集,以及网页信息的分类处理等部分工作外,其它部分的流程转载 2013-11-06 21:51:25 · 2370 阅读 · 0 评论 -
方便继续看
为表示瞻仰贴出其博客地址:http://blog.csdn.net/v_july_v/article/details/6543438原创 2013-11-05 21:34:29 · 541 阅读 · 0 评论 -
经典的机器学习方面源代码库
今天给大家介绍一下经典的开源机器学习软件:编程语言:搞实验个人认为当然matlab最灵活了(但是正版很贵),但是更为前途的是python(numpy+scipy+matplotlib)和C/C++,这样组合既可搞研究,也可搞商业开发,易用性不比matlab差,功能组合更为强大,个人认为,当然R和java也不错.1.机器学习开源软件网(收录了各种机器学习的各种编程语言学术与商业的开源软件)htt转载 2013-11-16 21:37:51 · 867 阅读 · 0 评论 -
Apriori算法
Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。很多的的挖掘算法是在Apriori算法的基础上进行改进的,比如基于散列(Hash)的方法,基于数据分割(Partition)的方法以及不产生候选项集的FP-GROWTH方法等。因此要了解关联规则算法不得不先要了解Apriori算法。 Apriori算法使用一种称作逐层迭代的候选产生测试(candidate generati转载 2013-10-29 22:34:24 · 1018 阅读 · 0 评论 -
c4.5 源自http://blog.sciencenet.cn/u/hailuo0112
1.3.1、ID3算法的改进:C4.5算法C4.5,是机器学习算法中的另一个分类决策树算法,它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法,也是上文1.2节所介绍的ID3的改进算法,所以基本上了解了一半决策树构造方法就能构造它。决策树构造方法其实就是每次选择一个好的特征以及分裂点作为当前节点的分类条件。既然说C4.5算法是ID3的改进算法转载 2013-10-29 20:51:47 · 1137 阅读 · 0 评论 -
EM算法
机器学习十大算法之一:EM算法。能评得上十大之一,让人听起来觉得挺NB的。什么是NB啊,我们一般说某个人很NB,是因为他能解决一些别人解决不了的问题。神为什么是神,因为神能做很多人做不了的事。那么EM算法能解决什么问题呢?或者说EM算法是因为什么而来到这个世界上,还吸引了那么多世人的目光。我希望自己能通俗地把它理解或者说明白,但是,EM这个问题感觉真的不太好用通俗的语言去说明白,因为它很简单,转载 2013-10-30 00:28:30 · 761 阅读 · 0 评论 -
经典ID3算法
1.背景知识: 决策树是对数据进行分类,以此达到预测的目的。该决策树方法先根据训练集数据形成决策树,如果该树不能对所有对象给出正确的分类,那么选择一些例外加入到训练集数据中,重复该过程一直到形成正确的决策集。决策树代表着决策集的树形结构。 决策树由决策结点、分支和叶子组成。决策树中最上面的结点为根结点,每个分支是一个新的决策结点,或者是树的叶子。每个决策结点代表一个原创 2013-10-29 20:18:17 · 726 阅读 · 0 评论 -
PageRank算法
1. PageRank算法概述PageRank,即网页排名,又称网页级别、Google左侧排名或佩奇排名。是Google创始人拉里·佩奇和谢尔盖·布林于1997年构建早期的搜索系统原型时提出的链接分析算法,自从Google在商业上获得空前的成功后,该算法也成为其他搜索引擎和学术界十分关注的计算模型。目前很多重要的链接分析算法都是在PageRank算法基础上衍生出来的。PageRank是Go转载 2013-10-30 09:08:11 · 692 阅读 · 0 评论 -
支持向量机(Support Vector Machine)
出自http://blog.csdn.net/passball/article/details/7661887(一)SVM的背景简介支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器学习问题中[10]。支持向量机方法是建立在统计学转载 2013-10-29 21:39:54 · 999 阅读 · 0 评论 -
贪心算法之木材装集装箱问题
贪心算法应用 ——木材的装箱问题一、问题描述:给定一个集装箱,其长为L、宽为W、高为H。现有一批圆柱型木材,每根木材的长均为L,但是半径r不同。设第i根木材半径为ri。问:如何装箱,使得集装箱的空间利用率最高? 二、算法设计:——采用贪心算法思想,将箱子抽象原创 2013-12-06 11:38:43 · 3014 阅读 · 1 评论