自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 资源 (9)
  • 收藏
  • 关注

原创 找寻链表的倒数K个结点

想法就是用两个指针遍历链表,第一个指针先走K-1步,紧接着第二个指针同时开始走,当第一个指针走到链表末尾时,第二个指针刚好指向倒数第K个结点,算法结束。点评:1注意防御性编程 :链表不能为空指针,K不能小于0;2当链表长度小于K时,要有处理机制,返回NULL;struct ListNode{ int m_nValue; ListNode* m_pNext;};ListN

2015-06-30 21:36:21 412

原创 归并排序算法的实现

归并排序是建立在归并操作基础上的一种有效地排序算法。也是几大优秀排序算法中稳定的一种。其时间复杂度为O(nlogn),但空间复杂度是O(n)这点是它的一个劣势。原因在于需要把原始数据划分为两两有序的数据,然后再两两合并成最终的一个数组或是链表。那么下面就来仔细探讨下归并排序算法的原理。首先,是一个合并两个有序数组成为一个数组的算法。void merge(int a[], int n

2015-06-23 22:50:14 621

原创 Python导入模块或是库文件的方法

在IDLE中报错:Traceback (most recent call last):  File "C:\Python27\test_biKmeans.py", line 27, in     centroids, clusterAssment = biKmeans(dataSet, k)TypeError: 'module' object is not callable

2015-06-23 21:26:48 1165

转载 解析阿里云大数据服务——ODPS

阿里云有许多很好的技术,比如负载均衡SLB,关系型数据库RDS,云服务器ECS,开放存储服务OSS等。如今又增加了一款重磅云服务产品:基于飞天的ODPS(Open Data Processing Service),提供数据仓库、数据挖掘和其他数据应用等功能。7月14日,阿里云计算公司总裁及阿里巴巴集团副总裁王文彬(花名菲青)为之站场,并称之为“中国进入大数据时代的里程碑”。阿里

2015-06-23 16:22:12 3790

转载 ODPS技术架构及应用实践

初识ODPSODPS是分布式的海量数据处理平台,提供了丰富的数据处理功能和灵活的编程框架,主要的功能组件有如下几个。■ Tunnel服务:数据进出ODPS的唯一通道,提供高并发、高吞吐量的数据上传和下载服务。■ SQL:基于SQL92并进行了本地化扩展,可用于构建大规模数据仓库和企业BI系统,是应用最为广泛的一类服务。■ DAG编程模型:类似Hadoop MapRe

2015-06-23 16:18:45 1075

转载 python相关面试题

1.       Python是如何进行内存管理的?答:从三个方面来说,一对象的引用计数机制,二垃圾回收机制,三内存池机制一、对象的引用计数机制python内部使用引用计数,来保持追踪内存中的对象,所有对象都有引用计数。引用计数增加的情况:1,一个对象分配一个新名称2,将其放入一个容器中(如列表、元组或字典)引用计数减少的情况:1,使

2015-06-22 22:40:34 1137 1

原创 调整数组元素的顺序前为奇数后为偶数

如题,考虑一种时间复杂度为O(n),空间复杂度为O(1)的算法,那就是维护两个指针,分别指向数组的首尾,然后分别判断所指向的元素是奇数还是偶数,符合条件指针分别向中间“靠拢”,不符合条件停止,然后交换这两个元素,使之符合题目条件。参考代码如下void OrderTheArrayToOddAndEven(int array[], int length){ if (array == NUL

2015-06-22 20:50:42 700

原创 斐波那契数列的相关问题及算法实现

最初的问题是一个跳台阶问题引出的。一个台阶总共有n级,如果一次可以跳1级,也可以跳2级。总共有多少种跳法,并分析算法的时间复杂度。分析一:递归法一个台阶那么只有一种方法。如果有两级台阶,就有跳一个台阶和挑两个台阶,就是2种方法。   当n>2时,第一次跳的时候就有两种不同的选择:一是第一次只跳1级,此时跳法数目等于后面剩下的n-1级台阶的跳法数目,即为f(n-1);另外一种

2015-06-22 19:54:16 722

原创 梯度下降法和随机梯度下降法的理解

1:其实梯度下降算法,在使用的时候无非是要考虑到2个方面,一个是方向,一个是步长,方向决定你是否走在了优化的道路上还是优化道路的负方向,步长是决定你要走多久才能到最优的地方。对于第一个问题很好解决,就是求梯度,梯度的负方向就是了。难的是求步长,如果步子太小,则需要很长的时间才能走到目的地,如果步子过大可能在目的地的周围来走震荡。所以重点在于如何选择步长。2:对于随机梯度中,步长

2015-06-18 21:23:27 902

原创 抽签问题或是超几何概率

在一个冒险游戏里,你见到一个宝箱,身上有N把钥匙,其中一把可以打开宝箱,加入没有任何提示,随机尝试,问:(1) 恰好第k次(1=(2) 平均需要尝试多少次?本题中最大的焦点在于问题(1),网上给出了两种互相矛盾的结果 1/N 和 (((N-1)/N)^(K-1))*(1/N). 经过仔细推敲,发现了其中的原因。首先,看一下抽签问题:N只签里面有一只好签,N个

2015-06-18 17:04:35 1757

原创 面向对象编程的几个关键概念继承、多态、组合

一、继承、接口与多态的相关问题:1、 继承的作用?好处?坏处?继承:通过继承实现代码复用。Java中所有的类都是通过直接或间接地继程java.lang.Object类得到的。继承而得到的类称为子类,被继承的类称为父类。子类不能继承父类中访问权限为private的成员变量和方法。子类可以重写父类的方法,及命名与父类同名的成员变量。但Java不支持多重继承,即一个类从多个超类派生的能力。优点:a因为大

2015-06-17 22:21:28 2006

原创 进程之间的8种通信方式

总结下进程之间通信方式。1无名管道( pipe ):管道是一种半双工的通信方式,数据只能单向流动,而且只能在具有亲缘关系的进程间使用。进程的亲缘关系通常是指父子进程关系。2高级管道(popen):将另一个程序当做一个新的进程在当前程序进程中启动,则它算是当前程序的子进程,这种方式我们成为高级管道方式。3有名管道 (named pipe) : 有名管道也是半双工的通信方式

2015-06-17 21:48:18 585

原创 贝叶斯公式和朴素贝叶斯分类算法

在网上找了很多朴素贝叶斯分类算法的相关博客,首先感谢他们的劳动成果,我将自己认为有用的集合在一起,供以后复习和深入学习。首先,概念基础贝叶斯公式:定义:设A、B是两个事件,且P(A)>0,称P(B|A)=P(AB)/P(A)为在事件A发生的条件下事件B发生的条件概率。相关公式:乘法公式 P(XYZ)=P(Z|XY)P(

2015-06-17 20:44:42 5650

原创 编程练习之一颗二叉树包含另一颗二叉树

剑指offer上的一道编程练习,如何确定二叉树A包含一棵相对小一点的二叉树B?思路:用两个函数实现,第一个首先判断根结点是否相等,第二个函数继续判断子结构是否相等函数一:第一步,首先从根结点入手,判断pRootA的值是否与pRootB的根结点的值是否相等。若相等,则在比较A树的子结构是否包含B数子结构,此时转入函数二;若不相等 则转入:第二步,递归进入函数一,判断pRoot

2015-06-16 21:37:57 620

原创 从VC维和结构风险最小原理深入理解SVM

支持向量机方法是建立在统计学习理论的VC 维理论和结构风险最小原理基础上。置信风险: 分类器对 未知样本进行分类,得到的误差。经验风险: 训练好的分类器,对训练样本重新分类得到的误差。即样本误差结构风险:置信风险 + 经验风险结构风险最小化就是为了防止过拟合而提出来的策略,贝叶斯估计中最大后验概率估计就是结构风险最小化的一个例子。当模型的条件概率分布、损失函数是

2015-06-14 20:08:07 5892

原创 杨氏矩阵的查找算法

今天碰到了这一问题,考虑的是根据杨氏矩阵的性质,从左到右,从上到下都是递增排序的。因此想要找到杨氏矩阵当中是否存在某数,可以从右上角的数开始找起,即从Y_Matrix[0][columns-1]开始找起。此时如果Y_Matrix[0][columns-1]比要找的数大,则继续往左查找,即columns-2;若此时比要找的数小,那么就要往下开始找起,即比较Y_Matrix[1][column

2015-06-12 23:25:29 698

原创 数据挖掘学习笔记之CART树

一、决策树的类型 在数据挖掘中,决策树主要有两种类型:分类树 的输出是样本的类标。回归树 的输出是一个实数 (例如房子的价格,病人呆在医院的时间等)。术语分类和回归树 (CART) 包含了上述两种决策树, 最先由Breiman 等提出.分类树和回归树有些共同点和不同点—例如处理在何处分裂的问题。分类回归树(CART,Classification And Regr

2015-06-11 16:18:50 1238

原创 分类和回归的区别和联系

先简单的说下吧,下面给出实际例子类和回归的区别在于输出变量的类型。定量输出称为回归,或者说是连续变量预测;定性输出称为分类,或者说是离散变量预测。举个例子:预测明天的气温是多少度,这是一个回归任务;预测明天是阴、晴还是雨,就是一个分类任务。 拿支持向量机举个例子,分类问题和回归问题都要根据训练样本找到一个实值函数g(x)。回归问题的要求是:给定一个新

2015-06-11 15:00:03 10705

原创 逻辑回归的深入理解总结

看了这么多回归的分析,找到了这篇讲的最好,推导很详细,也很到位,解决了一直以来对逻辑回归的一些疑问,现在分享在这里,供大家参考~Logistic回归与多重线性回归实际上有很多相同之处,最大的区别就在于它们的因变量不同,其他的基本都差不多。正是因为如此,这两种回归可以归于同一个家族,即广义线性模型(generalizedlinear model)。这一家族中的模型形式基本上都差不多,

2015-06-09 15:02:58 8367 1

转载 寻找和为定值的两个数

首先感谢July的编程艺术课程,总结得很好,现在转载在此。寻找和为定值的两个数题目描述输入一个数组和一个数字,在数组中查找两个数,使得它们的和正好是输入的那个数字。要求时间复杂度是O(N)。如果有多对数字的和等于输入的数字,输出任意一对即可。例如输入数组1、2、4、7、11、15和数字15。由于4+11=15,因此输出4和11。分析与解法咱们

2015-06-08 22:19:19 601

原创 不通过临时变量实现交换的函数

首先是定义成内联函数,提高函数调用效率。以空间换取时间。另外,关键点在函数体内,如何实现参数x和y的相互交换?不用另外定义一个临时变量,通过他们练歌的相互计算实现交换是很好的。即: x=x+y;y=x-y;x=x-y;好了函数如下inline void swap(int& x, int& y){ x = x + y; y = x - y;

2015-06-08 16:59:06 526

原创 数据挖掘之Adaboost学习笔记

所谓“众人拾柴火焰高”,“三个臭皮匠抵个诸葛亮”,继承学习的泛化能力一般明显好于单一的学习器。那么Adaboost算法就是基于这样的思想产生的。boosting方法的代表Adaboost是一个以单层决策树分类器为弱分类器基础,将他们组合在一起,从而组成一个高性能的可与svm相提并论的分类器。它的自适应在于:前一个基本分类器分错的样本会得到加强,加权后的全体样本再次被用来训练下一个基本分类器。同

2015-06-04 20:17:18 762

转载 语义分析语义关联挖掘

摘要:两篇文档是否相关往往不只决定于字面上的词语重复,还取决于文字背后的语义关联。对语义关联的挖掘,可以让我们的搜索更加智能化。本文着重介绍了一个语义挖掘的利器:主题模型。主题模型是对文字隐含主题进行建模的方法。它克服了传统信息检索中文档相似度计算方法的缺点,并且能够在海量互联网数据中自动寻找出文字间的语义主题。近些年来各大互联网公司都开始了这方面的探索和尝试。就让我们看一下究竟吧。

2015-06-03 19:54:33 13774

转载 字符串匹配的几种算法总结(KMP、等)

字符串匹配(string match)是在实际工程中经常会碰到的问题,通常其输入是原字符串(String)和子串(又称模式,Pattern)组成,输出为子串在原字符串中的首次出现的位置。通常精确的字符串搜索算法包括暴力搜索(Brute force),KMP, BM(Boyer Moore), sunday, robin-karp 以及 bitap。下面分析这几种方法并给出其实现。假设原字符串长度M

2015-06-03 19:53:19 1017

原创 数据挖掘算法总结--核心思想,算法优缺点,应用领域,数据挖掘优缺点

数据挖掘十大算法总结--核心思想,算法优缺点,应用领域,数据挖掘优缺点•分类算法:C4.5,CART,Adaboost,NaiveBayes,KNN,SVM•聚类算法:KMeans•统计学习:EM•关联分析:Apriori•链接挖掘:PageRank其中,EM算法虽可以用来聚类,但是由于EM算法进行迭代速度很慢,比kMeans性能差很多,并且

2015-06-02 22:39:39 1608

原创 C++继承与派生的访问基本规则

一 ,类的继承:继承分为单继承和多继承继承的思想要点:继承中要点就是派生类和基类的初始化,都是调用基类的构造函数来实现的,接下来就是函数的实现及类的作用域问题值得注意。      首先注意构造函数和析构函数都不能继承:因此要用通过调用基类的构造函数来初始化基类的数据成员。      派生类构造函数调用原则是:先基类,后子对象,再派生类。      派生类析构函数调用原则是:先派生类

2015-06-02 20:22:17 636 1

原创 已知田字形的2*2的格子里面有9个矩形(包含正方形),问N*N的格子有多少个矩形?

思路:从点开始,矩形有什么特征?一个矩形必须是四个点组成吧,而且角必须是90度。那么两个点组成一条边吧,好的。那么以3*3为例,最上边的横1边,总共可以确定C(2,4)种情况下的横边,然后上边确定了,确定与其垂直的竖边,此时可以有几种选择方法?大家注意,此时竖边只有三种情况,就是他的长度,分别是长度为一,长度为2,长度为3的竖边,因为必须要保持垂直的关系,竖边没有其他选择,只能是这三种情况。那

2015-06-02 10:47:56 3979

原创 求旋转数组的最小数字——二分查找算法的深入理解

没想到啊,没想到,面试第一家互联网企业的时候,就是这一问题。之前又看到过这个题型,但是没有自己动手写过代码,所以花了一些时间才想出思路来,真是汗颜。在这里重新做一下思路总结。二分查找算法,针对一个有序的数组,可以有O(log2n)的时间复杂度。那对于相对有序的数组,比如旋转数组,array1[]={4,5,1,2,3},这种情况下如何查找数组当中的最小值?思路:其实还是用二分查找的思路,如

2015-06-02 10:11:44 608

知网Hownet情感词典.zip

该资料包含知网情感相关的词典,分为中英文单词表,每种都梳理完毕,并整理成单独文件,非常方便,有需要的话,请下载使用。

2020-05-09

mnist.pkl.gz数据文件

mnist.pkl.gz数据文件直接下载拷贝到keras的dataset下方便许多

2017-01-10

近红外猕猴桃测试分类数据

仅供分类算法测试用数据.数据内容为相隔两天的软的猕猴桃的近红外测试数据,标签为-1 和1,可以作为一个不同时间的猕猴桃的分类数据

2016-10-24

ROC曲线 源代码包

非常齐全的各类函数包,想画什么样的ROC曲线,都有相应代码,可以自己学习,也可以二次开发进行定制。

2015-10-13

Harris角点提取算法在H型目标追踪上的研究

在有少量干扰图形的情况下,为实现飞行器对着陆平台上的H型目标识别,中心定位以及跟踪控制,本文提出了在添加图像区域滤波的Harris角点提取算法的基础上,利用角点间组成的线段的比例关系以及线段所在直线间的相互关系来实现目标的自动追踪算法。

2015-07-23

基于tiny210的SD卡MP3播放器系统代码

一个小小的例程,如题所述,可以完美运行,需要的同学下下来学习下~

2015-07-17

机器学习实战源代码

这是机器学习实战,树上的全部例子代码,需要的同学可以下下来看看,帮助学习。

2015-07-17

基于FPGA的视频图像采集系统的设计与实现

基于FPGA的视频图像采集系统的设计与实现,提出了可行的基于FPGA的采集系统的设计和实现方法。

2013-05-06

多人物识别

为多人物检测提出了一种研究方法,提出了算法设计等

2013-05-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除