- 博客(46)
- 资源 (2)
- 收藏
- 关注
转载 稳定排序和不稳定排序
首先,排序算法的稳定性大家应该都知道,通俗地讲就是能保证排序前2个相等的数其在序列的前后位置顺序和排序后它们两个的前后位置顺序相同。在简单形式化一下,如果Ai = Aj,Ai原来在位置前,排序后Ai还是要在Aj位置前。 其次,说一下稳定性的好处。排序算法如果是稳定的,那么从一个键上排序,然后再从另一个键上排序,第一个键排序的结果可以为第二个键排序所用。基数排序就是这样,先按低位排序,
2014-09-15 10:26:47 793
转载 IP地址与子网划分问题
1、 基本知识介绍1.1网络中的每一个主机或路由器至少有一个IP地址;在Internet中不允许有两个设备具有同样的IP地址;1.2IP地址采用分层结构;IP地址是由网络号(net ID)与主机号(host ID)两部分组成的。 1.3 IP地址的分类IP地址长度为32位,点分十进制(dotted decimal)地址;采用x.x.x.x的格式来表示,每个
2014-09-09 15:32:48 2507
转载 浅谈——磁盘调度算法
磁盘调度在多道程序设计的计算机系统中,各个进程可能会不断提出不同的对磁盘进行读/写操作的请求。由于有时候这些进程的发送请求的速度比磁盘响应的还要快,因此我们有必要为每个磁盘设备建立一个等待队列,常用的磁盘调度算法有以下四种:先来先服务算法(FCFS),最短寻道时间优先算法(SSTF),扫描算法(SCAN),循环扫描算法(CSCAN) 例:假定某磁盘共有200个柱面,编号为0
2014-09-08 20:24:39 1053
原创 MAC下的mysql安装、设置及删除
MAC下安装MYSQL有两种方式,一种为压缩包形式 另一种为.dmg文件安装包 。首先先介绍压缩包形式的安装方法:去MySql官网下MySQL classic版mysql-5.1.54-osx10.6-x86_64.tar.gzhttp://dev.mysql.com/downloads/mysql/5.1.html 记住得是64位的。因为mac下的python是6
2014-09-08 17:01:57 1126
转载 数据库与数据仓库的区别
首先,定义三个概念:数据库软件、数据库、数据仓库。数据库软件:是一种软件,可以看得见,可以操作。用来实现数据库逻辑功能。属于物理层。数据库:是一种逻辑概念,用来存放数据的仓库。通过数据库软件来实现。数据库由很多表组成,表是二维的,一张表里可以有很多字段。字段一字排开,对应的数据就一行一行写入表中。数据库的美,在于能够用二维表现多维关系。目前市面上流行的数据库都是二维数据库。如:Oracle
2014-09-07 16:09:46 1055
转载 堆(heap)和栈(stack)、内存泄漏(memory leak)和内存溢出
简单的可以理解为:heap:是由malloc之类函数分配的空间所在地。地址是由低向高增长的。stack:是自动分配变量,以及函数调用的时候所使用的一些空间。地址是由高向低减少的。一、预备知识—程序的内存分配一个由c/C++编译的程序占用的内存分为以下几个部分1、栈区(stack)— 由编译器自动分配释放 ,存放函数的参数值,局部变量的值等。其操作方式类似于数据结构中的栈。
2014-09-05 08:03:32 871
原创 操作系统一些知识点总结
1.引起进程调度的原因: 进程调度发生在什么时机呢?这与引起进程调度的原因以及进程调度的方式有关。 (1)正在执行的进程执行完毕。这时,如果不选择新的就绪进程执行,将浪费处理机资源。 (2)执行中进程自己调用阻塞原语将自己阻塞起来进入睡眠等状态。 (3)执行中进程调用了P原语操作,从而因资源不足而被阻塞;或调用了v原语操作激活了等待资源的进
2014-08-29 14:07:36 713
原创 找出有序数组中绝对值最小的元素
给定一个有序整数序列(非递减序),可能包含负数,找出其中绝对值最小的元素,比如给定序列 -5, -3, -1, 2, 8 则返回-1。
2014-08-26 17:56:03 2501
原创 求数组中两个元素的最小距离
一个数组,含有重复元素,给出两个数num1和num2,求这两个数字在数组中出现的位置的最小距离。O(n)时间复杂度,O(1)空间复杂度
2014-08-26 15:38:30 1579
转载 Linux下常用命令
常用指令ls 显示文件或目录 -l 列出文件详细信息l(list) -a 列出当前目录下所有文件及目录,包括隐藏的a(all)mkdir 创建目录 -p 创建目录,若无父目录,则创建p(parent)cd 切换目录touch
2014-08-24 14:05:49 684
转载 OSI七层模型小结
OSI7层模型的小结由于OSI是一个理想的模型,因此一般网络系统只涉及其中的几层,很少有系统能够具有所有的7层,并完全遵循它的规定。在7层模型中,每一层都提供一个特殊的网络功能。从网络功能的角度观察:下面4层(物理层、数据链路层、网络层和传输层)主要提供数据传输和交换功能,即以节点到节点之间的通信为主;第4层作为上下两部分的桥梁,是整个网络体系结构中最关键的部分;而上3层(会话层、表示层和
2014-08-24 08:18:03 974
转载 OSI七层模型详解
OSI 七层模型通过七个层次化的结构模型使不同的系统不同的网络之间实现可靠的通讯,因此其最主要的功能就是帮助不同类型的主机实现数据传输 。完成中继功能的节点通常称为中继系统。在OSI七层模型中,处于不同层的中继系统具有不同的名称。 一个设备工作在哪一层,关键看它工作时利用哪一层的数据头部信息。网桥工作时,是以MAC头部来决定转发端口的,因此显然它是数据链路层的设备。具体说:物理
2014-08-23 21:14:17 1540
转载 快速计算子网掩码和主机数
一、明确概念在介绍十进制算法前我们先要明确一些概念。A类地址:IP地址常采用点分十进制表示方法X.Y.Y.Y,在这里,X在1~126范围内称为A类,比如10.202.52.130,因为X为10,在1~126范围内,所以称为A类地址。B类地址:X在128~191范围内称为B类地址。C类地址:X在192~223范围内称为C类地址。各类地址默认子网掩码:A
2014-08-23 21:07:37 3372
转载 java对象的强引用,软引用,弱引用和虚引用
众所周知,java中是JVM负责内存的分配和回收,这是它的优点(使用方便,程序不用再像使用c那样操心内存),但同时也是它的缺点(不够灵活)。为了解决内存操作不灵活这个问题,可以采用软引用等方法。 在JDK1.2以前的版本中,当一个对象不被任何变量引用,那么程序就无法再使用这个对象。也就是说,只有对象处于可触及状态,程序才能使用它。这 就像在日常生活中,从商店购买了某样物品后,如果
2014-08-22 15:21:29 566
转载 Hadoop相关面试题(三)
1 使用Hive或者自定义MR实现如下逻辑product_no lac_id moment start_time user_id county_id staytime city_id13429100031 22554 8 2013-03-11 08:55:19.151754088 571
2014-08-21 17:41:43 1337
转载 Java程序员笔试题
1、谈谈final, finally, finalize的区别。 final:修饰符(关键字)如果一个类被声明为final,意味着它不能再派生出新的子类,不能作为父类被继承。因此一个类不能既被声明为 abstract的,又被声明为final的。将变量或方法声明为final,可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值,而在以后的引用中只能读取,不可修
2014-08-21 17:08:55 685
转载 Hadoop相关面试题(二)
1. 下面哪个程序负责 HDFS 数据存储。a)NameNode b)Jobtracker c)Datanode d)secondaryNameNode e)tasktracker答案C datanode2. HDfS 中的 block 默认保存几份?a)3 份 b)2 份c)1 份d)不确定答案A默认3分 3. 下列哪个程序通常与 NameNode 在
2014-08-21 17:02:46 3047
转载 Hadoop 学习笔记——mapreduce框架详解
开始聊mapreduce,mapreduce是hadoop的计算框架,我学hadoop是从hive开始入手,再到hdfs,当我学习hdfs时候,就感觉到hdfs和mapreduce关系的紧密。这个可能是我做技术研究的思路有关,我开始学习某一套技术总是想着这套技术到底能干什么,只有当我真正理解了这套技术解决了什么问题时候,我后续的学习就能逐步的加快,而学习hdfs时候我就发现,要理解hadoop框架
2014-08-21 16:59:54 757
转载 Hadoop相关面试题(一)
常见的1、hadoop运转的原理?2、mapreduce的原理?3、HDFS存储的机制?4、举一个简略的比方阐明mapreduce是怎么来运转的 ?5、面试的人给你出一些疑问,让你用mapreduce来完成? 比方:如今有10个文件夹,每个文件夹都有1000000个url.如今让你找出top1000000url。6、hadoop中Combiner的效果?
2014-08-21 15:44:30 1396
转载 几道概率题
题目: 一个骰子,6面,1个面是 1, 2个面是2, 3个面是3, 问平均掷多少次能使1、2、3都至少出现一次。方法: 面对面试概率题几乎屡试不爽的分叉树递归列方程法。这是一个求数学期望的问题,最终是求1,2,3出现至少一次的最短长度的期望。这样分叉树的每个节点是一个期望状态,而每个分叉是一次投掷结果。将后续期望出现1、2、3各至少一次的情形记作L123(即题目所求),
2014-08-20 16:25:52 1109
转载 面试之机器学习算法思想简单梳理
前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考虑该岗位,毕竟在机器智能没达到人类水平之前,机器学习可以作为一种重要手段,而随着科技的不断发展,相信这方面的人才需求也会越来越大。 纵观IT行业的招聘岗位,机器学习之类的岗位还是挺
2014-08-19 17:33:17 1162
原创 分类算法之二——特征提取与特征选择
文本的表示及其特征项的选取是文本挖掘、信息检索的一个基本问题,它把从文本中抽取出的特征词进行量化来表示文本信息。将它们从一个无结构的原始文本转化为结构化的计算机可以识别处理的信息,即对文本进行科学的抽象,建立它的数学模型,用以描述和代替文本。使计算机能够通过对这种模型的计算和操作来实现对文本的识别。由于文本是非结构化的数据,要想从大量的文本中挖掘有用的信息就必须首先将文本转化为可处理的结构化形式。
2014-08-19 16:20:47 19916
转载 分类算法之一——数据预处理
现实世界中数据大体上都是不完整,不一致的脏数据,无法直接进行数据挖掘,或挖掘结果差强人意。为了提前数据挖掘的质量产生了数据预处理技术。 数据预处理有多种方法:数据清理,数据集成,数据变换,数据归约等。这些数据处理技术在数据挖掘之前使用,大大提高了数据挖掘模式的质量,降低实际挖掘所需要的时间。 一、数据清理 首先是处理空缺值,如:要分析某市场的销售和顾客数据,但顾客的income项
2014-08-19 15:08:02 3306
原创 GPU上大规模稀疏矩阵特征值计算高效算法之三——SLEPc测试
Slepc计算矩阵特征值时间测试注:(1)GPU集群介绍:该集群有一个登录节点(ustcgpu)和100个计算节点(node1~node100)。各计算节点配置2颗4核的IntelE5520 CPU,16GB内存,通过20GbsInfiniBand互联。(2)测试采用Krylov-Schur算法计算速度这里采用Slepc计算稀疏度约为1%矩阵的一半特
2014-08-19 11:23:08 3256
原创 GPU上大规模稀疏矩阵特征值计算高效算法之二——稀疏矩阵
稀疏矩阵存储方式1)协调存储格式 COO(coordinate format)COO 格式是一种简单的存储方案,采用三个数组存储行标识,列标识和非0元素的值。COO是一种通用的存储格式,缺点是存储的效率不高。2)3)
2014-08-19 10:46:54 4713
转载 机器学习中的相似性度量
在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本间的“距离”(Distance)。采用什么样的方法计算距离是很讲究,甚至关系到分类的正确与否。本文的目的就是对常用的相似性度量作一个总结。本文目录:1. 欧氏距离2. 曼哈顿距离3. 切比雪夫距离4. 闵可夫斯基距
2014-07-27 21:40:34 608
转载 机器学习中的数学(1)-回归(regression)、梯度下降(gradient descent)
前言: 上次写过一篇关于贝叶斯概率论的数学,最近时间比较紧,coding的任务比较重,不过还是抽空看了一些机器学习的书和视频,其中很推荐两个:一个是stanford的machine learning公开课,在verycd可下载,可惜没有翻译。不过还是可以看。另外一个是prml-pattern recognition and machine learning, Bishop的一部反响不错
2014-07-24 22:22:37 830
原创 数据挖掘分类算法的优缺点总结
最近在学习分类算法,顺便整理了各种分类算法的优缺点。一.决策树一种启发式算法,核心是在决策树各个节点上应用信息增益等准则来选取特征,进而递归地构造决策树。优点:1. 计算复杂度不高,易于理解和解释,可以理解决策树所表达的意义;2. 数据预处理阶段比较简单,且可以处理缺失数据;3. 能够同时处理数据型和分类型属性,且可对有许多属性的数据集构造决策树
2014-07-23 22:17:15 6541
转载 数据挖掘中的分类算法比较
随着计算能力、存储、网络的高速发展,人类积累的数据量正以指数速度增长。对于这些数据,人们迫切希望从中提取出隐藏其中的有用信息,更需要发现更深层次的规律,对决策,商务应用提供更有效的支持。为了满足这种需求,数据挖掘技术的得到了长足的发展,而分类在数据挖掘中是一项非常重要的任务,目前在商业上应用最多。本文主要侧重数据挖掘中分类算法的效果的对比,通过简单的实验(采用开源的数据挖掘工具 -Weka)来验证
2014-07-22 16:31:02 4968
转载 知己知彼,IT公司对数据挖掘相关从业者的的要求
经常有人咨询数据挖掘该学什么,怎么学,先看看各公司的要求,对着摸索着学习。路走对了,就不怕远,wish u good luck!一淘广告技术算法工程师-数据挖掘工作年限 3年以上学历要求 硕士岗位描述 1. 对数据敏感,热爱数据挖掘领域的工作2. 思维敏捷,良好的逻辑分析能力、良好的沟通及组织能力,能在一定压力下工作3. 计算机、统计、数学、信
2014-06-28 08:41:36 1762
转载 如何提高自己的acm个人能力
本来以为HNU的huicpc035和我一样退役了,后来听说他组成了新的footman队,于是又关注了下他。035体现了两个我觉得非常重要的品质:1、刻苦的训练2、有效的训练 (本文将主要讨论个人训练,不讨论团队合作)而这些品质对于我们弱校ACMer选手水平的提高我觉得很重要。(注意:仅限于我们ACM-ICPC的弱校,即最多只能勉强摘银的学校,不要一概
2014-04-27 14:03:36 3004
转载 求一个数阶乘的后面连续0的个数
对于一个数n的阶乘 n! ,计算其后面有几个连续的零。 我们知道,10 = 2 * 5。每一个 2 与一个 5 相乘,结果就增加一个零。所以求 n! 后面的连续零的个数,其实就是求其中相乘的数含有因子每对因子 2 与 5 的个数。又因为从1到某个数,所含 2 的个数比 5 多,所以问题就可以进一步简化到求含有因子5的个数。 JAVA实现代码如下:Co
2014-04-22 23:14:58 1403
转载 不是技术牛人,如何拿到国内IT巨头的Offer
不久前,byvoid面阿里星计划的面试结果截图泄漏,引起无数IT屌丝的羡慕敬仰。看看这些牛人,NOI金牌,开源社区名人,三年级开始写Basic...在跪拜之余我们不禁要想,和这些牛人比,作为绝大部分技术屌丝的同学们,是否真的与国内IT巨头遥不可及呢? 当你打开这个帖子的时候,我已经默认你是此文的目标读者,也就是想进入国内一流互联网企业的非牛人应届生。 你不需要拿NOI的奖,无需
2014-04-19 16:12:43 780
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人