- 博客(15)
- 收藏
- 关注
转载 TF-IDF与余弦相似性的应用
本文转自http://www.ruanyifeng.com/blog/it/algorithm/,感谢作者。 这个标题看上去好像很复杂,其实我要谈的是一个很简单的问题。有一篇很长的文章,我要用计算机提取它的关键词(Automatic Keyphrase extraction),完全不加以人工干预,请问怎样才能正确做到?这个问题涉及到数据挖掘、文本处理、信息检索等
2013-04-06 22:29:29 1633
转载 从未知大小的n个数中取m个数,使各数被取出的概率相等
本文摘自http://www.zhangliancheng.com/2012/09/random-selecting-numbers-from-unknown-length-interger-sequence/,感谢作者。首先,这个问题来自于一道面试题。原题目的场景大体是这样的:服务器每天会收到数以亿计的请求,但是目前服务器端不希望保存所有的请求,只想随机保存这些请求中的m个。
2012-10-31 00:33:17 6182 2
转载 关于SQL中Select语句的执行顺序
本文转自http://www.gisall.com/html/40/145240-6118.html,感谢作者。 关于SQL中Select语句的执行顺序,一直很少注意这个问题,对于关键字的使用也很随意,至于效率问题,因为表中的数据量都不是很大,所以也不是很在意。今天在写一条语句的时候,在查询分析器里边执行。要用10s,换用另外一种写法只用少于1s的时间,同事说是因
2012-10-07 15:29:37 866
原创 四色定理涂色的解 ---------------------> 对网上答案的纠正
有一道面试题如下:运用四色定理,为N个局域举行配色,颜色为1、2、3、4四种,另有数组adj[][N],如adj[i][j]=1则表示i区域与j区域相邻,数组color[N],如color[i]=1,表示i区域的颜色为1号颜色。网上给出的答案基本上都是:#include #include using namespace std;static int curcolor=0;
2012-10-02 00:00:57 4086
转载 一天内时分秒的重合次数
本文主体摘自http://blog.csdn.net/zqt520/article/details/7365522,感谢作者。得出的结论是一天之中时分秒总共会重合2次,时分会重合20次。//程序如下:#include//设置时分秒针的速度//时针720秒走一格,分针60秒走一格,秒针1秒走一格,钟表一圈共60格//因此时针速度为1/720,分针速度为1/60,但在程序中为了便于实
2012-09-24 02:07:10 6205
转载 如何处理海量数据
本文转自http://www.cnblogs.com/lovexinsky/archive/2012/03/09/2387583.html。感谢作者~~在实际的工作环境下,许多人会遇到海量数据这个复杂而艰巨的问题,它的主要难点有以下几个方面:一、数据量过大,数据中什么情况都可能存在。如果说有10条数据,那么大不了每条去逐一检查,人为处理,如果有上百条数据,也可以考虑,如
2012-09-15 21:08:20 2857 1
原创 桶式排序法的C++实现
桶式排序桶式排序适用于那些数组中的元素为有界的情况,比如说以下算法中元素的界限为0~max桶式排序是通过一个计数器数组来存储待排序数组中每个元素值的个数,然后通过累加计数器中的值,分别得出每种元素值的最末位置最后通过元素的位置将元素放到数组中即可,从后往前放是为了保持算法的稳定性桶式排序的时间代价为O(max+n),空间代价为O(max)#ifndef BUCKETSORT_H
2012-09-13 15:19:27 1397
原创 普通排序算法的C++实现
本文中阐述普通排序算法,即冒泡排序法、选择排序法和插入排序法。用于排序算法中的比较类为:#ifndef _COMPARE_H#define _COMPARE_Htemplate class Compare{public: static bool compareLt( T,T ); static bool compareEq( T,T ); static bool com
2012-09-13 14:53:40 547
转载 C/C++宏的使用总结
本文转自http://sns.linuxpk.com/blog-6583-17087.html。C/C++宏的使用总结 宏替换是C/C++系列语言的技术特色,C/C++语言提供了强大的宏替换功能,源代码在进入编译器之前,要先经过一个称为“预处理器”的模块,这个模块将宏根据编译参数和实际编码进行展开,展开后的代码才正式进入编译器,进行词法分析、语法分析等等。 我们常用的宏
2012-07-31 18:04:27 1081
原创 APUE读书笔记 6--------- 系统数据文件和信息
一、口令文件和组文件1、口令文件(1)Linux系统的口令文件/ etc / passwd中的字段包含在passwd结构中,passwd的结构定义如下:#include /* The passwd structure. */struct passwd{ char *pw_name; /* Username. */ char *pw_pas
2012-07-29 20:47:28 608
原创 红黑树的C++实现与解析
所谓红黑树,就是平衡的扩充二叉搜索树,红黑树与AVL都是BST的平衡版本,相比AVL的完全平衡,红黑树只要求局部平衡,因此当向红黑树中插入和删除节点时,需要的调整比AVL要少,统计性能要好于AVL树,C++ STL中的map、set、multimap和multiset都应用了红黑树的变体。本文主要对红黑树的节点插入和节点删除进行解析。对于插入节点和删除节点本文都会总结一个基本的模板。
2012-07-27 16:06:22 12140 3
原创 shell排序法的C++实现
shell排序算法:shell排序算法的时间复杂度为o(n2),本文中的间隔每次除以2,若修改时间间隔,那么就可以得到更加优化的时间代价shell排序算法基于插入排序的两个性质:1、小序列性质:插入排序在小序列时的排序时间较短.2、有序性质:插入序列在有序序列中的时间消耗较少,接近于O(n).因此可以将较长的序列分割成一些较小的序列进行插入排序,然后再将这些较小的序列合成较大的
2012-07-27 15:57:12 2326
原创 归并排序法的C++实现
归并排序法归并排序法的空间代价为O(n),使用了辅助空间tempArr。时间代价为nlogn,因为树高为logn,而每层中消耗时间为O(n)。归并排序通过将一个长序列逐渐的划分为较小的序列,最后划分为1个个长度为1的串,然后依次进行合并。#ifndef MERGESORT_H#define MERGESORT_H#include using namespace std;temp
2012-07-27 15:54:18 648
原创 快速排序法的C++实现
快速排序法:快速排序法的最坏时间代价为O(n2),最坏空间代价为O(n);最优和平均时间代价为O(nlogn),空间代价为O(logn);快速排序法采用分治的思想,取定一个轴值,此处取中间值,然后将该值放于临时变量temp中,然后将最右边的值放于中间位置处,此时,最右边的位置便空闲出来索引为jIndex,最左边的索引为iIndex初始为0然后就从左边iIndex处开始向右找大于te
2012-07-27 15:49:14 770
转载 linux 标准IO缓冲机制探究
本文摘自http://blog.chinaunix.net/uid-26833883-id-3198114.html,本人从四中所画的图中理解了标准IO和UnBuffered IO的区别。一、什么是缓存I/O(Buffered I/O)缓存I/O又被称作标准I/O,大多数文件系统默认I/O操作都是缓存I/O。在Linux的缓存I/O机制中,操作系统会将I/O的数据缓存在文件系统
2012-07-26 01:52:03 1324
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人