- 博客(59)
- 资源 (26)
- 收藏
- 关注
原创 C++网络爬虫的实现——WinSock编程
写了一个网络爬虫,可以抓取网上的图片。需要给定初始网站即可。在vs2010中编译通过。编译后,运行即可,有惊喜哦!!!//#include #include #include #include #include #include "winsock2.h"#include #include #include #pragma comment(lib,
2012-10-28 04:05:59 80097 39
转载 正则表达式30分钟入门教程
目录跳过目录本文目标如何使用本教程正则表达式到底是什么东西?入门测试正则表达式元字符字符转义重复字符类分枝条件反义分组后向引用零宽断言负向零宽断言注释贪婪与懒惰处理选项平衡组/递归匹配还有些什么东西没提到联系作者网上的资源及本文参考文献更新纪录本文目标30分钟内让你明白正则表达式是什么,并对它有一些基本的了解,让你可以在自己的程序或网页里使用它。如何使用本教
2012-10-27 10:55:43 2044
转载 sscanf与正则表达式
http://unibetter.com/deerchao/zhengzhe-biaodashi-jiaocheng-se.htmhttp://msdn.microsoft.com/en-us/library/28hw3sce.aspxhttp://msdn.microsoft.com/zh-cn/library/system.text.regularexpressions.regex
2012-10-27 10:32:39 7490 1
转载 JPEG图片存储格式及原理
JPEG是联合图象专家组(Joint Picture Expert Group)的英文缩写,是国际标准化组织(ISO)和CCITT联合制定的静态图象的压缩编码标准。和相同图象质量的其它常用文件格式(如GIF,TIFF,PCX)相比,JPEG是目前静态图象中压缩比最高的。我们给出具体的数据来对比一下。例图采用Windows95目录下的Clouds.bmp,原图大小为640*480,256色。用工具S
2012-10-27 01:24:00 31505 2
原创 WinSock C++编程获取网页
使用WinSock。#include #include #include #include "winsock2.h"#include #pragma comment(lib, "ws2_32.lib") using namespace std;#define DEFAULT_PAGE_BUF_SIZE 1048576void main(){ WSADA
2012-10-26 23:16:41 2322
转载 sockaddr与sockaddr_in,sockaddr_un结构体详细讲解
struct sockaddr {unsigned short sa_family; /* address family, AF_xxx */char sa_data[14]; /* 14 bytes of protocol address */};sa_family是地址家族,一般都是“AF_xxx”的形式。好像通常大多用的是都是AF_IN
2012-10-26 22:46:21 5642 1
转载 WinSock学习笔记
Socket(套接字)◆先看定义:1.typedef unsigned int u_int;2.typedef u_int SOCKET;◆Socket相当于进行网络通信两端的插座,只要对方的Socket和自己的Socket有通信联接,双方就可以发送和接收数据了。其定义类似于文件句柄的定义。◆Socket有五种不同的类型:1、流式
2012-10-26 22:14:07 1022
原创 基于TCP/UDP的应用层协议
1,基于TCP的有:Telnet(Teletype over the Network, 网络电传) ,通过一个终端(terminal)登陆到网络FTP(File Transfer Protocol, 文件传输协议) ,由名知义SMTP(Simple Mail Transfer Protocol,简单邮件传输协议) ,用来发送电子邮件POP3(Post Office Protocol 3
2012-10-24 11:28:21 11864
转载 TCP/IP网络层次结构
4应用层(OSI5 到 7层)例如HTTP、FTP、DNS(如BGP和RIP这样的路由协议,尽管由于各种各样的原因它们分别运行在TCP和UDP上,仍然可以将它们看作网络层的一部分)3传输层(OSI4层)例如TCP、UDP、RTP、SCTP(如OSPF这样的路由协议,尽管运行在IP上也可以看作是网络层的一部分)2网络互连层(OS
2012-10-24 11:08:14 14253
转载 C++单例模式多种实现技巧介绍
C++是一款应用非常广泛的计算机编程语言。它支持多种程序设计风格,其中包括对面向对象设计的支持。今天为大家介绍的C++单例模式也称为单件模式、单子模式。使用单例模式,保证一个类仅有一个实例,并提供一个访问它的全局访问点,该实例被所有程序模块共享。有很多地方需要这样的功能模块,如系统的日志输出等。C++单例模式有许多种实现方法,在C++中,甚至可以直接用一个全局变量做到这一点,但这样的代码显
2012-10-24 10:49:10 1040
转载 KMP算法
在介绍KMP算法之前,先介绍一下BF算法。一.BF算法 BF算法是普通的模式匹配算法,BF算法的思想就是将目标串S的第一个字符与模式串P的第一个字符进行匹配,若相等,则继续比较S的第二个字符和P的第二个字符;若不相等,则比较S的第二个字符和P的第一个字符,依次比较下去,直到得出最后的匹配结果。 举例说明: S: ababcababa
2012-10-19 23:19:12 1001
转载 PLSA中的EM算法
PLSA中的EM算法主要记录下几个文章博客内容A Note on EM Algorithm for Probabilistic Latent SemanticAnalysis(翟成祥的NOTE)A Note on EM Algorithm and PLSA(一个中文比较好的总结 by Xinyan Lu)注意这两个是一个思路Probabilist
2012-10-19 22:15:34 3945
转载 LSA and PLSA笔记
1. 引子Bag-of-Words 模型是NLP和IR领域中的一个基本假设。在这个模型中,一个文档(document)被表示为一组单词(word/term)的无序组合,而忽略了语法或者词序的部分。BOW在传统NLP领域取得了巨大的成功,在计算机视觉领域(Computer Vision)也开始崭露头角,但在实际应用过程中,它却有一些不可避免的缺陷,比如:稀疏性(Sparseness)
2012-10-19 21:42:12 9720
转载 HMM学习笔记_1(从一个实例中学习DTW算法)
HMM学习笔记_1(从一个实例中学习DTW算法) DTW为(Dynamic Time Warping,动态时间归准)的简称。应用很广,主要是在模板匹配中,比如说用在孤立词语音识别,计算机视觉中的行为识别,信息检索等中。可能大家学过这些类似的课程都看到过这个算法,公式也有几个,但是很抽象,当时看懂了但不久就会忘记,因为没有具体的实例来加深印象。 这次主要是用语音识别课程老
2012-10-19 20:52:28 2396
转载 HMM学习笔记_3(从一个实例中学习Viterbi算法)
HMM学习笔记_3(从一个实例中学习Viterbi算法) 在上一篇博客http://www.cnblogs.com/tornadomeet/archive/2012/03/24/2415583.html中,我们已经从一个例子中学会了HMM的前向算法,解决了HMM算法的第一个问题,即模型评估问题。这一讲中我们来解决第二个问题:HMM的解码问题,即即给定观测序列 O=O1O2O3…
2012-10-19 20:51:34 1752
转载 HMM学习笔记_2(从一个实例中学习HMM前向算法)
HMM学习笔记_2(从一个实例中学习HMM前向算法) HMM算法想必大家已经听说了好多次了,完全看公式一头雾水。但是HMM的基本理论其实很简单。因为HMM是马尔科夫链中的一种,只是它的状态不能直接被观察到,但是可以通过观察向量间接的反映出来,即每一个观察向量由一个具有相应概率密度分布的状态序列产生,又由于每一个状态也是随机分布的,所以HMM是一个双重随机过程。 HMM是
2012-10-19 20:50:51 1340
转载 隐马尔可夫模型
数学之美之隐马尔可夫模型刚开始学习此类知识,好多模型、算法都还待了解,看到google研究员的数学之美系列有不少模型算法介绍,拿来摘下,虽然没有自己的东西,但是希望能自己能在这里留的时间长一点,21天可以一个习惯,权当开个头,希望今后能有自己的东西。原文:数学之美 系列一 -- 统计语言模型,数学之美 系列三 -- 隐含马尔可夫模型在语言处理中的应用1.马尔可夫模型的假设
2012-10-19 20:17:21 1039
转载 Trie树——字典树
1、 概述Trie树,又称字典树,单词查找树或者前缀树,是一种用于快速检索的多叉树结构,如英文字母的字典树是一个26叉树,数字的字典树是一个10叉树。Trie一词来自retrieve,发音为/tri:/ “tree”,也有人读为/traɪ/ “try”。Trie树可以利用字符串的公共前缀来节约存储空间。如下图所示,该trie树用10个节点保存了6个字符串tea,ten,to
2012-10-18 23:21:57 1418
转载 并查集概念及其实现
1、 概述并查集(Disjoint set或者Union-find set)是一种树型的数据结构,常用于处理一些不相交集合(Disjoint Sets)的合并及查询问题。2、 基本操作并查集是一种非常简单的数据结构,它主要涉及两个基本操作,分别为:A. 合并两个不相交集合B. 判断两个元素是否属于同一个集合(1) 合并两个不相交集合(
2012-10-18 23:18:20 1157
原创 海量数据
1、 海量数据分布在100台电脑中,想个办法高校统计出这批数据的TOP10。方案1:s 在每台电脑上求出TOP10,可以采用包含10个元素的堆完成(TOP10小,用最大堆,TOP10大,用最小堆)。比如求TOP10大,我们首先取前10个元素调整成最小堆,如果发现,然后扫描后面的数据,并与堆顶元素比较,如果比堆顶元素大,那么用该元素替换堆顶,然后再调整为最小堆。最后堆中的元素就是TO
2012-10-18 22:11:41 2004
原创 求数组的子数组和的最大值
来源:编程之美2.24一些典型的测试用例:[1,-2,3,5,-3,2] max=8[0,-2,3,5,-1,2] max =9[-2,-4,-3] max=-2这是一个动态规划问题,设当前扫描到arr[i]则summax= max( arr[i], maxendinghere, maxsofar);其中maxendinghere
2012-10-18 21:08:57 1124
转载 C/C++中const用法小结
常类型是指使用类型修饰符const说明的类型,常类型的变量或对象的值是不能被更新的。因此,定义或说明常类型时必须进行初始化。概述1. const有什么用途?在 c程序中,const的用法主要有定义常量、修饰函数参数、修饰函数返回值等3个用处。在c++程序中,它还可以修饰函数的定义体,定义类中某个成员为常态函数,即不改变类中的数据成员。被const修改的东西都要受到强制保
2012-10-18 20:19:17 6768
原创 编程之美-最短摘要
2011年题目:Alibaba笔试题:给定一段产品的英文描述,包含M个英文字母,每个英文单词以空格分隔,无其他标点符号;再给定N个英文单词关键字,请说明思路并编程实现方法String extractSummary(String description,String[] key words),目标是找出此产品描述中包含N个关键字(每个关键词至少出现一次)的长度最短的子串,作为产品简介输出
2012-10-18 18:54:25 2757 2
转载 static有什么作用?
面试题:static有什么作用?答:在C语言中,static主要定义全局静态变量,定义局部静态变量,定义静态函数 一、 定义全局静态变量 :在全局变量前面加上关键字static,该全局变量变成了全局静态变量。全局静态变量有以下特点:(1) 在全局数据区内分配内存(2) 如果没有初始化,其默认值为0(3) 该变量
2012-10-18 14:30:22 21885
转载 perfect shuffle 算法的一个线性复杂度实现
今天又发现一个关于完美洗牌的算法。这个比较简单一些,由 microsoft的Peiyush Jain提出。 原论文: A Simple In-Place Algorithm for In-Shuffle. Peiyush Jain, Microsoft Corporation.
2012-10-18 12:05:49 2849
原创 寻找第K大的数
1,对于一个有序数组则为第K个数,O(1)2,对于一个无序数组使用修改的快排划分算法,时间复杂度为O(n)3,对于两个无序数组合并(不是真的合并,只是看出一个数组),则时间复杂度为O(n+m)4,对于两个有序(假设递增)数组http://www.51nod.com/question/index.html#!questionId=217在两个有
2012-10-18 11:21:41 3448
原创 创新工场面试题
1,如何删除一个搜索二叉树的结点解:情况一:根节点1>无孩子:则放回空2>有一个孩子,则放回其孩子3>有两个孩子,则返回其左孩子,将右孩子作为左子树的最右边的结点的右孩子;或者返回右子树,将左子树作为右子树的最左结点的左孩子。情况二:非根结点1>无孩子:直接删去2>一个孩子:则将孩子代替自己接入父节点。3>两个孩子:方法一:如果本身是左孩子,则将左子树接
2012-10-17 18:03:25 2637
原创 搜狗笔试题
搜狗:1,有n*n个正方形格子,每个格子里有正数或者0,从最左上角往最右下角走,只能向下和向右走。一共走两次,把所有经过的格子的数加起来,求最大值。且两次如果经过同一个格子,则该格子的数只加一次。思路:搜索:一共搜(2n-2)步,每一步有四种走法。考虑不相交等条件可以剪去很多枝。复杂度为O(4^n)动态规划:by:绿色夹克衫详细算法思路:http://w
2012-10-15 01:43:59 10034 4
原创 人民搜索笔试题2013
人搜算法题:1,二重歌德巴赫猜想所有大于等于6的偶数都可以表示成两个(奇)素数之和。给定1-10000;要求找出每一个可以表示为两素数之和的数,如果有多对,则只需要输出其中之一即可。输出:N = a + b;N=1-10000;对于不能表示的就不用输出。a,b为两个素数。要求:复杂度较低,代码可运行。2,城市遍历某人家住北京,想去青海玩,可能会经过许多城
2012-10-14 01:13:30 3048 1
转载 线程安全C/C++
对于多线程编程,很多人概念不清,写代码的时候要么是处处加锁,影响性能不说,还容易莫名其妙的死锁,还有人对多线程敬而远之。所以学习多线程编程最重要的不是学习API,而是理解什么才是多线程安全的代码从例子说起#include windows.h>#include process.h>long global1 = 0;volatile long global2 =
2012-10-13 23:42:47 9329 1
原创 360笔试题2013
编程题、传教士人数M,野人C,M≥C,开始都在岸左边,①船只能载两人,传教士和野人都会划船,当然必须有人划船②两岸边保证野人人数不能大于传教士人数 把所有人都送过河,设计一方案,要求编程实现。 思路:深度搜索。状态:左岸和右岸的人数+船的位置。每一个状态下,会有5种状态可以转移,即:1,运送2个传教士到对岸;2,运送2个野人到对岸;3,运
2012-10-13 00:40:47 18323 25
转载 最全的C语言试题总结
最全的C语言试题总结 C语言终极面试宝典_C语言面试必备 C语言第一部分:基本概念及其它问答题1、关键字static的作用是什么?这个简单的问题很少有人能回答完全。在C语言中,关键字static有三个明显的作用:1). 在函数体,一个被声明为静态的变量在这一函数被调用过程中维持其值不变。2). 在模块内(但在函数体外),一个被声明为静态的变量可以被模块内
2012-10-09 09:56:18 5660 2
转载 字符串/数组面试题
1 在一个字符串中找到第一个只出现一次的字符,如输入abac,则输出b。2 输出字符串的所有组合,如"abc"输出a、b、c、ab、ac、bc、abc。3 根据条件找出两个数。4 求数组(或环状数组)的最大连续(或不连续)子序列和。 1 在一个字符串中找到第一个只出现一次的字符,如输入abac,则输出b。本题看似很简单,开
2012-10-08 00:06:28 1341
转载 寻找数组中的最小值和最大值——编程之美2.10
转自:http://blog.csdn.net/flyinghearts/article/details/6388834#问题:寻找数组中的最小值和最大值。 一道很简单的题目,一般有下面4种解法:1 遍历两次,每次分别找出最小值和最大值。2 只遍历一次,每次取出的元素先与已找到的最小值比较,再与已找到的最大值比较。3 每次取两个元素,将较小者与已找到的最小值比
2012-10-07 23:52:07 4128 1
转载 计算字符串的相似度
转自:http://www.cnblogs.com/yujunyong/articles/2004724.html许多程序会大量使用字符串。对于不同的字符串,我们希望能够有办法判断其相似程序。我们定义一套操作方法来把两个不相同的字符串变得相同,具体的操作方法为: 1.修改一个字符(如把“a”替换为“b”); 2.增加一个字符(如把“abdd”变为“aebdd”);
2012-10-07 23:28:57 1141
原创 汉诺塔问题
一,移动次数的计算 现在有三根相邻的柱子,标号为A,B,C,A柱子上从下到上按金字塔状叠放着n个不同大小的圆盘,现在把所有盘子一个一个移动到柱子B上,并且每次移动同一根柱子上都不能出现大盘子在小盘子上方,请问至少需要多少次移动,设移动次数为H(n)。 首先我们肯定是把上面n-1个盘子移动到柱子C上,然后把最大的一块放在B上,最后把C上的所有盘子移动到B上,由此我们得出表达式:
2012-10-07 23:28:23 6236
转载 计算字符串的相似度--编程之美3.3
许多程序会大量使用字符串。对于不同的字符串,我们希望能够有办法判断其相似程序。我们定义一套操作方法来把两个不相同的字符串变得相同,具体的操作方法为: 1.修改一个字符(如把“a”替换为“b”); 2.增加一个字符(如把“abdd”变为“aebdd”); 3.删除一个字符(如把“travelling”变为“traveling”); 比如,对于“abcdef
2012-10-07 23:03:48 1660
转载 最小生成树
设G = (V,E)是无向连通带权图,即一个网络。E中的每一条边(v,w)的权为c[v][w]。如果G的子图G’是一棵包含G的所有顶点的树,则称G’为G的生成树。生成树上各边权的总和称为生成树的耗费。在G的所有生成树中,耗费最小的生成树称为G的最小生成树。构造最小生成树的两种方法:Prim算法和Kruskal算法。 一、最小生成树的性质 设G = (V,E)是连通带权图,U是V
2012-10-07 20:55:55 2504 1
转载 最短路径算法—Bellman-Ford(贝尔曼-福特)算法分析与实现(C/C++)
地址:http://www.wutianqi.com/?p=19121.Dijkstra算法:http://www.wutianqi.com/?p=18902.Floyd算法:http://www.wutianqi.com/?p=1903Dijkstra算法是处理单源最短路径的有效算法,但它局限于边的权值非负的情况,若图中出现权值为负的边,Dij
2012-10-07 20:19:31 2479
JDK8(MAC) 官网下载太慢了 jdk-8u201-macosx-x64.dmg.zip
2020-08-11
windows驱动开发技术详解-part2
2013-07-06
Windows驱动开发技术详解的光盘-part1
2013-07-06
C#调用C++DLL程序与工具
2013-05-16
Windows API —函数、接口、编程实例
2013-01-12
Windows程序设计+第五版(珍藏版).part1
2012-12-24
Windows程序设计+第五版(珍藏版).part2
2012-12-24
Windows程序设计+第五版(珍藏版).part3
2012-12-24
Windows程序设计+第五版(珍藏版).part4
2012-12-23
Windows程序设计+第五版(珍藏版).part5
2012-12-21
VC++动态链接库DLL编程详细教程
2012-12-16
COM编程精彩实例+光盘(源代码)
2012-12-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人