自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(47)
  • 资源 (4)
  • 收藏
  • 关注

转载 多线程经典题目

1、基本概念        详见:线程和进程关系和区别、同步和互斥、进程间通信2、以下多线程对int型变量x的操作,哪几个不需要进行同步(D)        A. x=y;      B. x++;    C. ++x;    D. x=1;        详见:多线程二 多线程中的隐蔽问题揭秘3、多线程中栈与堆是公有的还是私有的 (C)       

2014-08-31 08:31:42 638

转载 Linux下几个文件擦做命令代码实现

http://www.ibm.com/developerworks/cn/linux/l-cn-commands/Linux 下几个文件操作命令的代码实现用 C 语言实现命令 cp、df、mkdir、rm、tac本文主要讲述 cp、mkdir、rm、tac、df 五个命令主要功能的模拟实现代码。让读者学会使用 strace 来跟踪系统调用

2014-08-29 00:53:04 847

原创 Linux显示文本的命令(cat, tac,more,less,head,tail,nl)

分类: LINUX有许多命令都可以查看文件,不同的命令有不同的优点,可以针对不同的需要分别选择命令以提高效率:    cat     由第一行开始显示内容,并将所有内容输出    tac     从最后一行倒序显示内容,并将所有内容输出    more    根据窗口大小,一页一页的现实文件内容    less    和more类似,但其优点可以往前翻页,而且进

2014-08-29 00:10:59 589

转载 基于Hadoop 的分布式网络爬虫技术学习笔记

http://blog.csdn.net/zolalad/article/details/16344661基于Hadoop 的分布式网络爬虫技术学习笔记  一、网络爬虫原理Web网络爬虫系统的功能是下载网页数据,为搜索引擎系统提供数据来源。很多大型的网络搜索引擎系统都被称为基于 Web数据采集的搜索引擎系统,比如 Google、Baidu。由此可见 Web 网络爬虫系统在搜索引擎中

2014-08-28 19:14:05 11648

转载 设计 一个高性能爬虫系统

最近看了一篇来自纽约大学理工学院的论文,讲述的是如何设计一个高性能的分布式网络爬虫。原文标题是:Design and Implementation of a High-Performance Distributed Web Crawler。个人认为虽然此文发布的时间已经是8、9年前,但其内容仍然具有很多实践意义,故写此博文对文中内容进行一个总结。正如原文中所说,设计一个爬虫不断的抓取网页并

2014-08-28 19:05:39 5418

转载 各种hash,bloom filter 集锦

Bloom Filter概念和原理焦萌 2007年1月27日 Bloom Filter是一种空间效率很高的随机数据结构,它利用位数组很简洁地表示一个集合,并能判断一个元素是否属于这个集合。Bloom Filter的这种高效是有一定代价的:在判断一个元素是否属于某个集合时,有可能会把不属于这个集合的元素误认为属于这个集合(false positive)。因此,Bloom Filter

2014-08-28 11:08:37 545

转载 Dancing link 与精确匹配问题

精确覆盖问题的定义:给定一个由0-1组成的矩阵,是否能找到一个行的集合,使得集合中每一列都恰好包含一个1例如:如下的矩阵就包含了这样一个集合(第1、4、5行) 如何利用给定的矩阵求出相应的行的集合呢?我们采用回溯法 矩阵1: 先假定选择第1行,如下所示:如上图中所示,红色的那行是选中的一行,这一行中有3个1,分

2014-08-27 21:15:58 1103

转载 dancing link 资料

http://blog.csdn.net/mu399/article/details/7627862  问题转化为

2014-08-27 21:15:07 1583

转载 dancing link 解决八皇后

http://blog.sina.com.cn/s/blog_51cea4040100gwqw.html  八皇后  dancing link

2014-08-27 21:09:49 1692

转载 决策树模型组合之随机森林与GBDT

http://www.cnblogs.com/LeftNotEasy/archive/2011/03/07/random-forest-and-gbdt.html前言:    决策树这种算法有着很多良好的特性,比如说训练时间复杂度较低,预测的过程比较快速,模型容易展示(容易将得到的决策树做成图片展示出来)等。但是同时,单决策树又有一些不好的地方,比如说容易over-fi

2014-08-27 14:08:32 435

转载 应用程序执行 内存分配

可执行程序的内存分布GNU编译器生成的目标文件默认格式为elf(executive linked file)格式,这是Linux系统所采用的可执行链接文件的通用文件格式。elf格式由若干个段(section)组成,由标准c源代码生成的目标文件中包含以下段:      .text(正文段)包含程序的指令代码,      .data(数据段)包含固定的数据,如常量,

2014-08-27 14:07:20 853

翻译 在浏览器中输入URL之后会发生什么(what happens when you type in a URL in browser)

In an extremely rough and simplified sketch, assuming the simplest possible HTTP request, no proxies and IPv4 (this would work similarly for IPv6-only client, but I have yet to see such workstation):

2014-08-24 10:37:21 609

转载 Linux环境下段错误的产生原因及调试方法小结

http://www.cnblogs.com/panfeng412/archive/2011/11/06/2237857.htmlLinux环境下段错误的产生原因及调试方法小结最近在Linux环境下做C语言项目,由于是在一个原有项目基础之上进行二次开发,而且项目工程庞大复杂,出现了不少问题,其中遇到最多、花费时间最长的问题就是著名的“段错误”(Segmentation Fa

2014-08-21 17:06:44 711

转载 Sort命令详解

linux sort 命令详解sort是在Linux里非常常用的一个命令,管排序的,集中精力,五分钟搞定sort,现在开始!1 sort的工作原理 sort将文件的每一行作为一个单位,相互比较,比较原则是从首字符向后,依次按ASCII码值进行比较,最后将他们按升序输出。[rocrocket@rocrocket programming]$ cat seq.txtbanan

2014-08-15 14:36:59 560

转载 Linux awk 命令详解

http://www.cnblogs.com/ggjucheng/archive/2013/01/13/2858470.htmllinux awk命令详解简介awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。

2014-08-15 11:52:15 445

原创 动态维护中位数

问题陈述:有个需要动态更新(插入或删除)的数列L,现在需要随时获取到该数列的中位数,请设计相应的数据结构和算法。 算法:令L的中位数为m,用一个大顶堆存储数列L中不大于m的元素(即L按从小到大排列时的前半部分),用一个小顶堆存储数列L中不小于m的元素(即L按从小到大排列时的后半部分),其中这两个大小顶堆均不包含中位数m。每次往数列L插入新元素x时,若x 分析:容易看

2014-08-14 11:36:12 3732

转载 基于比较排序复杂度nlogn下限证明

昨天下午吃完饭,正好碰到一同学,就随便聊了聊。 他说刚参加完一个面试。我很感兴趣,因为下半年就该我找工作了,这方面的信息对我来说比较重要。看得出来,他有点小郁闷,说面试官是个BT。问了原因之后,我便很同意他这个观点了。面试官似乎对查找和排序很感兴趣,问的大部分都是这方面的。首先是让用n+lgn的时间复杂度求出一个无序数组的最大值和第二大值,tooooold,同学面不改色答之,然后O(n)求第k大,

2014-08-14 11:29:31 2133

转载 内存对齐详细

对齐:现代计算机中内存空间都是按着byte划分的,从理论上讲似乎对任何类型的变量的访问可以从任何地址开始,但实际情况是在访问特定变量的时候经常在特定的内存地址访问,这就是需要各类型数据按照一定的规则在空间上排列,而不是顺序的一个接一个的排放,这就是对齐。对齐的作用:各个硬件平台对存储空间的处理上有很大的不同。一些平台对某些特定类型的数据只能从某些特定地址开始存储。其他平台可

2014-08-14 10:22:50 461

转载 session与cookie的区别

session与cookie的区别我所知道的有以下区别:         1、session保存在服务器,客户端不知道其中的信息;cookie保存在客户端,服务器能够知道其中的信息。         2、session中保存的是对象,cookie中保存的是字符串。         3、session不能区分路径,同一个用户在访问一个网站期间,所有的sessi

2014-08-13 17:35:12 538

转载 最长公共子序列的NlogN解法

最长公共子序列 的 nlogn 的算法本质是 将该问题转化成 最长增序列(LIS),因为 LIS 可以用nlogn实现,所以求LCS的时间复杂度降低为 nlogn。1. 转化:将LCS问题转化成LIS问题。               假设有两个序列 s1[ 1~6 ] = { a, b, c , a, d, c }, s2[ 1~7 ] = { c, a, b, e, d, a,

2014-08-13 17:22:06 4388

转载 关于函数strtok和strtok_r的使用要点和实现原理(二)

原文:http://blog.csdn.net/liuintermilan/article/details/6283705(一)中已经介绍了使用strtok函数的一些注意事项,本篇将介绍strtok的一个应用并引出strtok_r函数。 1.一个应用实例网络上一个比较经典的例子是将字符串切分,存入结构体中。如,现有结构体typedef struct pers

2014-08-11 09:05:24 482

转载 关于函数strtok和strtok_r的使用要点和实现原理(一)

原文:strtok函数的使用是一个老生常谈的问题了。该函数的作用很大,争议也很大。以下的表述可能与一些资料有区别或者说与你原来的认识有差异,因此,我尽量以实验为证。交代一下实验环境是必要的,winxp+vc6.0,一个极端平民化的实验环境。本文中使用的源代码大部分来自于网络,我稍加修改作为例证。当然,本人水平有限,有不妥之处在所难免,各位见谅的同时不妨多做实验,以实验为证。strt

2014-08-11 09:02:16 411

转载 Morris 树遍历算法

在遍历儿叉树时,常常使用的是递归遍历,或者是借助于栈来迭代,在遍历过程中,每个节点仅访问一次,所以这样遍历的时间复杂度为O(n),空间复杂度为O(n),并且递归的算法易于理解和实现,二叉树的递归遍历算法代码如下:儿叉树的定义:[cpp] view plaincopytypedef struct BNode {      char 

2014-08-09 15:46:43 928

转载 阿里大数据竞赛

不曾真正为之付出的人,永远也不会懂得珍惜2014年8月5日 11:061、我们要做的是什么根据官方描述,这次比赛要做的就是:根据用户4个月在天猫上对品牌的点击、收藏、购物车、购买等行为记录,预测第5个月哪些用户会购买哪些品牌。1.1分解问题再进一步细化,问题可以分为3个部分:在下一个月,哪些品牌可能被购买,哪些用户会进行购买,以及用户会购买的是哪

2014-08-09 09:30:48 2669

原创 JIT技术(HHVM中有用到)

在Java编程语言和环境中,即时编译器(JIT compiler,just-in-timecompiler)是一个把Java的字节码(包括需要被解释的指令的程序)转换成可以直接发送给处理器(processor)的指令的程序。当你写好一个Java程序后,源语言的语句将由Java编译器编译成字节码,而不是编译成与某个特定的处理器硬件平台对应的指令代码(比如,Intel的Pentium微处理器或IBM的

2014-08-08 23:12:53 1422

转载 Facebook-开源项目---Thrift框架学习

本文先整体性地介绍Thrift框架,然后分析Thrift源码中自带的toturial例子,作为Thrift的入门吧。一.Thrift介绍Thrfit是一种开源的跨语言的服务部署框架,这里的服务是指RPC,即远程过程调用了。它最初是由Facebook开发的,后来Facebook将其开源了。因此你可以很方便地下载到它的源代码,下载地址为:http://incubator.apach

2014-08-08 20:55:14 4346

转载 reinterpre_cast用法

reinterpret_cast (expression)reinterpret_cast运算符是用来处理无关类型之间的转换;它会产生一个新的值,这个值会有与原始参数(expressoin)有完全相同的比特位。什么是无关类型?我没有弄清楚,没有找到好的文档来说明类型之间到底都有些什么关系(除了类的继承以外)。后半句倒是看出了reinterpret_cast的字面意思:重新解释

2014-08-08 20:53:36 781

转载 几种所的实现 自旋所,排队自旋锁,MCS锁,CLH锁

自旋锁、排队自旋锁、MCS锁、CLH锁5条回复自旋锁(Spin lock)自旋锁是指当一个线程尝试获取某个锁时,如果该锁已被其他线程占用,就一直循环检测锁是否被释放,而不是进入线程挂起或睡眠状态。自旋锁适用于锁保护的临界区很小的情况,临界区很小的话,锁占用的时间就很短。简单的实现import java.util.concurrent.atomic.A

2014-08-06 16:43:17 641

原创 并发编程 技术网站

http://ifeve.com/about-site/http://ifeve.com/thread-signaling/  并发编程的网站

2014-08-06 16:37:01 538

转载 用于并行计算的多线程数据结构,第 2 部分: 设计不使用互斥锁的并发数据结构

http://www.ibm.com/developerworks/cn/aix/library/au-multithreaded_structures2/index.html

2014-08-06 16:16:00 610

原创 执行main函数之前要做的工作

main函数执行之前主要是初始化系统资源1、设置栈指针。2、初始化static静态和global全局变量,即data段内容。3、将未初始化部分的赋初值:数值型short,int,long等为0,bool为FALSE,指针为NULL,等等,即.bss段的内容。4、运行全局构造器,估计是C++中构造函数之类的吧5、将main函数的参数,argc,argv等传递给

2014-08-06 16:03:40 924

转载 JAVA TreeMap 红黑树

通过分析 JDK 源代码研究 TreeMap 红黑树算法实现TreeMap 和 TreeSet 是 Java Collection Framework 的两个重要成员,其中 TreeMap 是 Map 接口的常用实现类,而 TreeSet 是 Set 接口的常用实现类。虽然 HashMap 和 HashSet 实现的接口规范不同,但 TreeSet 底层是通过 TreeMap

2014-08-06 15:52:13 791

转载 程序员 学习攻略

月光博客6月12日发表了《写给新手程序员的一封信》,翻译自《An open letter to those who want to start programming》,我的朋友(他在本站的id是Mailper)告诉我,他希望在酷壳上看到一篇更具操作性的文章。因为他也是喜欢编程和技术的家伙,于是,我让他把他的一些学习Python和Web编程的一些点滴总结一下。于是他给我发来了一些他的心得和经历

2014-08-06 15:44:07 891

转载 无锁队列

关于无锁队列的实现,网上有很多文章,虽然本文可能和那些文章有所重复,但是我还是想以我自己的方式把这些文章中的重要的知识点串起来和大家讲一讲这个技术。下面开始正文。关于CAS等原子操作在开始说无锁队列之前,我们需要知道一个很重要的技术就是CAS操作——Compare & Set,或是 Compare & Swap,现在几乎所有的CPU指令都支持CAS的原子操作,X86

2014-08-06 15:37:20 642

转载 Java之观察者模式

《JAVA与模式》之观察者模式在阎宏博士的《JAVA与模式》一书中开头是这样描述观察者(Observer)模式的:  观察者模式是对象的行为模式,又叫发布-订阅(Publish/Subscribe)模式、模型-视图(Model/View)模式、源-监听器(Source/Listener)模式或从属者(Dependents)模式。  观察者模式定义了一种一对多的依赖关系,让多个观察者

2014-08-06 13:33:12 445

转载 高级议题:C++ 中的同步与互斥 (recursive_mutex,timed_mutex,recursive_timed_mutex, wait_until() , etc

线程类std::thread代表一个可执行线程,使用时必须包含头文件。std::thread可以和普通函数,匿名函数和仿函数(一个实现了operator()函数的类)一同使用。另外,它允许向线程函数传递任意数量的参数。1234567891011121314

2014-08-06 11:55:23 1734

转载 unoreder_map 内部实现

双数组哈希unordered_xxx简单的类层次结构以静态表unorered_set为例,工作原理见下图简单的效率测试Sample是本处讲述的双数组unordered_xxx,standard是编译器的unordered_xxx,boost1.50表示它的unordered_xxx测试环境:Win7 x64 Ultimate (Kernel 6.1.

2014-08-06 10:12:33 1661

转载 SQL各种连接详解

SQL连接(内连接,左连接,右连接,自连接)详解博客分类: SQLSQLOracle Sql代码  create table department( id number primary key, name varchar2(30));    create table employee(  id number primary key, 

2014-08-05 23:29:48 404

转载 ConcurrentHash Map 深入分析 (锁分离,提高效率,final key ,next域 保持线程安全)

Java多线程(三)之ConcurrentHashMap深入分析分类: Java2012-12-10 15:35 849人阅读 评论(0) 收藏 举报多线程目录(?)[+]一、Map体系Hashtable是JDK 5之前Map唯一线程安全的内置实现(Collections.synchronizedMap不算)。Hash

2014-08-05 21:40:40 1823

转载 实现细节,hash对key为 null的处理,对重哈希的处理

一、解HashMap源码解读1、HashMap的存储结构2、HashMap的初始化 3、元素Hash值获取及通过hash值找到talbe下标索引 4、元素添加方法addEntry 5、HashMap扩容 6、老table重新hash成新table 7、key为null,存到哪去了 8、查找元素get(Object key) 9、根据key删除元素 

2014-08-05 14:54:17 5523 1

变分法原版论文

变分法原版论文,需要理论依据可以从其中找到来龙去脉

2013-07-15

平移不变小波去噪程序演示

平移不变小波去噪程序演示 以平移不变小波为平台 所用是作者自己改进的bayesShrik算法

2011-04-10

清华版教材数据结构课件C描述

和清华版数据结构配套(严蔚敏主编) C语言描述非伪代码, 我们上课用的课件, 仅供参考和交流

2010-01-01

sas初级教程适合初学者易懂

sas初级教程,很适合初学者,尤其是对统计画图的讲解 而且很便宜,绝对物超所值

2009-08-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除