自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

ch的专栏

你必须非常努力,才能看起来毫不费力。。。

  • 博客(35)
  • 资源 (2)
  • 收藏
  • 关注

转载 hive中的外表EXTERNAL TABLE

本文转载自http://blog.csdn.net/cnweike/article/details/6928620在hive中,外表是个很重要的组成部分,通过外表可以很方便进行数据的共享。因为普通的表会将数据文件拷贝自己的目录下,这样想要分享数据只能保存多份数据。但是外表很好的解决了这个问题。CREATE EXTERNAL TABLE sunwg_test09(id I

2014-12-31 15:45:24 2012

原创 windows7下SecureCRT连接服务器失败

现在由于要在windows下使用SecureCRT连接服务器完成一些工作,但是在连接服务器时无响应,尝试了很多办法都没成功,最后在网络里面将网卡设置为桥接模式,又将网桥删除,竟然神奇的好了。好吧,现在也不太明白,先mark一下。

2014-12-30 21:08:48 3117

转载 [命令技巧]mkdir -p

本文转载自:http://www.dutor.net/index.php/2010/06/cmd-mkdir-p/上一篇[命令技巧]mkcd中,mkcd函数里面使用到了mkdir的-p选项。mkdir的-p选项允许你一次性创建多层次的目录,而不是一次只创建单独的目录。例如,我们要在当前目录创建目录Projects/a/src,使用命令1mkdir

2014-12-30 10:31:04 3731

转载 用中文把玩Google开源的Deep-Learning项目word2vec

本文转载自http://www.cnblogs.com/wowarsenal/p/3293586.htmlgoogle最近新开放出word2vec项目,该项目使用deep-learning技术将term表示为向量,由此计算term之间的相似度,对term聚类等,该项目也支持phrase的自动识别,以及与term等同的计算。word2vec项目首页:https://code.go

2014-12-24 20:18:27 1566

转载 从Hadoop框架与MapReduce模式中谈海量数据处理(含淘宝技术架构)

本文转载自http://blog.csdn.net/v_july_v/article/details/6704077从hadoop框架与MapReduce模式中谈海量数据处理前言    几周前,当我最初听到,以致后来初次接触Hadoop与MapReduce这两个东西,我便稍显兴奋,觉得它们很是神秘,而神秘的东西常能勾起我的兴趣,在看过介绍它们的文章或论文之后,觉得H

2014-12-24 20:14:04 719

转载 SecureCRT上传、下载文件(使用sz与rz命令)

本文转载自http://www.2cto.com/os/201401/269739.html1、简述借助securtCRT,使用linux命令sz可以很方便的将服务器上的文件下载到本地,使用rz命令则是把本地文件上传到服务器。2、理解记忆其中,对于sz和rz的理解与记忆我用了如下的方法(很多时候容易搞混):sz中的s意为send(发送),告诉客户端,我(

2014-12-24 15:46:13 875

转载 Hadoop集群(第9期)_MapReduce初级案例

本文转载自http://www.cnblogs.com/xia520pi/archive/2012/06/04/2534533.html1、数据去重   "数据去重"主要是为了掌握和利用并行化思想来对数据进行有意义的筛选。统计大数据集上的数据种类个数、从网站日志中计算访问地等这些看似庞杂的任务都会涉及数据去重。下面就进入这个实例的MapReduce程序设计。1.1 实例

2014-12-24 14:14:16 1737

转载 使用SecureCRT在远程主机和本地之间传输文件

本文转载自http://www.cnblogs.com/wangkongming/p/3474717.htmlSecureCRT与SshClient不同的就是,SecureCRT没有图形化的文件传输工具,不过也不影响,用命令来实现的话,其实会方便快捷很多。  第一种方式:  上传文件只需在shell终端仿真器中输入命令"rz",即可从弹出的对话框中选择本地磁盘上的文件,

2014-12-24 14:01:03 1111

转载 马尔科夫链

终于下定决心要了解一下马尔科夫链了。当然经典的那个tutorial必是参考文献,另外找了一个浙大教授写的PPT,很不错,用中文讲tutorial的东西理出来了。下面这篇文章写的也不错。http://googlechinablog.com/2006/04/blog-post_17.html转自上述地址的一篇文章数学之美 系列三 -- 隐含马尔可夫模型在语言处理中的应用2006年4

2014-12-17 21:31:13 1144

转载 现今的三大分词算法介绍

中文分词技术属于自然语言处理技术范畴,对于一句话,人可以通过自己的知识来明白哪些是词,哪些不是词,但如何让计算机也能理解?其处理过程就是分词算法。  现有的分词算法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。  1、基于字符串匹配的分词方法  这种方法又叫做机械分词方法,它是按照一定的策略将待分析的汉字串与一个“充分大的”机器词典中的词条进行配,若在

2014-12-17 20:51:12 4359

转载 NLTK读书笔记 — 分类与标注

本文转载自http://www.tuicool.com/articles/feAfi20. 本章所关注的问题(1) 什么是lexical categories,怎样将它们应用于NLP?(2) 什么样的python数据结构更适合存储词和它们的类别?(3) 我们怎样自动地给词做标注另外,本章还会包含NLP中一些基础的技术: sequence labeling ,  n-gr

2014-12-17 12:29:53 7410

转载 Python-NLTK环境搭建

本文转载自http://www.cnblogs.com/CheeseZH/archive/2012/11/05/2756098.htmlFor 32-bits windows:1.安装Python(我安装的是Python2.7,目录C:\Python27)可以到CSDN、OSChina、Sina Share等网站下载也可以到Python官网下载:http://w

2014-12-17 12:23:44 1058

转载 Python RE模块中search()和match()的区别

本文转载自http://blog.csdn.net/cnmilan/article/details/9071999match()函数只检测RE是不是在string的开始位置匹配,search()会扫描整个string查找匹配;也就是说match()只有在0位置匹配成功的话才有返回,如果不是开始位置匹配成功的话,match()就返回none。例如:

2014-12-17 10:35:00 3508

转载 Python的global语句

本文转载自http://www.cnblogs.com/cython/articles/2202287.htmlglobal语句如果你想要为一个定义在函数外的变量赋值,那么你就得告诉Python这个变量名不是局部的,而是 全局 的。我们使用global语句完成这一功能。没有global语句,是不可能为定义在函数外的变量赋值的。你可以使用定义在函数外的变量的值(假设在函数

2014-12-17 10:11:19 966

转载 双向链表的选择排序算法

本文转载自http://blog.csdn.net/zhipi/article/details/4425533前日遇到一个问题:对双向链表按关键字域进行排序。      在网上找了一下,都只一种算法,而且是对无头结点的双向链表的排序,对于指针的交换,分了8种情况,我觉得很烦。于是自己想了一下,写了个带头结点的双向链表的选择排序算法,指针的交换浓缩到4种情况,而且自认为选择排序函数中的结

2014-12-16 18:27:31 7473

转载 程序员编程艺术:第十章、如何给10^7个数据量的磁盘文件排序

本文转载自http://blog.csdn.net/v_july_v/article/details/6451990      第十章、如何给10^7个数据量的磁盘文件排序作者:July,yansha,5,编程艺术室。出处:http://blog.csdn.net/v_JULY_v 。 前奏    经过几天的痛苦沉思,最终决定,把原程序员

2014-12-15 17:07:32 751

转载 常用的16个c/c++面试题

1. C中static有什么作用  (1)隐藏。 当我们同时编译多个文件时,所有未加static前缀的全局变量和函数都具有全局可见性,故使用static在不同的文件中定义同名函数和同名变量,而不必担心命名冲突。  (2)static的第二个作用是保持变量内容的持久。存储在静态数据区的变量会在程序刚开始运行时就完成初始化,也是唯一的一次初始化。共有两种变量存储在静态存储区:全局变量和

2014-12-15 10:26:21 624

转载 c++中构造函数初始化的方法以及主要区别

一、我的问题是关于初始化C++类成员的。我见过许多这样的代码: CSomeClass::CSomeClass() { x=0; y=1; } 而在别的什么地方则写成下面的样子: CSomeClass::CSomeClass() : x(0), y(1) { } 我的一些程序员朋友说第二种方法比较好,但他们都不知道为什么

2014-12-15 09:22:56 874

转载 百度2015校园招聘技术类面试题及面经

本文为大家提供的是一份百度2015校园招聘技术类面试题及三面面经,感兴趣的同学参考下。百度(Nasdaq简称:BIDU)是全球最大的中文搜索引擎,2000年1月由李彦宏、徐勇两人创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式。“百度”二字源于中国宋朝词人辛弃疾的《青玉案·元夕》词句“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求。一面(1 hour):

2014-12-14 08:42:57 1372

转载 国外程序员推荐:每个程序员都应读的书

本文转载自http://blog.jobbole.com/5886/【更新】:近日(2012年8月17日)重看 StackOverflow 的原讨论帖,发现于今年年初被关闭了。不过有人做了汇总,把其他回复中提到的书籍,放在投票数最高的回复中。新更新添加 59 本书,详情可见文章后半部分。编者按:2008年8月4日,StackOverflow 网友 Bert F 发帖提问:哪

2014-12-13 17:46:01 696

原创 [Leetcode]Best Time to Buy and Sell Stock

Say you have an array for which the ith element is the price of a given stock on day i.If you were only permitted to complete at most one transaction (ie, buy one and sell one share of the stock),

2014-12-13 11:03:52 694

原创 [Leetcode]Search in Rotated Sorted Array II

Follow up for "Search in Rotated Sorted Array":What if duplicates are allowed?Would this affect the run-time complexity? How and why?Write a function to determine if a given target is in the

2014-12-13 10:23:37 533

原创 [Leetcode]Integer to Roman

Given an integer, convert it to a roman numeral.Input is guaranteed to be within the range from 1 to 3999.class Solution {public: string intToRoman(int num) { const int Integer[]

2014-12-10 23:20:56 641

原创 [Leetcode]Roman to Integer

Given a roman numeral, convert it to an integer.Input is guaranteed to be within the range from 1 to 3999.class Solution {public: inline int map(const char c) { switch(c)

2014-12-10 23:08:17 881

原创 成员函数的重载,覆盖与隐藏

对类层次的同名成员函数来说,有三种关系:重载(overload),覆盖(override)和隐藏(hide,oversee)。       1 成员函数的重载       只有在同一类定义中的同名成员函数才存在重载关系,主要特点是函数的参数类型和数目有所不同,但是不能出现函数参数的个数和类型均相同,仅仅依靠返回值类型不同来区分的函数,这和普通函数的重载是完全一致的。另外,重载和成员函数是否

2014-12-10 21:29:57 803 1

转载 Linux查看进程 ps aux指令详解

本文转载自http://blog.csdn.net/hanner_cheung/article/details/6081440linux上进程有5种状态:1. 运行(正在运行或在运行队列中等待)2. 中断(休眠中, 受阻, 在等待某个条件的形成或接受到信号)3. 不可中断(收到信号不唤醒和不可运行, 进程必须等待直到有中断发生)4. 僵死(进程已终止, 但进程描述符存在,

2014-12-10 18:06:26 1395

转载 网络爬虫工作原理分析

网络爬虫工作原理  1、聚焦爬虫工作原理及关键技术概述  网络爬虫是一个自动提取网页的程序,它为搜索引擎从Internet网上下载网页,是搜索引擎的重要组成。传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。聚焦爬虫的工作流程较为复杂,需要根据一定的网页分析算法过滤与主题无关的链接,保留

2014-12-08 21:30:43 10797

转载 SQL范式

本文转载自 http://blog.163.com/clevertanglei900@126/blog/static/111352259201131133326275/范式(Normal Form)范式是符合某一种级别的关系模式的集合。关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同的范式。定义:如果一个关系模式R的所有属性都是不可分的基本数据项,则称关系

2014-12-08 21:24:29 1120

转载 pdb命令使用说明 python

本文转载自 http://blog.csdn.net/tianzhu123/article/details/7279451当手边没有IDE,面对着python调试犯愁时,你就可以参考下本文;(pdb 命令调试)参考:http://docs.python.org/library/pdb.html和 (pdb)help用pdb进行python调试,用法基本和gdb差不多,先看一

2014-12-04 19:07:06 1905

转载 vim tab键默认4空格

本文转载自 http://my.oschina.net/renwofei423/blog/17338     为了vim更好的支持python写代码,修改tab默认4个空格有两种设置方法:1. vim /etc/vimrc 12setts=4 setsw=4

2014-12-04 18:39:55 1657

转载 python程序的调试方法

【转自:http://blog.csdn.net/luckeryin/article/details/4477233】本文讨论在没有方便的IDE工具可用的情况下,使用pdb调试python程序源码例子例如,有模拟税收计算的程序:#!/usr/bin/python def debug_demo(val):                 if val           

2014-12-04 18:24:12 560

原创 面试常考察的排序(快速排序,归并排序,堆排序)

面试最经常考察的排序应该就是 快速排序,归并排序和堆排序了。例如题目:10万个数字中找最大的10个数。 1,因为10万个数可以放到内存中,首先可以考虑使用快排的 Partition 函数解决这个问题。      若Partition 函数得到 index 值为 99990,则从下标 99990 到下标 99999 的10个数字就是最大的 10 个数。      时间复杂度为 O(n

2014-12-03 17:20:33 1597

转载 Linux模拟试题及答案(全)

本文转载自http://www.ha97.com/870.html一.填空题:1. 在Linux系统中,以 文件 方式访问设备 。2. Linux内核引导时,从文件 /etc/fstab 中读取要加载的文件系统。3. Linux文件系统中每个文件用 i节点 来标识。4. 全部磁盘块由四个部分组成,分别为引导块 、专用块 、 i节点表块 和数据

2014-12-02 19:50:55 11847

转载 linux下多线程的创建与等待详解

本文转载自http://blog.chinaunix.net/uid-23842323-id-2656572.html所有线程都有一个线程号,也就是Thread ID。其类型为pthread_t。通过调用pthread_self()函数可以获得自身的线程号。下面说一下如何创建一个线程。通过创建线程,线程将会执行一个线程函数,该线程格式必须按照下面来声明:void * Thr

2014-12-02 18:10:08 472

原创 [九度oj]题目1362:左旋转字符串(Move!Move!!Move!!!)

题目描述:汇编语言中有一种移位指令叫做循环左移(ROL),现在有个简单的任务,就是用字符串模拟这个指令的运算结果。对于一个给定的字符序列S,请你把其循环左移K位后的序列输出。例如,字符序列S=”abcXYZdef”,要求输出循环左移3位后的结果,即“XYZdefabc”。是不是很简单?OK,搞定它!输入:多组测试数据,每个测试数据包含一个字符序列S和非负整数K。其中S的长度不超过1000。

2014-12-01 11:58:50 634

算法导论答案 很全的版本

算法导论第二版答案,非常全的版本,包括英文版答案,作业答案word版

2014-03-11

数据库系统实现 中文第二版pdf 非扫描版

数据库系统实现 中文版第二版pdf 非扫描版

2014-03-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除