自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

转载 Redhat环境下编译安装bazel

目前Google Bazel没有提供各个操作系统下的二进制安装包,只提供源代码,需要我们自己编译安装,详情可以见我翻译的中文版Google Bazel FAQ。Google Bazel官方安装文档在这里,里面只介绍了在Ubuntu(14.04,14.10)和Mac OS X下的编译安装。而我们公司的构建机器是Redhat Linux系列,在编译Bazel的时候遇到了很多问题,在这里跟大家分享下解决思

2016-10-11 11:30:02 2661

原创 已阅读C/C++书籍清单

C程序设计语言(美)Brian W. Kernighan、(美)Dennis M. Ritchie / 徐宝文、李志 / 机械工业出版社 / 2004-1-1 / 30.00元9.4 (3140人评价)纸质版 22.00 元起C专家编程Peter Van Der Linden / 徐波 / 人民邮电出版社 / 2008-2 / 4

2015-02-07 15:33:35 488

原创 已阅读python书籍清单

Python核心编程(第二版)[美]Wesley J. Chun(陳仲才) / CPUG / 人民邮电出版社 / 2008-06 / 89.07.7 (1043人评价)纸质版 65.70 元起Programming in Python 3 : A Complete Introduction to the Python Langua

2015-02-07 15:27:26 480

转载 字符串的多模式匹配

Cracking the coding interview--Q20.8March 5, 2013作者:Hawstein出处:http://hawstein.com/posts/20.8.html声明:本文采用以下协议进行授权: 自由转载-非商用-非衍生-保持署名|Creative Commons BY-NC-ND 3.0 ,转载请注明作者及出处。题目

2014-10-25 12:24:36 704

转载 从Trie树(字典树)谈到后缀树

从Trie树(字典树)谈到后缀树说明:本文基本上是“整理”性质,致谢文末的参考文献。 引言    常关注本blog的读者朋友想必看过此篇文章:从B树、B+树、B*树谈到R 树,这次,咱们来讲另外两种树:Tire树与后缀树。不过,在此之前,先来看两个问题。    第一个问题: 一个文本文件,大约有一万行,每行一个词,要求统计出其中最频繁出现的前10个词,请

2014-10-25 12:17:42 671

转载 数据结构之Trie树

1、 概述Trie树,又称字典树,单词查找树或者前缀树,是一种用于快速检索的多叉树结构,如英文字母的字典树是一个26叉树,数字的字典树是一个10叉树。Trie一词来自retrieve,发音为/tri:/ “tree”,也有人读为/traɪ/ “try”。Trie树可以利用字符串的公共前缀来节约存储空间。如下图所示,该trie树用10个节点保存了6个字符串tea,te

2014-10-25 11:54:14 499

原创 jieba分词之二、cut

1.get_DAG(sentence)函数DAG是有向无环图,结巴分词中的DAG的数据结构是dict,元素的key是int,value是int列表下面部分内容引用自http://www.xuebuyuan.com/1547637.html举一个例子,比如sentence 是 "国庆节我在研究结巴分词",对应生成的DAG是这样的:{0: [0, 1, 2], 1: [1],

2014-04-03 14:14:29 4234

原创 jieba分词之——1、initialize & load_userdictr

"结巴"中文分词是Python中文分词组件,作者从三个方面描述jieba中文分词的算法1.        基于Trie树结构实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG)2.        采用了动态规划查找最大概率路径, 找出基于词频的最大切分组合3.        对于未登录词,采用了基于汉字成词能力的HMM模型,使用了Viterbi算法 我

2014-04-03 14:10:50 7970

原创 四、控制结构和函数Control Structures and Functions

一、控制结构Control Structures1.条件分支 Conditional Branchingif boolean_expression1:   suite1elif boolean_expression2:   suite2...elif boolean_expressionN:   suiteNelse:   else_suite或者e

2014-03-11 16:46:03 882

原创 三、集合数据类型Collection Data Types

一、序列类型Sequence TypesPython提供了5中内置的序列类型,分别是bytearray, bytes, list, str, and tuple,其中前两者会在第7章文件处理时会用到,其他序列类型由标准库提供,例如collections.namedtuple。这一节主要介绍tuples, named tuples, and lists。1、元组Tuples与string

2014-03-05 15:57:46 1024

原创 二、Python Data Types

一、标示符和关键字Identifiers and KeywordsPython 有一个内置函数dir(),它用于返回一个对象的属性列表,该函数没有参数时返回Python的内置属性列表>>> dir()['__builtins__', '__doc__', '__name__']__builtins__属性是一个模块,存储了Python的内置属性,可以把它设置为dir函数的参数>

2014-02-27 09:54:16 625

原创 一、Python's "Beautiful Heart"

(1) Data Types数据类型两种基本的数据类型int(整型数据,python中int类型的大小只受限于机器内存的大小)和str(Unicode字符序列)str类型举例"Infinitely Demanding"'Simon Critchley''positively αβγ€÷©'''方括号[]是从序列中取出一项:>>> "Hard Times"[5]'

2014-02-25 14:56:13 634

原创 为何使用Python

软件质量,开发者效率,程序的可移植性,标准库的支持,组件集成和享受乐趣。其中,质量和效率这两条是人们选择Python的主要原因。

2014-02-24 14:32:08 471

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除