- 博客(13)
- 收藏
- 关注
转载 Redhat环境下编译安装bazel
目前Google Bazel没有提供各个操作系统下的二进制安装包,只提供源代码,需要我们自己编译安装,详情可以见我翻译的中文版Google Bazel FAQ。Google Bazel官方安装文档在这里,里面只介绍了在Ubuntu(14.04,14.10)和Mac OS X下的编译安装。而我们公司的构建机器是Redhat Linux系列,在编译Bazel的时候遇到了很多问题,在这里跟大家分享下解决思
2016-10-11 11:30:02 2661
原创 已阅读C/C++书籍清单
C程序设计语言(美)Brian W. Kernighan、(美)Dennis M. Ritchie / 徐宝文、李志 / 机械工业出版社 / 2004-1-1 / 30.00元9.4 (3140人评价)纸质版 22.00 元起C专家编程Peter Van Der Linden / 徐波 / 人民邮电出版社 / 2008-2 / 4
2015-02-07 15:33:35 488
原创 已阅读python书籍清单
Python核心编程(第二版)[美]Wesley J. Chun(陳仲才) / CPUG / 人民邮电出版社 / 2008-06 / 89.07.7 (1043人评价)纸质版 65.70 元起Programming in Python 3 : A Complete Introduction to the Python Langua
2015-02-07 15:27:26 480
转载 字符串的多模式匹配
Cracking the coding interview--Q20.8March 5, 2013作者:Hawstein出处:http://hawstein.com/posts/20.8.html声明:本文采用以下协议进行授权: 自由转载-非商用-非衍生-保持署名|Creative Commons BY-NC-ND 3.0 ,转载请注明作者及出处。题目
2014-10-25 12:24:36 704
转载 从Trie树(字典树)谈到后缀树
从Trie树(字典树)谈到后缀树说明:本文基本上是“整理”性质,致谢文末的参考文献。 引言 常关注本blog的读者朋友想必看过此篇文章:从B树、B+树、B*树谈到R 树,这次,咱们来讲另外两种树:Tire树与后缀树。不过,在此之前,先来看两个问题。 第一个问题: 一个文本文件,大约有一万行,每行一个词,要求统计出其中最频繁出现的前10个词,请
2014-10-25 12:17:42 671
转载 数据结构之Trie树
1、 概述Trie树,又称字典树,单词查找树或者前缀树,是一种用于快速检索的多叉树结构,如英文字母的字典树是一个26叉树,数字的字典树是一个10叉树。Trie一词来自retrieve,发音为/tri:/ “tree”,也有人读为/traɪ/ “try”。Trie树可以利用字符串的公共前缀来节约存储空间。如下图所示,该trie树用10个节点保存了6个字符串tea,te
2014-10-25 11:54:14 499
原创 jieba分词之二、cut
1.get_DAG(sentence)函数DAG是有向无环图,结巴分词中的DAG的数据结构是dict,元素的key是int,value是int列表下面部分内容引用自http://www.xuebuyuan.com/1547637.html举一个例子,比如sentence 是 "国庆节我在研究结巴分词",对应生成的DAG是这样的:{0: [0, 1, 2], 1: [1],
2014-04-03 14:14:29 4234
原创 jieba分词之——1、initialize & load_userdictr
"结巴"中文分词是Python中文分词组件,作者从三个方面描述jieba中文分词的算法1. 基于Trie树结构实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG)2. 采用了动态规划查找最大概率路径, 找出基于词频的最大切分组合3. 对于未登录词,采用了基于汉字成词能力的HMM模型,使用了Viterbi算法 我
2014-04-03 14:10:50 7970
原创 四、控制结构和函数Control Structures and Functions
一、控制结构Control Structures1.条件分支 Conditional Branchingif boolean_expression1: suite1elif boolean_expression2: suite2...elif boolean_expressionN: suiteNelse: else_suite或者e
2014-03-11 16:46:03 882
原创 三、集合数据类型Collection Data Types
一、序列类型Sequence TypesPython提供了5中内置的序列类型,分别是bytearray, bytes, list, str, and tuple,其中前两者会在第7章文件处理时会用到,其他序列类型由标准库提供,例如collections.namedtuple。这一节主要介绍tuples, named tuples, and lists。1、元组Tuples与string
2014-03-05 15:57:46 1024
原创 二、Python Data Types
一、标示符和关键字Identifiers and KeywordsPython 有一个内置函数dir(),它用于返回一个对象的属性列表,该函数没有参数时返回Python的内置属性列表>>> dir()['__builtins__', '__doc__', '__name__']__builtins__属性是一个模块,存储了Python的内置属性,可以把它设置为dir函数的参数>
2014-02-27 09:54:16 625
原创 一、Python's "Beautiful Heart"
(1) Data Types数据类型两种基本的数据类型int(整型数据,python中int类型的大小只受限于机器内存的大小)和str(Unicode字符序列)str类型举例"Infinitely Demanding"'Simon Critchley''positively αβγ€÷©'''方括号[]是从序列中取出一项:>>> "Hard Times"[5]'
2014-02-25 14:56:13 634
原创 为何使用Python
软件质量,开发者效率,程序的可移植性,标准库的支持,组件集成和享受乐趣。其中,质量和效率这两条是人们选择Python的主要原因。
2014-02-24 14:32:08 471
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人