- 博客(4)
- 资源 (1)
- 收藏
- 关注
转载 Python 中文分词工具 ——结巴分词的使用方法总结
结巴分词工具的安装及基本用法,昨天的博客中已经有所描述。今天要说的内容与实际应用更贴近——从文本中读取中文信息,利用结巴分词工具进行分词及词性标注。 示例代码如下:
2013-09-18 15:01:59 1090
转载 统计1的算法
这是一个很有意思的问题,也是在面试中最容易被问到的问题之一。这个问题有个正式的名字叫Hamming_weight,而且wikipedia上也提供了很好的位运算解决的方法,这个下面也会提到。 解决这个问题的第一想法是一位一位的观察,判断是否为1,是则计数器加一,否则跳到下一位,于是很容易有这样的程序。 ? 1 2 3 4 5 6 7 8 9 10
2013-09-05 14:44:56 403
转载 大型网站架构知识体系
关于架构的思索。 先来看一篇文章: 原文地址: http://www.blogjava.net/BlueDavy/archive/2008/09/03/226749.html 之前我简单向大家介绍了各个知名大型网站的架构,亿万用户网站MySpace的成功秘密、Flickr架构、YouTube网站架构、PlentyOfFish 网站架构学习、WikiPedia技术架构学习笔
2013-09-05 13:46:01 399
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人