其他
lengyuhong
大学生,经历温州大学和浙江工业大学,现在淘宝数据平台实习,喜欢的领域:关联智能推荐,海量数据处理,搜索引擎
展开
-
dic文件
.dic是一种词典文件格式,Dic文件由若干单词单元组成,每一个单元包含了单词与解释信息,每个单词单元以单词开始,解释结束。相邻的两个单词单元之间没有间隔(这样使文件尽可能的小)。 打开方式:用16位或者32位文件编辑器打开这类文档 Windows操作系统的记事本(16位)可以打开,但是为乱码 一些词典软件(如金山词霸)可以打开 “开心字典”、“中文化精灵”、“Resource Modifier”等软件的“对照文本格式”支持这种.dic文件 560+等NP系列的专业词典的格式,只能在机原创 2010-11-12 15:53:00 · 7257 阅读 · 1 评论 -
查看文件编码格式
Windows中默认的文件编码格式是GBK(gb2312),而Linux一般都是UTF-8可以通过记事本的另存功能生成不同的编码文件Eclipse的Edit菜单中set Encoding可以方便查看对应的编码格式python中不同的编码判断示例:def encoding(as_string): ll_code = ['utf8', 'gbk'] for cc in ll_code: try: as_string.decode(cc) re原创 2010-11-12 15:59:00 · 9669 阅读 · 0 评论 -
揭秘全球最大网站Facebook背后的那些软件
转自http://www.jobbole.com/entry.php/73 这篇文章简单介绍了facebook所使用的一些软件,虽不深入但很全面。 2010年6月,Google公布全球Top 1000网站。Facebook独占鳌头。 以Facebook现在的经营规模,诸多传统服务器的技术均将崩溃或根本无法支撑。那么面对5亿的活跃用户,Facebook的工程师们又将如何让网站平稳运转呢?伯乐在线 - 职场博客的这篇文章将展示Facebook的工程师完成这个艰巨任务所用到的一系列软件。 Faceboo转载 2011-03-01 15:30:00 · 1373 阅读 · 0 评论