自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 资源 (3)
  • 论坛 (1)
  • 收藏
  • 关注

原创 Python处理中文

用Python写了个从一堆中文微博中抽取电影票房数据的程序,处理中文编码问题非常麻烦,有以下经验: 1,在正则表达式中的中文应该用\uXXXX的形式,正则表达式字符串还要以ur为前缀(u表示unicode,r表示raw,即忽略C++形式的转义字符)。 2,各种编码都统一成UTF8的时候世界终于清静了 4,源码开头要加这样几行: # coding=utf8 import sys reload

2014-12-14 17:50:00 625

Programming Collective Intelligence 集体智慧编程 英文

本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过滤)、用决策树技术实现预测和决策建模功能、社交网络的信息匹配技术、机器学习和人工智能应用等。

2009-03-23

算法导论教学手册(英文,含部分习题答案)

算法导论第二版的教师手册。其中有教学指导还有习题答案(那些有一点难度的习题的答案)

2008-11-24

Lock-free数据结构

lock-free(不使用锁)进行数据访问的同步互斥.优点是避免死锁。

2008-09-27

我这样的读《the c++ programming language》会不会有困难

发表于 2002-11-05 最后回复 2002-11-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除