- 博客(10)
- 收藏
- 关注
原创 Top-N推荐算法-简介
Top-N是常用的一种直接向用户进行个性化信息推送的手段.很多网站精于此道, 比如豆瓣, 淘宝, Amazon.本质上说, Top-N就是collaborative filtering (CF)是一种根据用户已有的数据, 推测出用户喜好的手段.实现Top-N, 必须要有比较庞大的数据的支持, 比如, user base, user preferences.通常情况, 有两种类别的Top-N算法:1.
2008-10-15 11:19:00 12362 2
原创 GeoName的全文检索
GeoName(http://www.geonames.org/) 是一个开源的location->lan/lon的数据库.任何人都可以下载他们提供的数据(http://download.geonames.org/export/dump).官方也提供调用的各种接口. 也可以在线用一下看看效果. 利用这些数据, 我们可以很容易查找某个地名, 及其相关的信息(lan, lon...e.t.c..)
2008-10-14 14:10:00 2920
原创 Sphinx的一个应用实例
我把我blog的数据(中英文混合)导出, 作为数据来源, 来说明sphinx的使用.准备数据源导入数据:mysql -u root -p test 配置Sphinx配置data source:source blog{ type = mysql sql_host = localhost sql_us
2008-10-13 14:19:00 4792
原创 Slop One算法-Collaborative Filtering
一般情况下, 实施Collaborative Filtering的过程是:1. 你有一大群的用户.2. 你用一大堆的东西.3. 一些用户很热心的告诉你, 他们对这些东西的看法.4. 你想给他们更多他们可能喜欢的东西.Slope One是一种rating based的预测算法.Slope One 算法是由 Daniel Lemire 教授在 2005 年提出. 是一种简单的C.F.的算法, 但是确解
2008-10-11 10:10:00 1698
原创 Jquery Confirm插件
Inline confirm插件.爱尔兰的美女Nadia Alramli提供了一个插件, 可以不弹出窗口不使用浏览器的confirm不用该死的facebox.http://nadiana.com/jquery-confirm-plugin参数:options名称类型是否必选描述默认msgStringOptional确认消息Are you sure?stopAfterstringOptional
2008-10-10 17:20:00 5305 1
原创 Mako模板中的self和next
一句话:self执行第一个实现者, 一般是topmostnext沿着继承链向上连锁般的执行看来一句话说不清楚.回头再补.
2008-10-10 15:46:00 752
原创 解决Mod_wsgi模块的编译错误
在编译nginx的mod_wsgi模块时, 会碰到一个错误.cc1: warnings being treated as errors../mod_wsgi/src/ngx_http_wsgi_module.c: In function ‘ngx_http_wsgi_handler’:../mod_wsgi/src/ngx_http_wsgi_module.c:624: warni
2008-10-07 17:22:00 3117 1
原创 解决SVN的一个错误配置
check out的时候, SVN报错:svn: Not authorized to open root of edit operation 原因:svnserve.conf 文件里, 有个配置没设置好:[general]### These options control access to the repository for unauthenticated### and authenticat
2008-10-07 14:30:00 1356
原创 Sphinx Indexer的参数
不是纯粹的Sphinx,是CSFT的patch版本.--config 读取配置文件 (默认为 csft.conf)--all 重新index所有配置文件中描述的index项--quiet 只显示错误信息--noprogress 不显示进度 (输入不是tty时自动启用)--rotate 当索引结束时发送SIGHUP给searchd,使之自动rota
2008-10-01 20:32:00 2034
原创 Python下纯真IP库的乱码问题
网上有某位高人写的, 用python去读纯真IP库. 从库里读出的时候, 有写乱码的情况. 读出的编码是Gb2312的. 在上面作了一些修改, 主要是把gb2312转为utf-8:#! /usr/bin/env python# -*- coding: utf-8 -*-""" IPLocator: locate IP in the QQWry.dat. Usage: pytho
2008-10-01 17:17:00 2261
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人