自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

D_yang的烂摊子

啥都干,啥都不精通.

  • 博客(10)
  • 收藏
  • 关注

原创 Top-N推荐算法-简介

Top-N是常用的一种直接向用户进行个性化信息推送的手段.很多网站精于此道, 比如豆瓣, 淘宝, Amazon.本质上说, Top-N就是collaborative filtering (CF)是一种根据用户已有的数据, 推测出用户喜好的手段.实现Top-N, 必须要有比较庞大的数据的支持, 比如, user base, user preferences.通常情况, 有两种类别的Top-N算法:1.

2008-10-15 11:19:00 12362 2

原创 GeoName的全文检索

GeoName(http://www.geonames.org/) 是一个开源的location->lan/lon的数据库.任何人都可以下载他们提供的数据(http://download.geonames.org/export/dump).官方也提供调用的各种接口. 也可以在线用一下看看效果. 利用这些数据, 我们可以很容易查找某个地名, 及其相关的信息(lan, lon...e.t.c..)

2008-10-14 14:10:00 2920

原创 Sphinx的一个应用实例

我把我blog的数据(中英文混合)导出, 作为数据来源, 来说明sphinx的使用.准备数据源导入数据:mysql -u root -p test 配置Sphinx配置data source:source blog{        type            =       mysql        sql_host        =       localhost        sql_us

2008-10-13 14:19:00 4792

原创 Slop One算法-Collaborative Filtering

一般情况下, 实施Collaborative Filtering的过程是:1. 你有一大群的用户.2. 你用一大堆的东西.3. 一些用户很热心的告诉你, 他们对这些东西的看法.4. 你想给他们更多他们可能喜欢的东西.Slope One是一种rating based的预测算法.Slope One 算法是由 Daniel Lemire 教授在 2005 年提出. 是一种简单的C.F.的算法, 但是确解

2008-10-11 10:10:00 1698

原创 Jquery Confirm插件

Inline confirm插件.爱尔兰的美女Nadia Alramli提供了一个插件, 可以不弹出窗口不使用浏览器的confirm不用该死的facebox.http://nadiana.com/jquery-confirm-plugin参数:options名称类型是否必选描述默认msgStringOptional确认消息Are you sure?stopAfterstringOptional

2008-10-10 17:20:00 5305 1

原创 Mako模板中的self和next

一句话:self执行第一个实现者, 一般是topmostnext沿着继承链向上连锁般的执行看来一句话说不清楚.回头再补.

2008-10-10 15:46:00 752

原创 解决Mod_wsgi模块的编译错误

在编译nginx的mod_wsgi模块时, 会碰到一个错误.cc1: warnings being treated as errors../mod_wsgi/src/ngx_http_wsgi_module.c: In function ‘ngx_http_wsgi_handler’:../mod_wsgi/src/ngx_http_wsgi_module.c:624: warni

2008-10-07 17:22:00 3117 1

原创 解决SVN的一个错误配置

check out的时候, SVN报错:svn: Not authorized to open root of edit operation 原因:svnserve.conf 文件里, 有个配置没设置好:[general]### These options control access to the repository for unauthenticated### and authenticat

2008-10-07 14:30:00 1356

原创 Sphinx Indexer的参数

不是纯粹的Sphinx,是CSFT的patch版本.--config 读取配置文件 (默认为 csft.conf)--all 重新index所有配置文件中描述的index项--quiet 只显示错误信息--noprogress 不显示进度 (输入不是tty时自动启用)--rotate 当索引结束时发送SIGHUP给searchd,使之自动rota

2008-10-01 20:32:00 2034

原创 Python下纯真IP库的乱码问题

网上有某位高人写的, 用python去读纯真IP库. 从库里读出的时候, 有写乱码的情况. 读出的编码是Gb2312的. 在上面作了一些修改, 主要是把gb2312转为utf-8:#! /usr/bin/env python# -*- coding: utf-8 -*-""" IPLocator: locate IP in the QQWry.dat.    Usage:        pytho

2008-10-01 17:17:00 2261

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除