- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 搜索引擎中用户行为特征分析
搜索引擎维护的两类信息: 网页相关信息(通过信息获取部分获取);用户行为信息(通过log记录获取) 传统IR技术:(information retrieval) 文档的向量空间模型 Tf*idf算法 ―――利用web信息本身的特点和用户行为信息补充 ―――分析网页通过超连接形成的有向
2004-12-31 16:23:00 2573
原创 自动分类在搜索引擎性能优化中的应用
自动分类:按照分类标准,将考察对象划分到各类别下自动聚类:按照被考察队形的内部特征,把相似、近似、特征相似的对象聚合到一起 信息查询方式: ――分类浏览:基于网站分类目录,浏览对象为网站――成本高,更新维护量大 ――关键词检索:检索对象为网页,信息量大,更新及时,不须人工干预――信息量大,质量难以保证 ====》提供对关键字检索结果集网页的分类浏
2004-12-31 16:17:00 2894 1
原创 java链接数据库的工具类
package spider.tools;import java.sql.*;public class DBTools { public static final int ORACLE = 0; public static final int SQLSERVER = 1; private static String oracleDriver = "oracle.jd
2004-12-09 15:21:00 1109
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人