网站开发
文章平均质量分 71
idea888
这个作者很懒,什么都没留下…
展开
-
DIV层的透明度设置!
---------------------------------------------------------设置属性:FILTER:alpha(opacity=20);--------------------------------------------------------原创 2006-09-14 21:09:00 · 4799 阅读 · 2 评论 -
全文检索核心:几款免费中文分词模块介绍
一、什么是中文分词 众所周知,英文是以词为单位的,词和词之间是靠空格隔开,而中文是以字为单位,句子中所有的字连起来才能描述一个意思。例如,英文句子“I am a student”,用中文则为:“我是一个学生”。计算机可以很简单通过空格知道“student”是一个单词,但是不能很容易明白「学」、「生」两个字合起来才表示一个词。把中文的汉字序列切分成有意义的词,就是中文分词,有些人也称原创 2006-10-22 00:56:00 · 3314 阅读 · 0 评论 -
站内搜索案例:新闻出版行业
一、项目背景 天津日报报业集团是国内最大的报业集团之一,目前主办的有天津日报、每日新报、名师家教、球迷报、假日100天、采风报等多份报纸。为了更好的为读者服务,方便读者的信息查找,提高资源的使用价值,提升报社网站本身的形象,报社希望能提供历年报纸的全文检索。 报社电子数据状况。目前报社从1998年10月开始,一直到最新的报纸新闻的电子版本,总共有近五十万条记录。存在的主要问题:原创 2006-10-22 01:52:00 · 2636 阅读 · 0 评论 -
全文信息检索介绍及算法分析
一、摘要 本文主要介绍了全文信息检索的概念、应用领域、算法分类、技术难点和算法比较。及一款实现全文检索的数据结构和算法。 二、什么是全文数据库和全文信息检索 保存在数据库中的记录数据,从类型上可以分为两种。其一是结构化数据,象字符、日期、数值、货币等,这些数据都是具有有限长度或固定格式的数据;其二是非结构化数据,也叫全文数据,象简历、简介、论文等,这些数据都是以不定长、非固定格式保存的字符原创 2006-10-22 01:50:00 · 3555 阅读 · 0 评论 -
站内搜索案例:提高商品成交率,创造卓越业绩
严格的产品评测 2004年5月,卓越网在获得巨额注资后开始进行大规模的网站改版,准备对现有商品进行大幅增加,预期加至百万级的商品数量。为了适应商品数量的增加,满足用户对检索的要求,提升用户购物体验,促进商品销售,卓越网开始对国内主要检索软件进行全面考察。 卓越网作为国内电子商务,特别是B2C的龙头企业,其形象十分重要。因此在网站检索平台的选型上挑选近10家国内各种检索软件进行综合测试原创 2006-10-22 01:48:00 · 2653 阅读 · 0 评论 -
为什么我们需要站内搜索?
过去的站内搜索,通常是简单的将信息发布的标题、关键字甚至内容进行匹配,通常带分词功能的不多,因为它是一个技术点。 对于有比较多字段的产品发布,对应的搜索不仅有标题,还有型号规格、价格、简介等内容的搜索,这个称为“高级搜索”。 这些以like %%为基础的搜索,在应付更加深入的数据挖掘时,开始露出它的不足: 1、不够智能 比如关键词是“收集”和“收藏”,从字面上原创 2006-10-22 01:30:00 · 2864 阅读 · 0 评论 -
认真思考评估站内全文搜索方案
对于网站的站内全文检索功能,从前我的做法基本上是实行自动摘录一定长度的文体,然后根本这一个域使用like方式实现全文搜索。也由于这种搜索不是经常需要的,所以也不太舍得为之花太大的资源,无论是处理什么站点,都不希望从界面上一开始就诱导用户使用全文检索;而倾向于作为高级选项,甚至是有一定权限的用户才允许使用全文搜索。这种方式不太难实现,而且站内查询量都不太大,只要关键词不是选得太弱智,基本上原创 2006-10-22 01:27:00 · 2581 阅读 · 0 评论 -
解析搜索引擎检索式的构建
1、关键词 关键词是描述搜索内容的关键性词语。网络搜索中的关键词是一个广义的概念,属于非受控自由词,凡是具有实际意义的表达及其书写形式,如字、词、词组、短语和字母、数字、符号、公式等,都可以用作搜索关键词。 网络搜索,实际上是在搜索引擎的索引数据库中进行匹配检索。搜索引擎并不对其数据库进行可控语言标引,而只是机械地输出与关键词形式匹配的网页,随着数据库规模的不断增长,符合形式匹配条件原创 2006-10-22 01:06:00 · 4702 阅读 · 0 评论 -
全文检索系统概述
1、全文检索系统的基本内容 全文检索系统是指可以对资料源的全部文本内容进行检索的系统。这涉及到资料源文本内容的提取和建索引、检索条件分析、索引匹配、匹配结果排序输出四个步骤,其中的难点在于保证检索结果的相关性,即系统查出来的条目确实符合查询条件的意思。很显然,正确理解用户输入的检索条件是前提条件,而“理解”依次要经历词法、语法和语义分析三个阶段。 词法分析是为了从连续的输入串中分辨出基原创 2006-10-22 01:04:00 · 3782 阅读 · 0 评论 -
搜索引擎翻页导航条页码计算方法
翻页式样式如下。每次显示10个页码,并提供"前十"、"后十"翻页。[1] 2 3 4 5 6 7 8 9 10 下十页 末页1 2 3 4 5 6 [7] 8 9 10 下十页 末页1 2 3 4 5 6 7 8 9 [10] 下十页 末页首页 前十页 [11] 12 13 14 15 16 17 18 19 20 下十页 末页首页 前十页 11 12 13 14 15 [16] 17 18原创 2006-10-22 01:02:00 · 2860 阅读 · 0 评论 -
站在巨人的肩膀上,建立自己的站内搜索引擎
若想在某特定网站内搜索特定的内容(如搜索www.mysoo.com.cn中包含关键字“站内搜索”的内容),只需要在Google的搜索栏里输入:“站内搜索 site:mysoo.com.cn”即可(不含引号)。如果直接在自己站点的网页上建立一个Google的搜索栏,然后让访问者按Google规定的格式进行查询,那不就能实现Google作为自己站内搜索引擎的功能了吗?但是我们当然不能要求使用者还要原创 2006-10-22 01:43:00 · 2507 阅读 · 0 评论