全文索引 干扰词文件及其相应的语言

 全文索引和查询概念  
  全文索引、查询和同步化最主要的设计要求是,在注册进行全文检索的所有表上都有一个唯一的全文键列(或者单列主键)。全文索引对使用的重要字及其所在位置进行跟踪。  
   
  例如,假定有一个对   DevTools   表的全文索引。全文索引可能指出在   Abstract   列的第   423   个和第   982   个单词处找到了单词   Microsoft,所在的行与   ProductID   6   关联。该索引结构支持对所有包含被索引单词的项进行有效检索,以及高级检索操作,如短语检索和邻近检索。  
   
  为防止全文索引因包含很多对检索没有帮助的词而变得臃肿,a、and、is   或   the   这类额外的词都忽略不计。例如,指定"the   products   ordered   during   these   summer   months"与指定"products   ordered   during   summer   months"是一样的。有这两个字符串的行都会被返回。  
   
  目录   /Mssql/Ftdata/Sqlserver/Config   下提供了多种语言的干扰词列表。在安装带有全文检索支持的   Microsoft®   SQL   Server™   时会创建这个目录,并同时安装干扰词文件。干扰词文件可以编辑。例如,高技术公司的系统管理员可以把单词   computer   添加到他们的干扰词表中去。(如果编辑干扰词文件,则必须在更改生效之前重新填充全文目录。)下表显示了干扰词文件及其相应的语言。  
   
  干扰词文件   语言    
  Noise.chs   简体中文    
  Noise.cht   繁体中文    
  Noise.dat   语言中性    
  Noise.deu   德语    
  Noise.eng   英语(英国)    
  Noise.enu   英语(美国)    
  Noise.esn   西班牙语    
  Noise.fra   法语    
  Noise.ita   意大利语    
  Noise.jpn   日语    
  Noise.kor   韩文    
  Noise.nld   荷兰语    
  Noise.sve   瑞典语    
   
   
  在处理全文查询时,检索引擎将满足检条件的行的键值返回给   Microsoft   SQL   Server。比如有一个   SciFi   表,其中   Book_No   列是主键列。  
   
  Book_No   Writer   Title    
  A025   Asimov   Foundation's   Edge    
  A027   Asimov   Foundation   and   Empire    
  C011   Clarke   Childhood's   End    
  V109   Verne   Mysterious   Island    
   
   
  假定想使用一个全文检索查询来查找包含单词   Foundation   的书名。在本例中,将从全文索引获得值   A025   和   A027。然后   SQL   Server   用这些键值和其它栏的信息响应该查询。  
   
  下表显示了存储全文索引数据所使用的语言。这些语言基于   SQL   Server   安装期间选择的   Unicode   排序规则区域设置标识符。  
   
  Unicode   排序规则区域设置标识符   全文数据存储所用的语言    
  中文注音符号(台湾)   繁体中文      
  汉语拼音     简体中文      
  中文笔画     简体中文      
  中文笔画(台湾)   繁体中文      
  荷兰语   荷兰语      
  英语(英国)   英语(英国)      
  法语   法语      
  通用   Unicode   英语(美国)      
  德语   德语      
  德文电话簿   德语      
  意大利语   意大利语      
  日语   日语      
  日语   Unicode   日语      
  韩文   韩文      
  韩文   Unicode   韩文      
  西班牙语(现代)   西班牙语      
  瑞典/芬兰语   瑞典语      
   
   
  此列表中没有的其它所有   Unicode   排序规则区域设置标识符值都映射到使用空格分隔单词的中性语言单词的断字符和词干分隔符。  
   
   
   
  说明     Unicode   排序规则区域设置标识符设置用于所有可进行全文索引的数据类型(如   char、nchar   等)。如果为   char、varchar   或   text   类型列的排序次序设置的语言类型,不是   Unicode   排序规则区域设置标识符语言,那么在对   char、varchar   和   text   类型的列进行全文索引和查询时,仍然使用   Unicode   排序规则区域设置标识符值。  
   


你按照他说的在C:/Program   Files/Microsoft   SQL   Server/MSSQL/FTDATA/SQLServer/Config/目录下自己生成一个noise.chs文件(建议复制一份 noise.eng,然后重新更名为noise.chs),然后情况里面的内容,保留一个字符就行。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值