电骡服务器搜索文件排序,电骡搜中文名资源一定要注意的技巧及其他

该楼层疑似违规已被系统折叠 隐藏此楼查看此楼

转贴自电骡爱好者-内容有根据本人的认知作出的编辑及删减便于入门者理解,有误差高手请指正。======== 用真版电骡(非verycd做的假"驴")会发现搜索中文名,搜出的结果往往很少,这和搜索的原理有关。英文等字母语言一般是用空格隔开的一个个单词,而中文组成方式不像字母语言。所以那些我们熟知的网页搜索引擎(如google)在索引中文网页时,都需要对内容进行分词处理,中文分词技术属于自然语言处理技术范畴,是个非常复杂的研究领域,这已经不是emule(电骡)目前常用的edonkey2000(电驴)服务器端软件所能处理的。(为什么电骡会使用电驴服务器端的软件请自己补课了解电骡与电驴的历史和渊源)

一、电驴服务器搜索原理

电驴官方服务器端软件dServer因年代久远,且已没人用所以不讨论。

目前最常用的电驴服务器(eDonkey server)端软件是lugdunum eServer,它处理网友使用电骡(emule)客户端提交的搜索时分两种方式:关键词搜索和字符串搜索。

关键词搜索(keyword search):寻找文件名中有某单词的文件,比如搜一个单词“emule”,会查找该服务器记录的资源中、文件名里有用分隔符分割出独立单词“emule”的文件。

字符串搜索(substring search):准确说是子字符串匹配,将会对文件名进行扫描,找出所有文件名中包含了所给字符串的文件,而不在乎是否是一个独立的单词,后面将说明。

现在来看eServer处理搜索时规定的特殊符号:

分隔符:空格 . < > { } [ ] - _ 等英文输入状态下的特殊符号,他们都被电驴服务器当作关键词的分隔符进行处理,但是也有例外情况比如版本号,像"1.2.3",将会被视为一个完整的关键词。此外如果你需要强制搜索这些特殊字符则必须使用半角双引号""来进行转义。

起始符(开始符):^ 起始符表示文件名称的开始,比如搜索“^emule”,我们会得到所有以“emule”为文件名开头的文件,例如“emule0.50a.zip”,而不会得到“[soft]emule0.50a.zip”这样的文件。

通配符(万用字元):* 通配符用来代替任意个字符,可以是0个,1个或者多个,进行模糊的查找。要特别说明的是——电驴服务器不会在意*号的位置在开头或是结尾,例如用“*emule”或“emule*”来搜索,电驴服务器将会进行字符串搜索,扫描该服务器记录的文件名中包含有“emule”这5个字母组合的文件,例如“kemule.zip”,“emulek.zip”等。

二、搜索中文命名文件

现在我们知道了,如果我们搜索“阿凡提”,那么我们只能搜索到那些文件名中使用了分隔符把“阿凡提”三个字分割了的文件,比如:“[阿凡提.偷东西的驴].XviD.avi”这样的文件,我们无法找到文件名包含了例如“聪明的阿凡提”或是“阿凡提的故事”这样的文件。这就是为什么很多人认为eD2k搜索中文不好用的原因。

找到原因了解决办法就很简单,

1、多用几种常见的名称叫法来搜索,比如分别使用“阿凡提”,“聪明的阿凡提”,“阿凡提的故事”来搜索三次。如果你知道要搜索的资源的中文全名就搜索完整的中文名。如果是连续的资源,比如电视连续剧资源,如果共享者把集数和文件名连在了一个你光搜索电视剧名也是搜不出来的,必须加上可能的集数一起搜索,比如搜“快乐编剧班07”可以搜出链接,而搜索“快乐编剧班”就搜不到资源

2.可以让电驴服务器来进行一次字符串搜索,我们可以加上通配符,比如搜索 “*阿凡提” ,这时候,eServer就会开始逐个寻找那些文件名里包含了“阿凡提”三个字的文件。

此方法适合于所有使用了非单词组成的语言,中文,日文等命名的文件。

最后特别需要提醒的是进行字符串搜索会极大消耗电驴服务器的资源,而且会比进行关键词搜索慢很多,而且电驴服务器会在未完成搜索达到一定阈值的时候取消这次搜索,所以在可能的情况下,请尽量使用关键词搜索方式,而不要使用通配符,对于资源发布者来说,请尽量在文件命名用分隔符分开文件名的关键词,利于发布的资源加快传播速度。========以上方法是以服务器的搜索方式为例,用kad网络搜索资源上面的方法也可以试。不过今天在我编辑这段文字时(2013年2月17日),我用kad搜索“快乐编剧班01”…… “快乐编剧班20” 可以搜索出资源,但用服务器方式搜索一个也搜不出。服务器搜索在我这里基本上是废咯。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值