曾经的往事

 
【专利名称】辅助翻译搜索引擎系统及其方法
【申请(专利)号】CN200510018660.3【专利申请日】2005-05-06
【公开(公告)号】CN1707476【公开(公告)日】2005-12-14
【主分类号】G06F17/30【分类号】G06F17/30;G06F17/28
【颁证日】0000-00-00【优先权】 
【申请(专利权)人】贺方升【地址】430070湖北省武汉市武汉理工大学马房山校区西院155信箱
【发明(设计)人】程 伟;陈智贤;贺方升;李银刚;孙上海;王沧洪;余 俊;朱柳嵩;朱前线【国际申请】 
【国际公布】 【进入国家日期】0000-00-00
【专利代理机构】武汉宇晨专利事务所【代理人】黄瑞棠
【摘要】
本 发明公开了一种辅助翻译搜索引擎系统及其方法;涉及一种互联网多语言互译系统及其方法;其步骤:①网络机器人自动抓取网页存入源信息库1;②利用网页索引 模块建立网页索引库2;③利用网页识别与预处理模块在网页索引库中找出单个网页或双语网页对,并进行网页预处理3;④进行分句匹配处理4;⑤存入双语预料 库5;⑥对匹配入库后的双语句对建立索引6;⑦响应用户请求,快速检索出相近的双语结果及其出处URL7;⑧在各种客户端显示相近的双语结果及其出处 URL8。本发明在于实现双语语料库积累的全自动化,应用于网络搜索翻译,用户检索时可以根据翻译的出处URL点击进入相应的翻译信息网页。
【主权项】
1、 一种辅助翻译搜索引擎系统,包括互联网(A)、服务器(B)、无线网络连接(C)、Internet网络连接(D)、移动通信设备客户端(E)、桌面电脑 客户端或浏览器(F)、移动用户(G)、电脑用户(H); 一路,与互联网(A)连通的服务器(B)、无线网络连接(C)、移动通信设备客户端(E)、移动用户(G)依次连通; 另一路,与互联网A连通的服务器(B)、Internet网络连接(D)、桌面电脑客户端或浏览器(F)、电脑用户(H)依次连通; 其特征在于: 所述的服务器(B)包括依次连通的翻译搜索引擎服务器(B1),数据库服务器(B2),检索服务器(B3); 其中翻译搜索引擎服务器(B1)包括网络机器人模块(B1.1)、网页索引模块(B1.2)网页识别和预处理模块(B1.3)、分句匹配模块 (B1.4); 其中数据库服务器(B2)包括源信息库(B2.1)、网页索引库(B2.2)、双语语料库(B2.3); 其中检索服务器B3包括索引模块(B3.1)、检索模块(B3.2)。 所述的网络机器人模块(B1.1),即一种将互联网上的网页信息抓取下来,录入到源信息库(B2.1)中的系统模块; 所述的网页索引模块(B1.2),即一种对保存在源信息库(B2.1)中的网页信息进行分析,建立有助于网页识别的索引,录入到网页索引库(B2.2)中 的系统模块; 所述的网页识别和预处理模块(B1.3),即一种从网页索引库(B2.2)中寻找含有双语信息的单个网页,或者寻找可能存在第二语言版本对照的纯第一语言 版本网页,通过网页索引条件找出最匹配的第二语言版本对照的网页,形成双语网页对,然后,对单个网页或双语网页对进行噪音净化过滤,除去网页中的无关信 息,提取可能存在双语翻译对照网页内容的系统模块; 所述的分句匹配模块(B1.4),即一种对网页识别和预处理模块(B1.3)提取的网页信息的内容,用分句匹配算法,分成对应的双语句对,连同URL和网 页标题一起录入到双语语料库(B2.3)中的系统模块; 所述的源信息库(B2.1),即一种存储从互联网上抓取网页信息的数据库; 所述的网页索引库(B2.2),即一种存储有助于网页识别与处理的索引及网页文本的数据库; 所述的双语语料库(B2.3),即一种存储可以提供辅助翻译的双语对照信息的数据库; 所述的索引模块(B3.1),即一种对匹配入库后的双语句对建立索引的系统模块; 所述的检索模块(B3.2),即一种用户通过各种客户端向服务器(B)提交想要翻译的语句,服务器(B)将它处理,将相近的中英文结果,以及网页地址返回 给客户端界面上的系统模块。
 
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值