搜索引擎开发日志

这两天一直在构思关于图片搜索的的实现,在目前蜘蛛的基础上增加图片抓取和Flash抓取的功能,这样就可以实现图片搜索和Flash搜索功能。对于图片的抓取已经实现,而对Flash的实现相对来说是比较麻烦一些,不过也不是太难。对这些对象我都是以二进制对象的形式存储到数据库中去了,目前采用的是中国知网的KBase系统,通过简单的功能性测试已经通过了,由于图片数据都可能比网面数据大,因则我在蜘蛛里抓取时采用了断点续抓功能,如果网络超时则可从断点处重试。下一步的目标有两个:

1、将这些图片信息与它的容器网页关联起来,这样通过查网页就可以查到图片了。

2、对于图片搜索需要自己写一个Web服务器,响应请求图片的HTTP请求,将其从数据库中读取出来通过Socket发送给请求端。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值