python信息检索搜索引擎_基于python爬虫的图片信息检索与分析

基于

python

爬虫的图片信息检索与分析

刘雷

周玫

江西工业职业技术学院

【摘

要】

摘要:提出设计一种使用网络爬虫技术利用关键字检索网络图片信息

的检索系统,该系统主要是将网络上零散的数据信息,通过在线数据分析主要

包括探索性数据分析,将检索关键字将检索符合条件的图片信息保持到本地文

件夹中。

【期刊名称】

《数码世界》

【年

(

),

期】

2019(000)012

【总页数】

1

一、研究背景

在日常生活中,我们在网络上检索图片信息,一般采用百度搜索、谷歌搜索、

360

搜索等等搜索引擎,但是在检索过程中,一般都会出现搜索引擎本身提供

的广告、推广等信息,为了使搜索内容简单、准确化,利用

python

爬虫技术,

开发了一款图片搜索功能程序,便于图片检索的精准化。

二、具体实现目标:

1.

数据抓取

利用爬虫技术,输入检索关键字,将网络上杂乱无章的初步数据进行整理,并

在尽量少的先验假定条件下进行数据分析,爬取优质网页数据,检索出筛选出

符合条件的最优质的图片资源信息。

2.

图片存储

将爬取回来的可能存在数据缺失、错误等情况,使用

pandas

包方法进行数据

的二次处理,最后直接用文件的形式存在本地文件夹中。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值