基于
python
爬虫的图片信息检索与分析
刘雷
周玫
江西工业职业技术学院
【摘
要】
摘要:提出设计一种使用网络爬虫技术利用关键字检索网络图片信息
的检索系统,该系统主要是将网络上零散的数据信息,通过在线数据分析主要
包括探索性数据分析,将检索关键字将检索符合条件的图片信息保持到本地文
件夹中。
【期刊名称】
《数码世界》
【年
(
卷
),
期】
2019(000)012
【总页数】
1
一、研究背景
在日常生活中,我们在网络上检索图片信息,一般采用百度搜索、谷歌搜索、
360
搜索等等搜索引擎,但是在检索过程中,一般都会出现搜索引擎本身提供
的广告、推广等信息,为了使搜索内容简单、准确化,利用
python
爬虫技术,
开发了一款图片搜索功能程序,便于图片检索的精准化。
二、具体实现目标:
1.
数据抓取
利用爬虫技术,输入检索关键字,将网络上杂乱无章的初步数据进行整理,并
在尽量少的先验假定条件下进行数据分析,爬取优质网页数据,检索出筛选出
符合条件的最优质的图片资源信息。
2.
图片存储
将爬取回来的可能存在数据缺失、错误等情况,使用
pandas
包方法进行数据
的二次处理,最后直接用文件的形式存在本地文件夹中。