轻便爬虫+OCR 第一部分

这篇博客记录了作者使用Python3编写的第一款爬虫工具,包括GUI界面设计(Tkinter)、网页抓取、图片下载和OCR文字识别。通过详细步骤介绍如何配置环境、安装所需库,并展示如何设计主窗口、按钮、文本框等功能。
摘要由CSDN通过智能技术生成

人生的第一个爬虫(python3)

前言

本篇blog用于记录本小白利用python写的第一个小工具。用时一天多一些,此外本人还处于不断学习中,该blog是本人的见解与笔记,会有许多纰漏与不足,望大牛指点。本篇论文较为基础,将会细致讲述从0到完成的每一步骤(本人用得少,到时候依靠笔记才能重新捡起来)。
该爬虫有三个功能:爬取源码、爬图与图片文字识别。

主体界面:
爬虫界面

爬取图片:
在这里插入图片描述

识别图像中文字(配合Snipaste):
在这里插入图片描述

第一步:环境、库的配置

该工具涉及到了GUI界面设计(tkinter)、网址请求(requests)、下载(urllib.request)、图片截取(PIL)、字符串匹配(re)等。
库的安装,我所了解的有两种主要的方法。

一、pycharm中setting添加库

file–setting–project interpret–install
在这里插入图片描述

二、cmd安装

移步至解释器根目录下,找到Scripts文件夹,双击后在文件目录输入框内输入cmd,能够快速打开cmd并且快速进入该文件夹。pip install (库名字)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值