![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 67
stones4zd
开博目的是为了积累知识,坚持学习…
展开
-
Python学习笔记17:玩转千图成像
千图成像,顾名思义,就是用上千张上万张图片合成一张超大的图。今天,我用python来玩玩~准备素材图 pic.jpg 。大小随意,不建议太大,否则算的时间太长。这图片是 800*450。首先得准备多张图片。第一步:抓取百度图片我的这篇文章详细说明了爬取百度图片的一些思路。https://blog.csdn.net/weixin_42703239/article/details/111888324这里直接上代码。getBaiduImg.py该文件的目的是,抓取百度搜原创 2021-01-29 23:30:21 · 1407 阅读 · 18 评论 -
Python学习笔记16:爬取百度搜索图片的缩略图
找图,通过百度之类的搜索引擎最方便。如何爬取百度搜索的图片,也是一个有意思的话题。进入百度图片,随便输入搜索内容,比如“美女”。打开 F12 ,查看 network ,选择 XHR,查看 AJAX 加载项。会发现,有一个JSON 文件。随着页面向下滚动,JSON 会依次加载。说明,这个 JSON 就是跟图片内容有关的JSON。分析 JSON 路径:https://image.baidu.com/search/acjson?tn=resultjson_com&logid=824.原创 2020-12-29 12:20:53 · 838 阅读 · 6 评论 -
Python学习笔记15:URL中的中文编码转换
在做爬虫的时候,有时候需要爬写中文的内容。但是中文字符在某些场合下会转为 %xx 形式的 URL 字符。比如:%E7%BE%8E%E5%A5%B3以上编码表示“美女”。Python3 的urllib 库,就可以对中文进行 URL编码和解码。import urllib.parsecn = input("请输入中文:")bfb = urllib.parse.quote(cn) # 转为 url 编码print( bfb )print( urllib.parse.unquo.原创 2020-12-26 22:54:28 · 1272 阅读 · 3 评论 -
Python学习笔记14:爬取51job数据,并写入excel中
因为工作需要,有时候需要了解行业公司的岗位信息和要求。以往都是通过人工查找的方式,去选取部分公司,并复制粘贴到 excel 中,作为一些材料的参考。了解了 Python 后,这项工作肯定要让 Python 来做了。本着“从小到大”编写程序功能的思路,我写了3个模块:1、excel 操作模块:负责创建 excel 文档,以及把数据写入 excel 文档2、单页面获取数据模块:负责获取页面中岗位名称,薪资,就业信息等数据,并返回数据 list3、综合模块:遍历搜索的结果页,获取页码的网址原创 2020-08-13 13:12:09 · 1152 阅读 · 0 评论 -
Python学习笔记13:随机获取 list 里的元素
需要导入随机模块 randomimport random一般来说三种思路随机获取 list 里的元素:random.randint(a,b) 随机生成(a,b)之间的一个整数,包含a和b的值。 random.choice( xList )可以从任何序列,比如 list 列表中,选取一个随机的元素返回,可以用于字符串、列表、元组等。 random.sample()可以从指定的序列中,随机的截取指定长度的片段,不作原地修改。所得的结果也是一个 list。方式一:xList = ["哈哈原创 2020-08-04 11:37:32 · 3369 阅读 · 0 评论 -
Python学习笔记12:Python批量重命名文件
今天小白同学找到我,想批量把“一堆”jsp文件重命名为“html”后缀的文件。他说,一个一个的改太累了,文件有好几十个。我直接回到,肯定python啊。话不多说,直接操作。为了做好演示,我用 txt 文件为例,放到了一个 houzhui 的文件夹中。为了模拟真实情形,我还放了几个文件夹在里面。目标:把这两个 txt 文件,直接修改后缀为 html 。思路:1. 把操作的当前目录修改到 houzhui 文件夹下2. 罗列当前文件夹的内容3. 循环判断,是路径就跳过;是文原创 2020-07-26 00:28:10 · 449 阅读 · 2 评论 -
Python学习笔记11-利用python整理 txt 文档
好久没用 python 了。返校后,忙的飞,就差再长几只手了。今天小白同学找到我,问我问题,还给我看了下她的笔记文档。笔记就是网上复制的文字,粘贴到记事本后,格式有点乱。如下代码所示。1以下关于HTML5的描述正确的是()。(2.0分) A、HTML5不适合W3C标准 B、HTML5只是在原来的基础上规范了标准,没有新增内容。 C、XHTML不属于HTML5的发展史中的版本 D、HTML5不需要安装任何插件就可以直接使用网页播放视频我的答案:D2下面代码的运原创 2020-05-28 17:24:57 · 2383 阅读 · 0 评论 -
Python学习笔记10-爬虫中利用正则表达式分析出页面中想要的数据
一、网页HTML结构在网上爬取了一个网页,如何在网页中找到自己想要的内容?比如,想找到图片链接。网页中图片列表的结构如下:<div class="c s_li zxgx_list l"> <ul> <li> <a target="_blank" hr...原创 2020-03-05 21:37:05 · 1251 阅读 · 0 评论 -
Python学习笔记9-爬花瓣网指定图片,从此找图不用愁
花瓣网,是国内著名的图片阅览网。有很多极具设计想法的图片,设计师可以在这里查找灵感。今天,就来做一个爬虫,爬指定的图片。第一步,分析花瓣网的AJAX进入花瓣网,是个搜索框。输入一个“网页设计”,进入搜索结果页面。往下拉动,图片还会自动增加,很明显这个是AJAX的结果。F12,查看 network,分析下载的文件。主要分析 XHR(就是 XMLHttpRequest,AJ...原创 2020-02-28 23:44:21 · 1888 阅读 · 0 评论 -
Python学习笔记8-利用qrcode模块生成普通二维码和带图标的二维码
二维码又称二维条码,常见的二维码为QR Code,QR全称Quick Response,是一个近几年来移动设备上超流行的一种编码方式,它比传统的Bar Code条形码能存更多的信息,也能表示更多的数据类型。github 上的官网:https://github.com/lincolnloop/python-qrcode#advanced-usage一、qrcode模块安装导入CMD ...原创 2020-02-16 21:51:19 · 3270 阅读 · 2 评论 -
python学习笔记7-Python目录创建,删除和遍历
目录和文件的操作,需要引入 os 模块:import os一、创建目录目录 directory ,简写 dir ,简单来说就是文件夹。 使用 os.mkdir( ) 函数创建目录(创建一级目录)。 使用 os.makedirs()函数创建多级目录(目录下面还有目录)。 原型如下所示:os.mkdir( path ) # mk 就是 makeos....原创 2020-02-08 22:10:26 · 498 阅读 · 3 评论 -
python学习笔记6-Python内置函数 eval
今天继续学习 Python,做一个小案例的时候,用到了 eval 函数,挺有意思的,记录下来。eval 功能简单来说就是:把字符串转为Python语句并执行。语法:eval( string [, globals[, locals] ] )参数:string:一个Python表达式 或 函数 compile() 返回的代码对象,字符串。globals:可选。必须是dic...原创 2020-02-01 18:46:26 · 475 阅读 · 1 评论 -
python学习笔记5-利用多线程爬取一系列网页的相关图片
在python学习笔记4-爬取一系列网页的相关图片中,我用 requests+BS4 爬取了一个系列网页的图片。但是,效率太低。究其原因是,图片是一张一张下载的,一张下载完毕后,才能下载下一张。能不能同时下载多张呢?答案是肯定的,利用 python 中的线程就可以做到同时下载多张图片,提高下载效率。首先,导入相关的模块,其中的 threading 就是 python 线程模块。...原创 2019-12-23 20:06:05 · 311 阅读 · 1 评论 -
python学习笔记4-爬取一系列网页的相关图片
在上一篇python学习笔记3-爬取指定网页的图片文章中,我提到了用 python 爬取一个页面的所有图片。但是,万一一篇文字的内容被分页了,如何把这一系列的图片都爬完呢?分页就是个拦路虎啊~~ T.0一、要精准找到对应的图片 和 分页,我们首先要分析页面的结构1. 不是页面中所有的图片都需要的,我们只想要主体内容的图片。打开浏览器 F12 ,可以看到,图片都是放在...原创 2019-12-19 16:49:12 · 441 阅读 · 1 评论 -
python学习笔记3-爬取指定网页的图片
在上一篇学习笔记中,python学习笔记2-下载网络图片,简单记下了已知网络图片地址,下载图片的过程。但是,一个网页里图片很多,怎么让python自动解析地址,再挨个下载图片呢?这篇算是上篇的一个继续。要使用本代码,要安装 3个模块:requests、BeautifulSoup(这个要安装 BeautifulSoup4,简写为bs4,否则是老版本)、lxml。安装方法:...原创 2019-12-17 01:30:20 · 1453 阅读 · 2 评论 -
python学习笔记2-下载网络图片
最近对爬虫很感兴趣,忒别是爬图片。哈哈~写了个练习,爬指定网络地址的图片。# -*- coding:utf-8 -*-import osimport requests#urls = [ "http://www.cqie.edu.cn//templates/site/images/top_logo.png", "http://www.cqie.edu.cn/upf...原创 2019-12-12 01:15:04 · 373 阅读 · 3 评论 -
ptyhon3的whl文件离线安装
安装python3插件,有时候觉在线安装得太慢了,干脆下whl文件,离线装。方便。一、先下载whl文件可以在这个网址下载 whl 文件:https://www.lfd.uci.edu/~gohlke/pythonlibs/下载前,要确定好python的版本和系统位数。在cmd中输入:pyhon就可以查看对应python的版本号。如下图所示:二、复制文件到 pyt...原创 2018-09-09 10:48:17 · 11287 阅读 · 0 评论 -
python学习笔记2-数值类型
Python中的数值类型包括int、float和complex三种类型。intPython中的int类型是无限精度的。默认是十进制的,也可以使用其他进制,比如二进制,八进制和十六进制。二进制以 0b 开头,如 0b110 , 十进制的 6八进制以 0o 开头,如 0o11 , 十进制的 9十六进制以 0x 开头,如 0xff ,十进制的 255floatPython...转载 2018-08-07 00:03:31 · 292 阅读 · 0 评论 -
python学习笔记1-数学函数math
看书看到浮点数部分。里面用到了math.ceil()。一看就知道是向上取整,在pycharm里运行却报错了 File "E:/my_works/python/ch01/1-4.py", line 10, in <module> print( math.floor(b) )NameError: name 'math' is not defined“math”没有定义?...原创 2018-08-06 23:14:50 · 2059 阅读 · 0 评论