Python3
心淚
这个作者很懒,什么都没留下…
展开
-
Python笔记 (七)--根据模板文档批量修改生成docx文件(全年工作日)
运行环境需要先安装requests、docx库源代码# -*- coding: utf-8 -*-import osimport jsonimport timeimport requestsfrom docx import Documentdef Data_Loading(): #遍历当前目录下,以docx为后缀的文件 for parent, dirnames...原创 2020-01-06 09:23:16 · 544 阅读 · 0 评论 -
Python+selenium(番外篇)--浏览器(Chrome、Firefox)驱动下载地址
一,ChromeChrome浏览器驱动下载地址:http://chromedriver.storage.googleapis.com/index.html二、FirefoxFirefox浏览器驱动下载地址:https://github.com/mozilla/geckodriver/releases/tag/v0.26.0...原创 2019-11-03 17:28:31 · 661 阅读 · 0 评论 -
Python笔记(二)--Python3.7通过selenium和geckodriver实现问卷星自动填写提交
Python笔记(二)–Python3.7通过selenium和geckodriver实现问卷星自动填写提交仅供研究,请勿滥用利用python的selenium自动化模块pip install selenium火狐浏览器的xPath Finder插件下载火狐浏览器对应版本的驱动geckodriver(这里可以也选择chrome,ie等浏览器,不过要下载对应版本的chromedr...原创 2019-04-03 23:20:06 · 2094 阅读 · 5 评论 -
Python笔记(三)--socket实现端口扫描(多线程版)
Python笔记(三)–socket实现端口扫描(多线程版)原创 2019-04-05 17:44:29 · 2027 阅读 · 0 评论 -
Python笔记(四)--Python3.7实现智能识别图片文字
Python笔记(四)–Python3.7识别图片中的文字之前,学习编写问卷星自动填写脚本的时候,定位得到的xpath参数无法复制,所以我寻思能不能直接截图把参数识别出来在这里总结出两个办法,一个是利用Tesseract和pytesseract模块,另一个则是利用百度AI开放平台进行识别。经过测试,前者的识别率不高,后者的识别率还是挺不错的。而且提供50000次/天免费,所以拿来玩玩挺不错...原创 2019-04-07 14:34:08 · 4045 阅读 · 0 评论 -
Python笔记(一)--socket实现端口扫描
Python3.7实现端口扫描器自学Python没多久的小萌新一枚,由于没有经过系统学习的我,所以注释中有什么不妥,欢迎在评论区指出直接放代码因为这是遍历全部端口进行扫描的,所以扫描所用的时间比较长的.# -*- coding: utf-8 -*-from socket import *import redef portscaner(host,port): ...原创 2019-04-02 07:47:39 · 5173 阅读 · 1 评论 -
Python笔记(五) --写一个爬虫对新笔趣阁的小说进行爬取
Python笔记(四) --写一个爬虫对新笔趣阁的小说进行爬取作为一名资深书虫以及穷币大学生,一直在免费小说网站上看小说,与此同时也对那写垃圾弹窗广告深恶痛绝。如此一来,寻思着能不能写个爬虫把小说爬下来并保存到本地。要爬取小说,先做好准备工作—收集每个章节的url首先,我要爬取的小说是新笔趣阁的三寸人间,当它的域名也不只这一个,域名不同把源码改一下就行(http://www.xbiquge....原创 2019-04-09 15:35:02 · 1665 阅读 · 1 评论 -
Python笔记(六)--Python3实现批量提交问卷星问卷
大概内容如下:利用Fiddler抓包,对点击提交所传输的数据包进行分析;(划重点)爬取免费代理ip网站(例如:西刺代理)发布的IP地址,构建ip地址池;引用fake_useragent库的UserAgent包,获取随机User-Agent(第2,3点都是为了构造http header,以应对网站的反爬虫机制。不过实测post太频繁,会报错:远端主机积极断开连接之类的)小细节:由于p...原创 2019-04-22 14:00:00 · 6493 阅读 · 5 评论