others
herr_kun
喜欢有趣的新方向,涉猎广泛,方向专一
展开
-
U盘重装系统-非常简单制作方法
利用U盘重装系统一、准备工作 首先做好准备工作: 1、一个大容量的U盘(8GB)便可 2、需要安装的系统WIN7 WIN10 Ubuntu等系统镜像 ISO文件,可以去MSDN上下载 3、用到的软件UltraISO(直接去官网下载便可),地址:https://cn...原创 2018-10-12 19:20:30 · 10472 阅读 · 1 评论 -
爬取年报数据、解析PDF提取数据、分析代码(巨潮 Python)
利用Python爬取巨潮网页上的年报等数据,通过解析下载的PDF文件,提取其中有用的数据,并写入到本地文件中。主要分为几个模块:1、从Excel或者列表或者TXT读取股票代码2、根据股票代码和年份等信息爬取特定网页中的信息,获得年报数据所在的网络地址3、根据年报数据的网络地址,下载对应的到本地4、解析本地的PDF文件,通过关键词检索到对应的value5、添加多线程,一边对股票代码进行...原创 2019-04-30 17:33:36 · 49065 阅读 · 26 评论 -
推荐一个PDF转World非常好用的一个软件-ABBYY
前言:现在很多的PDF转world全都是转成了图片等,根本不是我们想要的,这里有一个非常好转换软件-ABBYY,可以将PDF中的文字转换为world中的文字,而不是图片官网地址:https://www.abbyy.com/en-apac/ 还有一个比较好的网站:可以进行PDF的去解密,切割,翻译等http://www.pdfdo.com/pdf-remove-re...原创 2019-03-13 11:07:40 · 1664 阅读 · 1 评论 -
十六进制文件的读取和数据处理(补码解析)
前言:由于最近有项目需求,需要对采集回来的数据进行解析和处理,而源数据是十六进制格式的,但是由于python3将字节和字符串有了更为严格的区分,所以不能直接对数据进行readline,需要进一步的处理。下面是具体的处理步骤:1、十六进制文件的读取首先是从文件中读取十六进制的数据: 如果我们直接像从txt文件中读取数据那样(readlines)按行进行读取是...原创 2018-11-17 12:25:11 · 37387 阅读 · 0 评论 -
汽车之家网站为例-爬虫的编写,爬取图片
汽车之家图片的爬取 汽车之家有很多汽车的点评、价格、图片等信息,那么怎么才能编写一个爬虫来获得我们所需要的信息呢,很简单,两个工具便可以了,一个网页解析工具requests,一个正则匹配工具re,下面以Python语言编写爬虫。首先在火狐或者chrome浏览器下打开汽车之家的网页,然后点击小型车,得到:关...原创 2018-10-14 14:19:21 · 5768 阅读 · 0 评论