Python库
_illusion_
知乎主页:https://www.zhihu.com/people/illusions-29/posts
展开
-
使用flask发送文件,或服务器端解析发来送来的文件
问题提出最近遇到个需求,需要将doc/docx/pdf/xls等格式的文件发送到服务器,交给程序去解析。所以很自然地想到了使用flask。但之前我没有用flask传输过文件,所以这里经过了一些调研和尝试后,找到了一种很方便的方法,在这里分享一下由于我们一方需要发送文件,另一方需要接收文件,所以这个解决方案中需要包括两部分——请求端POST文件到服务器; 服务器端接收并解析收到的文件。问题解决请求端发送文件请求端发送文件,是使用requests执行的。发送的文件,实际上发送的应该是该文原创 2020-09-08 10:50:59 · 3629 阅读 · 0 评论 -
Python爬虫基础——requests、BeautifulSoup
最近由于工作需要,所以学习了一些爬虫小知识。之前一直觉得爬虫是黑科技,里面的弯弯绕绕多得很,各种反爬技术和更高的爬虫手段层出不穷,要学习是个难事。后来发现其实并不难,对于没有刻意的反爬技术的网站而言,基本就是以下两个Python库的使用——requests BeautifulSoup首先,当然是安装这两个包了。安装后,一个最简单的爬虫流程,就是,先向URL发出GET请求:(假设我们爬取某医...原创 2020-01-07 15:23:03 · 537 阅读 · 0 评论 -
tqdm模块在处理文件阅读时,如何显示出进度条?
问题提出最近,使用tqdm模块,对于大文件的阅读进行进度监控。然而我发现有个问题,即在tqdm模块使用一定没错的情况下,进度条死活打印不出来。情况如下:如上图所示,这样read file是没有进度条显示的。问题解决先说为什么,再说怎么解决。为什么没有进度条tqdm模块的进度条显示,是依赖于已知可迭代模块的总迭代数的。如迭代一个list,该list有支持len()方法获取其长度,这样,进度条才能正确显示。但read file的思路显然不是这样。因为read file的时候的迭代原创 2020-07-02 10:44:21 · 7354 阅读 · 0 评论