爬虫数据分析
ZHHHHHJ66
Keep optimistic,keep exploring
展开
-
十分钟学会十几行代码爬取豆瓣top250电影并且写入csv文件(非常简单)
方法与库 所用的库是request_html,用过request_html库都知道这个库是真的好用,比beautifulsoup+request的组合好用多了,第二是csv,因为我们要写入嘛,话不多说上代码! from requests_html import HTMLSession import csv session = HTMLSession() kv={'user-agent':'Moz...原创 2020-03-15 10:46:24 · 2167 阅读 · 0 评论 -
100行代码实现百度批量下载器,下载任意图片,清新界面版
之前我写了一个tkinter的简易的百度翻译工具,发现tkinter的界面有点丑,发现python的GUI有更好的库的pyside2库,用法和QT5大概类似,恰好最近在写百度图片下载的下载器,两者结合就有了下面的百度下载器。 这里只是做个示范????,大家为了身体着想,不要搜索这样的关键字 点击下载后它会自动在你程序中生成你以搜索关键字的文件夹,并且以这个关键字为名创建一个文件夹把图片下载到这个文件夹 话不多说,我们先上代码 import os from PySide2.QtWidgets impor原创 2020-08-17 18:44:13 · 845 阅读 · 0 评论 -
利用tkinter和request做成一个简易图形化翻译工具
利用tkinter和request做成一个简易图形化翻译工具原创 2020-07-10 17:00:50 · 391 阅读 · 0 评论 -
利用request_html爬取百度热榜并存入csv文件中
工具:python,request_html库,csv库 废话不多说直接上代码 from requests_html import HTMLSession import csv session = HTMLSession() headers = { "User-Agent":"Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.106 Safari/537原创 2020-06-29 11:36:09 · 582 阅读 · 0 评论 -
利用requests_html抓取微博热搜并用matploylib转换为直方图
我每天都想看微博每天有什么大事发生,但又不想浪费时间看其他东西,所以想着用爬虫抓取了微博前十的热搜,这样解了自己馋,又不至于浪费时间。 使用的库:requests_html 和 matploylib requests_html 是我用过的爬虫最简单的库 感兴趣的可以看看:request_html中文文档 matploylib是优秀的绘图库这我就不多介绍了。 代码比较简单,大家可以看看,亲测可用。 from matplotlib import pyplot as plt from matplotlib im原创 2020-06-03 18:38:10 · 311 阅读 · 0 评论