python之爬虫
文章平均质量分 89
C与Python实战
这个作者很懒,什么都没留下…
展开
-
Python爬虫之二:自制简易词典
运行平台: Windows Python版本: Python3.6 IDE: PyCharm 其他工具: Chrome浏览器1.寻找词典来源2.数据抓取2.1 寻找URL2.2 寻找数据2.3 抓取数据3. 改进优化3.1 查询中文3.2 查询不存在的单词3.3 停止3.4 给你点颜色看看4. 如何使用4.1 直接运行py文件4.2 打包5.完...原创 2017-12-16 21:47:22 · 3143 阅读 · 0 评论 -
Python爬虫之三:抓取猫眼电影TOP100
今天我要利用request库和正则表达式抓取猫眼电影Top100榜单。运行平台: Windows Python版本: Python3.6 IDE: Sublime Text 其他工具: Chrome浏览器1. 抓取单页内容2. 正则表达式提取有用信息3. 保存信息4.下载TOP100所有电影信息5.多线程抓取1. 抓取单页内容浏览器打开猫眼电影...原创 2018-01-10 17:01:36 · 10703 阅读 · 6 评论 -
Python爬虫之一:十几行代码下载王者荣耀所有皮肤
寻找皮肤图片地址1 找到英雄列表2 找到英雄皮肤地址下载图片1 英雄有几个皮肤2 下载文件 起因:前两天在公众号上看到一篇文章内容就是爬取王者荣耀的皮肤,但是内容太大概了,如果跟着他做肯定做不出来,所以我打算自己做。之前接触过爬虫还是几年前爬取豆瓣电台的歌曲,那时候用的C++,json解析还要用第三方库,总之很麻烦。最近接触到了python,深深的感觉这门语...原创 2017-12-15 15:18:40 · 20246 阅读 · 14 评论 -
Python爬虫之四:今日头条街拍美图
今天我们来爬取今日头条图集,老司机以街拍为例。运行平台: Windows Python版本: Python3.6 IDE: Sublime Text 其他工具: Chrome浏览器 1、网页分析2、代码1、网页分析从打开今日头条首页,搜索“街拍”,下面有四个标签页“综合”、“视频”、“图集”和“用户”,我们依次点击几个标签,页面虽然变化了,但是地...原创 2018-01-18 20:19:46 · 1830 阅读 · 0 评论 -
Python爬虫:爬取在线教程生成pdf
作为一名程序员,经常要搜一些教程,有的教程是在线的,不提供离线版本,这就有些局限了。那么同样作为一名程序员,遇到问题就应该解决它,今天就来将在线教程保存为PDF以供查阅。1、网站介绍2、准备工作2.1 软件安装2.2 库安装3、爬取内容3.1 获取教程名称3.2 获取目录及对应网址3.3 获取章节内容3.4 保存pdf3.5 合并pdf4、完整代码...原创 2018-04-15 14:48:18 · 5317 阅读 · 5 评论