python
文章平均质量分 81
Amauri@
公众号: 「 后端漫谈 」
展开
-
Python基础系列:初识python引用计数与弱引用
写在前边:之前的socket系列就告一段落,主要是对自己所学做一个总结与记录。接下来我打算基于libevent写一个支持并发的HTTP服务器。因为之前学习群里大神早就开发过一个同时支持HTTP与WebSocket的服务器,我看了之后感觉很有兴趣,所以才买了本网络编程的书来看。我打算参考他的来写一个精简版,只支持HTTP。等写完了可以分享给大家,虽然不能运用到生产环境,但是我相信学习完源...原创 2018-09-15 22:35:28 · 186 阅读 · 0 评论 -
Python基础学习之五大常用数据类型
刚开始学习一门编程语言,除了了解运行环境与语言类型之外,最基本还是从该语言的基本数据类型开始学起。Python六大常用数据类型:int 整数float 浮点数str 字符串list 列表tuple 元组dict 字典讲解这些先说一下python中的变量与变量名。变量其实本质上是一个具有特殊格式的内存,变量...原创 2018-09-18 22:52:53 · 245 阅读 · 0 评论 -
Python爬虫利器:Beautiful Soup的使用(一)
上一次的爬取网易新闻案例,我们使用到了一个解析 HTML 的库:Beautiful Soup。本次跟大家分享一下关于这个库的一些用法。Beautiful Soup 简介:Beautiful Soup 是一个可以从 HTML 或者 XML 文档中提取数据的 Python 库,它提供一些简单的函数可以很方便的从文档上提取所需要的数据。由于目前最新版本是 4.4.0,所以一般被简称为 bs4。安...原创 2018-09-26 17:02:41 · 350 阅读 · 0 评论 -
Python 爬虫利器 Beautiful Soup 4 之文档树的搜索
前面两篇介绍的是 Beautiful Soup 4 的基本对象类型和文档树的遍历, 本篇介绍 Beautiful Soup 4 的文档搜索搜索文档树主要使用两个方法 find() 和 find_all()find_all():find_all 是用于搜索节点中所有符合过滤条件的节点那么它支持哪些过滤器呢?过滤器的类型:字符串正则表达式列表True方法字符串:查找文档中所...原创 2018-10-04 12:27:47 · 228 阅读 · 0 评论 -
小白也能懂得python爬虫入门教程
此文属于入门级级别的爬虫,老司机们就不用看了。本次主要是爬取网易新闻,包括新闻标题、作者、来源、发布时间、新闻正文。首先我们打开163的网站,我们随意选择一个分类,这里我选的分类是国内新闻。然后鼠标右键点击查看源代码,发现源代码中并没有页面正中的新闻列表。这说明此网页采用的是异步的方式。也就是通过api接口获取的数据。那么确认了之后可以使用F12打开谷歌浏览器的控制台,点击Network,我...原创 2018-09-22 22:56:22 · 31328 阅读 · 4 评论 -
Python爬虫案例:抓取豆瓣编程类高评分书籍
对于很多正在学习计算机的朋友来说,选择合适的学习材料是非常重要的。本文将通过 Python 来爬取豆瓣编程类评分大于 9.0 的书籍。此案例很适合入门爬虫的朋友学习,总共也就 3 个函数。下图是最终的结果:下面进入正题:一、采集源分析:首先我们找到豆瓣的编程类书籍网址:https://book.douban.com/tag/编程进入网址之后我们翻到最下面的分页导航:通过...原创 2018-10-07 17:22:30 · 1712 阅读 · 0 评论 -
Python爬虫利器:Beautiful Soup的使用(二)
上一篇文章介绍了 BeautifulSoup 的安装以及基本对象类型。本次介绍使用 bs4 对 HTML 文档树的遍历。先把本文用到的例子贴上:str = """<!DOCTYPE html><html><head><title>bs4 test<原创 2018-09-28 21:23:21 · 590 阅读 · 0 评论