python
文章平均质量分 73
普通网友
这个作者很懒,什么都没留下…
展开
-
Python面向对象的编程笔记
面向对象编程(Object Oriented Programming–OOP)是把 对象 作为程序的基本单元,一个对象包含了数据和操作数据的函数。面向过程的程序设计把计算机程序视为一系列的命令集合,即一组函数的顺序执行。面向过程把函数继续切分为子函数,即把大块函数通过切割成小块函数来降低系统的复杂度。(通过定义一组组函数来实现降低复杂度的目的)面向对象的程序设计把计算机程序视为一组对象的集合,而每个原创 2017-06-15 23:58:02 · 434 阅读 · 0 评论 -
Python爬虫之requests库入门
安装pip install requestsrequests库的七个主要方法 方法 说明 requests.request() 构造一个请求,支撑以下各方法的基础方法 requests.get() 获取HTML网页的主要方法,对应于HTTP的GET requests.head() 获取HTML网页头信息的方法,对应于HTTP的H...原创 2018-05-12 18:00:01 · 220 阅读 · 0 评论 -
Python爬虫之BeautifulSoup库
安装pip install beautifulsoup4 (linux可能需要使用pip3 install beautifulsoup4)解析核心代码:from bs4 import BeautifulSoupsoup = BeautifulSoup('<p>data</p>', 'html.parser')Beautiful Soup库的基本元...原创 2018-05-12 19:26:17 · 291 阅读 · 0 评论 -
Python爬虫之信息组织与提取
信息的标记标记后的信息可形成信息组织结构,增加了信息维度标记的结构与信息一样具有重要价值标记后的信息可用于通信、存储或展示标记后的信息更利于程序理解和运用信息标记的三种格式XMLJSONYAMLXML(eXtensible Markup Language)空元素的缩写形式 <img src=“china.jpg” size=“10”...原创 2018-05-12 20:20:00 · 353 阅读 · 0 评论 -
Python爬虫之基于bs4库的HTML内容查找方法
find_all的使用方法: &lt;&gt;.find_all(name, attrs, recursive, string, **kwargs)name : 对标签名称的检索字符串, 返回一个列表类型,存储查找的结果attrs: 对标签属性值的检索字符串,可标注属性检索recursive: 是否对子孙全部检索,默认Truestring: &lt;&gt;…&lt;tag&gt...原创 2018-05-12 20:52:29 · 1160 阅读 · 0 评论