- 博客(4)
- 收藏
- 关注
原创 解析库的使用 2
使用Beautiful SoupBeautiful Soup 是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实现惯用的文档导航,查找,修改文档的方式.学会使用Beautiful Soup会帮你节省数小时甚至数天的工作时间....
2019-11-24 22:55:33
92
1
原创 解析库的使用 1
使用XPathXPath即为XML路径语言(XML Path Language),它是一种用来确定XML文档中部分位置的语言。但是它同样适用于HTML文本。所以在做爬虫时,我们可以用xpath来进行信息抽取。1.XPath常用规则表达式描述nodename选取此节点的所有子节点/从当前节点选取直接子节点//从当前节点选取子孙节点.选取当前节点...
2019-11-18 11:18:04
146
原创 python scrapy框架 1
python scrapy框架 1scrapyScrapy 架构安装scrapyscrapyScrapy是用python实现的一个为了爬取网站数据,提取结构性数据而编写的应用框架。使用Twisted高效异步网络框架来处理网络通信。Scrapy 架构ScrapyEngine :引擎。负责控制数据流在系统中所有组件中流动,并在相应动作发生时触发事件。 此组件相当于爬虫的“大脑”,是 整个爬虫...
2019-11-03 23:12:34
165
原创 如何理解面向对象
在开始学习面向对象的语言时,我就有一个疑问,说是面向对象,但面向对象到底是什么,该怎么理解,我是不明白的。后来,看了一些书之后,对于面向对象,我也有了一定了解,现在就说说我的理解。 面向对象主要有三大机制封装、继承和多态。先简单讲解一下它们的定义。 封装,可以简单理解为就是类,把同种对象共有的属性和方法构成的一个类。 继承,简单理解就是有父类方法和属性的子类。...
2019-03-17 00:27:44
206
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人