Python爬虫-解析库之pyquery

使用pyquerypyquery初始化字符串初始化URL初始化文件的初始化基本CSS选择器查找节点子节点父节点兄弟节点遍历获取信息获取属性获取文本节点操作addClass和removeClassattrr、text和htmlremove()伪类选择器 pyquery 初始化 像Beautiful ...

2019-01-04 04:41:28

阅读数 66

评论数 0

Python爬虫-解析库之BeautifulSoup

BeautifulSoup装载HTML文档BeautifulSoup的安装BeautifulSoup装载HTML文档BeautifulSoup查找HTML元素BeautifulSoup获取元素的属性值BeautifulSoup获取元素包含的文本值BeautifulSoup的高级查找获取元素节点的父...

2019-01-03 04:04:40

阅读数 66

评论数 0

Python爬虫-解析库之XPath

解析库的使用XPath XPath XPath,全称为XML Path Language,即XML路径语言,它是一门在XML文档中查找信息的语言。最初是用来搜寻XML文档的,但同样适用于HTML文档的搜索。 ...

2018-12-29 07:58:25

阅读数 34

评论数 0

Python爬虫-爬取库的使用介绍

Python爬虫-基本库的使用介绍使用urllibrquest模块urlopen()data参数timeout参数其他参数Request 使用urllib Python2中,有urllib和urllib2两个库来实现请求的发送,在Python3中,统一为urllib,官方文档链接为:htt...

2018-12-28 07:18:24

阅读数 115

评论数 0

结构化文件存储

结构化文件存储XMLXML(eXtensibleMarkupLanguage),可扩展标记语言XML文档的构成保留字符的处理XML标签的命名规则命名空间XML访问读取 XML XML,JSON 为了解决不同设备之间的信息交换 参考资料: https://docs.python.o...

2018-12-04 21:32:33

阅读数 19

评论数 0

Python-多线程

多线程多线程_threadthreading模块 多线程 程序:一堆代码以文本形式存入一个文档 进程:程序运行的一个状态 包含地址空间、内容、数据栈等 每个进程由自己完全独立的运行环境,多进程共享数据是一个问题 线程 一个进程的独立运行片段,一个进...

2018-11-29 21:42:09

阅读数 25

评论数 0

Python-协程

协程协程迭代器生成器协程 协程 参考资料 http://python.jobbole.com/86481 http://python.jobbole.com/87310 https://segmentfault.com/a/1190000009781688 迭代器 可迭代(Iterab...

2018-11-29 21:40:06

阅读数 30

评论数 0

Python-scrapy爬虫

scrapy框架爬虫scrapy框架爬虫简介安装scrapy建立scrapy项目入口函数与入口地址Python的yield语句Scrapy中查找HTML元素Scrapy中查找HTML元素(1)Scrapy中查找HTML元素(2)Scrapy中查找HTML元素(3)Scrapy爬取与存储数据建立We...

2018-09-27 21:43:07

阅读数 88

评论数 0

HTML文档结构与文档树

HTML文档结构HTML文档树 HTML文档实际上类似一个XML文档,完整的HTML文档包含根元素<html>,然后在<html>中包含<head>,&am...

2018-09-23 23:45:07

阅读数 230

评论数 0

Python基础(分支循环)

三大结构 顺序 分支 循环 分支 分支的基本语法 if 条件表达式: 语句1 语句2 语句3 …… 条件表达式就是计算结果必须为布尔值的表达式 表达式后面的冒号不能少 注意if后面的出现的语句,如果属于if语句块,则必须同一...

2018-09-12 15:29:49

阅读数 27

评论数 0

Python基础(字符串+变量)

字符串 转义字符 格式化 内建函数(后延) 转义字符 用一个特殊的方法表示出一系列不方便写出的内容,比如回车键,换行键,退格键 借助反斜杠字符,一旦字符串中出现反斜杠,则反斜杠后面一个火几个字符表示已经不是原来的意思了,进行了转义 在字符串中,一旦出现反斜杠就要加倍小心,可能由转义...

2018-09-12 14:38:04

阅读数 82

评论数 0

Python运算符

<1> 比较(即关系)运算符 “==”:检查两个操作数的值是否相等,如果是则条件变为真。 如a=3,b=3则(a == b) 为 true. “!=”:检查两个操作数的值是否相等,如果值不相等,则条件变为真。 如a=1,b=3...

2018-08-31 18:00:51

阅读数 26

评论数 0

Linux学习笔记(二)

用户目录 位于/home/user,称之为用户工作目录或家目录,表示方式/home/user、~ 相对路径和绝对路径 绝对路径 从/目录开始描述的路径为绝对路径,如:cd /home、ls /usr 相对路径 从当前位置开始描述的路径为相对路径,如:cd ../../、ls abc/d...

2018-08-31 12:54:10

阅读数 35

评论数 0

Linux学习笔记(三)

常用基本命令 命令使用方法 Linux命令格式: command [-options] [parameter1] ... 说明: command:命令名,相应功能的英⽂单词或单词的缩写。 [-options]:选项,可⽤来对命令进⾏控制,也可以省略, []代表可选 parameter...

2018-08-31 12:53:57

阅读数 24

评论数 0

Linux学习笔记(一)

Linux学习笔记(一) Linux目录 /:根目录,一般根目录下只存放目录,在Linux下有且只有一个根目录。所有的东西都是从这里开始。当你在终端里输入“/home”,你其实就是在告诉电脑,先从/(根目录)开始,再进入到home目录。 /bin、/usr/bin:可执⾏二进制⽂件的目录,如...

2018-08-31 12:53:43

阅读数 41

评论数 0

Python语法

常用的数据类型转换 函数 说明 int(x [,base ]) 将x转换为一个整数 ...

2018-08-31 12:52:57

阅读数 32

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭