自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Scrapy框架入门

Scrapy框架入门1. Scrapy介绍2. Scrapy工作流程3. Scrapy入门1 创建一个scrapy项目2 生成一个爬虫3 提取数据4 保存数据5 在命令中运行爬虫6 在pycharm中运行爬虫4. pipline使用 1. Scrapy介绍 • 什么是Scrapy Scrapy是一个为了爬取网站数据,提取结构性数据而编写的应用框架,我们只需要实现少量的代码,就能够快速的抓取 Scrapy使用了Twisted异步网络框架,可以加快我们的下载速度 http://scrapy-chs.read

2020-06-30 16:10:33 234

原创 python之xpath和lxml模块及豆瓣爬取练习

python之xpath和lxml模块1. xpath介绍1.1 基本概念1.2 结点的关系2. 基本使用2.1 工具安装2.2 模块的使用3. 豆瓣电影榜单爬取 1. xpath介绍 1.1 基本概念 XPath(XML Path Language)是一种XML的查询语言,他能在XML树状结构中寻找节点。XPath 用于在 XML 文档中通过元素和属性进行导航xml是一种标记语法的文本格式,xpath可以方便的定位xml中的元素和其中的属性值。lxml是python中的一个包,这个包中包含了将html文本

2020-06-06 18:27:41 630

原创 python-初识多任务线程

python-初识多任务线程1.多任务基本介绍1.1 程序中模拟多任务2. 主线程和子线程的执行关系3. 查看线程数量4. 验证子线程的执行与创建5. 线程间的通信(多线程共享全局变量)5.1 多线程参数-args6. 制作一个摸奖转盘 1.多任务基本介绍 有很多的场景中的事情是同时进行的,比如开车的时候手和脚共同来驾驶汽车,再比如唱歌跳舞也是同时进行的 1.1 程序中模拟多任务 1 import time 2 3 def sing(): 4 for i in range(3): 5 print("正在唱歌

2020-06-05 15:17:58 228

原创 Python-正则表达式

Python-正则表达式1.正则表达式的简介1.1 概念1.2 正则表达式的应用场景2. 正则表达式对Python的支持2.1 普通字符2.2 元字符2.3 预定义匹配字符集2.4 重复匹配2.5 位置匹配和非贪婪匹配3. re模块常用方法4. 分组功能 1.正则表达式的简介 1.1 概念 正则表达式是对字符串操作的一种逻辑公式,就是事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的⼀种过滤逻辑 1.2 正则表达式的应用场景 表单验证(例如 : 手机

2020-06-03 22:56:56 199

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除