自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

转载 python3正则表达式

正则表达式是一个很强大的字符串处理工具,它能帮助我们方便的检查一个字符串是否与某种模式匹配。一、python中正则表达式的基本语法规则 序号 语法 解释 表达式 成功匹配对象 1 一般字符 匹配自身相对应的字符 abc abc 2 . 匹配除换行符(\n)以外的任意字符 a.c abc 3 \ 转义字符,可以改变原字符的意思

2018-04-10 09:11:53 805

原创 python3中urllib中的request模块

因为在玩Python challenge的时候,有用过这个模块,而且学习这个模块之后也对系统学习网络爬虫有用。 当时查了各种资料学习,没有碰官网文档(因为还是对英语有抗拒性),但是还是官方的文档最具权威和学习价值,因此想要此次翻译官方文档的同时,锻炼自己的英语能力,也对urllib模块加深理解。 因为是为了自己复习起来...

2018-04-08 19:46:12 710

原创 urllib的parse模块

python 版本3.6 1.urlparse 定义:def urlparse(url, scheme=”, allow_fragments=True) 将url拆分成六大组件 #!/usr/bin/evn python "测试urlparse" #导入parse模块 from urllib import...

2018-04-08 19:26:27 563

原创 python爬虫基础二

上一篇博客中我们有提到,经过python爬虫去爬取服务器端的代码可能会被服务器阻拦,所以,我们要有措施来应对阻碍我们前进的障碍。 当我们用python访问的时候,hearder中的User-Agent会显示python+版本号,我们可以通过修改它的值来达到隐藏的效果。 在python爬虫基础一的博客中我们谈到爬取有道翻译的过程,在这个例子中我们加入隐藏字段: head = {} head...

2018-04-04 16:37:24 827

原创 python爬虫基础一

爬虫简介: 爬虫就是一段自助抓取互联网信息的程序 简单爬虫架构: 我们用一段简单的代码爬取百度网页: 但是上述爬取的结果只能给看得懂代码的程序员看,我们如何得到想要的图形化界面呢? 下面我们试着从网站上爬取一个图片 我们从网站http://placekitten.com上获取一张大小为500*600的图片 爬取结果: response.geturl()可以获取链接地址 resp

2018-04-04 13:30:09 653

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除