- 博客(9)
- 收藏
- 关注
原创 记录我的爬虫之路2-- headers的修改 && 控制访问频率
一. 修改headers——————————————————————————————————————————————————1. 方法一: 通过字典的形式参数传给request:因为咱们的爬虫访问网站留下的useragent是pythonxxx,人一看就知道是爬虫了~万一网站采取反爬措施呢?咱们该怎么办呢?今天就介绍一下 userAgent的修改→修改headers用上个博客的爬取有道翻译...
2018-09-18 09:13:45 2268
原创 记录我的爬虫之路1--爬虫起步的urlib.request Python写一个不用Scrapy框架的裸奔小幼儿爬爬
这几天得知保研失败了….刚好卡在保研名额外一名…虽然最近写什么东西都忍不住碎碎念叨这一句话 =。=,但是好像也觉得能找到喜欢的东西了~比如现在打算认真学的爬虫了~今天刚把小甲鱼入门python的爬虫部分学完,利用scrapy框架能顺利地爬出dmoztools的一点小东西了,所以先做个回顾,具体的写一些最近学习的知识,便于下一阶段的学习! 不管怎么样,希望能快快找到实习~新生活还是得开始的嘛! ...
2018-09-13 21:46:01 503
原创 小甲鱼零基础学习python_32 【python中的模块】
什么是模块?→ 模块是一种高级封装;容器 → 元组 字典 字符串 列表:数据的封装函数 → 语句的封装类 → 方法(函数) 和 属性(数据)的封装↓模块,就是程序,比如.py文件就是一个独立的文件一. 导入模块:...
2018-09-05 20:19:17 399
原创 小甲鱼零基础学习python_31 【python中魔法方法六:迭代器和生成器】
1. 迭代器我们接触的迭代器通常指 序列:字符串 字典 列表 元组….迭代器可以理解为一个对数据的打包:以下是几个迭代器的例子:1.1.1 字符串的迭代:for i in 'FISHC': print(i)1.1.2 字典的迭代:(字典迭代器里取出来的是键值key)links ={'yhr':'ysp has a daughter', '...
2018-09-04 14:35:44 436 2
原创 小甲鱼零基础学习python_30 【python中魔法方法五:定制序列】
协议容器类型的协议:1. 如果你希望定制的容器是不可变的话,你只需要定义:len(self) 和 getitem(self,key)方法2. 如果你希望定制的容器是可变的话,你除了需要定义:len(self) 和 getitem(self,key)方法外还需要定义:setitem(self,key)和 delitem(self,key)方法Eg: 编写一个...
2018-09-03 17:58:47 610 1
原创 小甲鱼零基础学习python_29 【python中魔法方法四:描述符】
心塞,这几天学的醉生梦死,微微敷衍了事,但是emmm,明天就要出发去北京了,想着出发之前来个这几天学的笔记大完结吧…… 学校今天发了通知,说保研的名单公示时间推迟到9.16到9.25之间…..处于保研边缘的我心是塞的…… 这几天干脆早点去学校准备实习的笔试吧 其实我是想走数据这条路….但是数据好多公司把我拒绝,理由是经历不符合….唉,但是不管怎么样,我是冲着python的爬虫来学小甲鱼的...
2018-09-03 17:45:40 443
转载 魔法方法——简单定制(__str__ 和__repr__)
魔法方法——简单定制(str 和repr)读书笔记: repr和str这两个方法都是用于显示的,str是面向用户的,而repr面向程序员。 repr是representation及描述的意思。 想使用print(Object)显示对象,那就需要重构str。 想直接输入类对象来打印,那就需要重构repr。 在python语言里,str一般是格式是这样的:class A:...
2018-09-01 20:10:13 472 1
原创 小甲鱼零基础学习python_28 【python中魔法方法三:属性访问】
今天介绍以下四个访问属性的魔法方法: __getattribute__(self, item): __getattr__(self, item): __setattr__(self, key, value): __delattr__(self, item):先定义一个类用来做实验:class C: def __getattribute__(...
2018-09-01 19:57:45 447 1
原创 python自制定时器小例子及time模块详解
1. 自制定时器 class Mytimer(): def __init__(self): self.__tips='未开始计时!' self.__unit=['年', '月', '日', '小时', '分钟', '秒'] self.__borrow=[0,12,31,24,60,60] self.__last...
2018-09-01 19:42:12 1838 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人