python
鎏风
一个人
展开
-
爬虫 解决网页ip限制
方法一:user agent 伪装和轮换 使用代理 ip 和轮换 cookies 的处理,有的网站对登陆用户政策宽松些方法二:尽可能的模拟用户行为: UserAgent经常换一换 访问时间间隔设长一点,访问时间设置为随机数; 访问页面的顺序也可以随机着来方法三:网站封的依据一般是单位时间内特定IP的访问次数. 我是将采集的任务按 目标站点的IP进行分组 通过控制每个I...原创 2018-12-24 21:42:27 · 254 阅读 · 0 评论 -
pip 换源
先推荐pip国内的一些镜像阿里云 http://mirrors.aliyun.com/pypi/simple/ 中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/ 豆瓣(douban) http://pypi.douban.com/simple/ 清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/...原创 2019-01-07 20:05:23 · 290 阅读 · 0 评论 -
Django - celery 详解
asdfasd转载 2019-01-07 20:07:04 · 199 阅读 · 1 评论 -
python 输出时间
1.先导入库:import datetime2.获取当前日期和时间:now_time = datetime.datetime.now()3.格式化成我们想要的日期:strftime()比如:“2016-09-21”:datetime.datetime.now().strftime(’%Y-%m-%d’)4.在当前时间增加1小时:add_hour=datetime.datetime.now(...原创 2018-12-01 15:26:12 · 1838 阅读 · 0 评论 -
python 二叉树
关于二叉树的镜像问题:思路是这样的:从根结点出发,先交换它的左节点和右节点,然后对左子树作镜像,再对右子树作镜像。代码如下:def Mirror(root): if not root: return root.left,root.right=root.right,root.left Mirror(root.left) Mirror(root.r...原创 2018-12-02 19:52:20 · 159 阅读 · 0 评论 -
python之你可能不知道的常用小点滴 -_-
一感二爱三井四钱五百分 六尖七和八星九灵狐捡灯 ! @ # $ % ^ & * ( ) - = , . / ? ' \ | ~ ` 反斜杠可以用来转义,使用r可以让反斜杠不发生转义。。 如 r"this is a line with \n" 则\n会显示,并不是换行。 代码规范 之 空行 函数之间或类的方法之间用空行分隔,表示一段新的代码的开始。类和函数入口...原创 2018-11-13 18:17:26 · 222 阅读 · 0 评论 -
python 之 如何使用一些工具和方法来提高代码的运行速度
1.数据结构一定要选对有百万个数据进行排序,选择列表,排序8分钟,选用字典,只用了十几秒。2.多用python中封装好的模块库比如numpy,matplotlib,pandas这三个。matplotlib是绘图库,这个就不多说了,numpy和pandas非常强大,numpy主要是用于计算的,里面有一个多维的数组对象叫ndarray,它具有矢量算术运算能力和复杂的广播能力,并具有执行速度快和...原创 2018-11-21 09:52:48 · 2327 阅读 · 0 评论 -
python 列表 花样去重
# 待去重列表lt1 = [1,3,2,3,4,5,3,5]1.使用集合(结果为升序) lt2 = list(set(lt1))2.使用字典lt2 = list({}.fromkeys(lt1).keys())3.使用排序lt2 = sorted(set(lt1),key=lt1.index) 4.使用列表生成式lt2 = [][lt2.append(i) for i...原创 2018-11-21 20:30:40 · 2301 阅读 · 0 评论 -
python之单例模式的五种写法
1、new#实现__new__方法#并在将一个类的实例绑定到类变量_instance上, #如果cls._instance为None说明该类还没有实例化过,实例化该类,并返回 #如果cls._instance不为None,直接返回cls._instance class Singleton(object): def __new__(cls, *args, **kw): ...原创 2018-11-22 16:31:27 · 1280 阅读 · 0 评论 -
你要知道的 爬虫 封禁与破封
挺有意思的https://blog.csdn.net/qq_37634812/article/details/77658066转载 2018-11-24 16:16:18 · 209 阅读 · 0 评论 -
python 如何进行 内存管理
首先谈谈为什么进行内存管理内存管理是指软件运行时对计算机内存资源的分配和使用的技术。其最主要的目的是如何高效,快速的分配,并且在适当的时候释放和回收内存资源。Python引入了一个机制:引用计数python内部使用引用计数,来保持追踪内存中的对象,就是记录对象有多少个引用. 当对象被创建时就创建了一个引用计数,当对象不再需要时,这个对象的引用计数为0时,它被垃圾回收。总结一下对象会在...原创 2018-11-20 12:13:46 · 276 阅读 · 0 评论 -
python 多种方法解决 列表元素左右循环移动
#待处理列表A= [1,2,3,4,5]#移动次数a = 3右移比较简单for i in range(a): A.insert(0,A.pop())左移for i in range(a): A.insert(len(A),A[0]) A.remove(A[0])#左移for i in range(a): b = A.pop(0) ...原创 2018-11-29 17:56:46 · 3616 阅读 · 0 评论 -
python 中的各种小数点后的精度处理方式
目前用过最方便的: %例如:result为一个list,为result中每个值保留小数点后4位。 result = [("%.4f" % i) for i in result]Python 3.X对于浮点数默认提供17位数字的精度。关于单精度和双精度:单精度型float双精度型double。在Turbo C中单精度型占4个字节(32位)内存空间,其数值范围为3.4E-38~3...原创 2018-11-29 20:29:26 · 19235 阅读 · 2 评论 -
python里的celery 详解
jhvi转载 2019-01-09 21:01:34 · 186 阅读 · 0 评论