- 博客(10)
- 资源 (3)
- 收藏
- 关注
原创 Flask的登录
2019/8/12 下午4:17:39 Flask的登录创建以下文件夹appmanager.pyconf__init__.pyconfig.pysettings.pymapperforms__init__.pylogin_form.pymodels__init__.pyuser_model.pyFlask创建一个web应用,相当于a...
2019-08-12 16:19:19 542
原创 构建自己的代理池
目录前期准备/使用的框架模块基本流程代码实战config.pydb.pycrawler.pyvalid_proxy.pycrawl_proxy.pyapi.pyrules.py部署流程对于学习爬虫来说,ip被禁几乎是常见的事。因此在爬取业务中,使用代理ip几乎是常态。但是对市面上的代理ip的服务,对于个人爬虫学习者来说,价格高昂。即使淘宝...
2019-07-09 18:14:25 862
原创 网络编程笔记一(nginx,wsgi,flask)
文章目录简要理解一个请求到flask应用的过程Web服务器层WSGI层Web网络框架层nginx 的作用反向代理负载均衡其他简要理解一个请求到flask应用的过程客户端从发送一个 HTTP 请求到 Flask 处理请求,分别经过了 web服务器层,WSGI层,web框架层,这三个层次。不同的层次其作用也不同,下面简要介绍各层的作用。Web服务器层对于传统的客户端 - 服务器架构,其请求的...
2019-06-17 23:59:32 166
原创 计算机网络面试题(一)
文章目录理解一个完整的网络请求过程0. 判断是否为合法URL1. 解析DNS2. 建立TCP/IP连接发送HTTP请求进行资源的访问释放连接浏览器进行资源渲染展示理解一个完整的网络请求过程0. 判断是否为合法URL一个合法的URL应包含三部分协议 http/httpsdns 域名router 路由1. 解析DNSDNS 由一个顶级域和若干个子域构成,子域又可以划分成各种子域的集合...
2019-06-07 08:49:58 175
原创 水库采样-随机数生成
构造随机生成器说明什么是随机数构造属于特定的随机数生成器应用一:构造随机数生成数应用二:水库抽样说明本文所说的均为伪代码,代码实现根据自己习惯语言编写.什么是随机数随机数是不同随机试验的结果。它在不同统计领域均有广泛地应用,比如从统计样本中抽取一定数量的个体。产生随机数有多种不同的方法,而这些方法被称为随机数生成器。随机数的性质是等概率,不可预测,例如最简单随机数整数生成器求模运算。 伪代...
2019-04-26 23:51:54 388
翻译 MySQL 笔记二(连接池的简要介绍)
文章目录简要原理优点注意要点1. 连接池中到底应该放置多少连接,才能使系统的性能最佳?2. 如何确保连接池中的最小连接数呢?dbcp参数设置c3p0c3p0与dbcp区别python-SQLalchemy使用用法参数设置原文: https://www.cnblogs.com/aspirant/p/6747238.html简要最小连接数:是连接池一直保持的数据库连接,所以如果应用程序对数据库...
2019-03-29 23:01:03 816
翻译 MySQL 笔记一(引擎的简要介绍)
文章目录InnoDBACID事务原子性(Atomicity)一致性(Consistency)隔离性(Isolation)持久性(Durability)行级锁MyISAM表级锁存储格式静态表动态表压缩表缺点Memory索引注意要点Merge使用要点常见问题1)建表时UNION指明的子表如果存在相同主键的记录会怎么样?2)若MREGE后存在重复主键,按主键查询会是什么结果?3)直接删除一个子表会出现什...
2019-03-19 21:33:51 124
转载 python 实例方法,类方法 以及静态方法
对于python的初学者,了解实例方法,类方法 以及静态方法并不是特别的重要,但是若想更好的利用python作为自己的编程工具,则不得不学。在此先说明一下,有人会问python2.7.x以及python3.x先学哪个好,其实我觉得两者并没有太多的区别。在许多公司都会沿用python2.7.x,这是历史原因。虽说官方建议python3,但是不代表python2比python3性能差,而且github...
2019-01-07 23:51:36 130
原创 python3 多进程, 多线程, 协程性能对比 以及GIL锁解释
描述对于python来说, 多线程是python的软肋。在官方文档表明,根据程序的不同类型,如是I/O密集型,CPU密集型,分别使用多线程,多进程会使性能达到最佳。本文的主要目的是笔者在面试过程中,提及到线程,进程,协程对于爬虫来说,哪个性能会更好(笔者本人认为是进程加协程二者配合会达到更好的效果)。希望通过本文来让其他人对于爬虫的线程,进程,协程使用有更深的理解。 本文涉及的环境模块...
2019-01-06 21:58:47 2849 2
原创 使用最大逆向法,利用python进行简易中文分词
首先进行分词所需要的基本设置就是“词库”,而网上开源的词库有很多,例如github里面的chinese词库和清华大学开源中文词库,这些都是免费下载开源的。而且下载及其简单,所以你在网页可以直接下载,若是你已经学过爬虫,也可以进行爬下来。在这里我只下载类清华大学的food词库,这个程序也只能匹配水果食物等的专有名词。以下是程序#!/usr/bin/env python#-*- co
2017-08-03 16:32:17 616
Microsoft Visual C++ 14.0.zip
2019-06-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人