自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 简单算法理解 --- 栈、队列、排序

栈(先进后出 、后出先进)# 定义一个栈(FILO)class Stack(object): def __init__(self): self.stack = [] def pop(self): if self.is_empty(): return None else: retu...

2018-07-30 15:04:48 190

原创 爬虫最终杀手锏 --- PhantomJS 详解(附案例)

一 . 认识PhantomJS   1.  PhantomJS:无界面的浏览器     Selenium: 可以根据我们的指令,让浏览器自动加载页面,获取需要的数据,甚至页面截屏,或者判断网站上某些动作是否发生。Selenium 自己不带浏览器,不支持浏览器的功能,它需要与第三方浏览器结合在一起才能使用。但是我们有时候需要让它内嵌在代码中运行,所以我们可以用一个叫 PhantomJS 的工...

2018-07-29 13:45:12 1071

原创 爬虫案例 --- Python 爬取淘宝数据存到数据库

可以做爬虫的语言有很多,如 PHP、Java、C/C++、Python等等...1)PHP语言 虽然是世界上最好的语言,但是他天生不是干这个的,而且对多线程、异步支持不够好,并发处理能力很弱。爬虫是工具性程序,对速度和效率要求比较高。2)Java 语言的网络爬虫生态圈也很完善,是Python爬虫最大的对手。但是Java语言本身很笨重,代码量很大。  重构成本比较高,任何修改都会导致...

2018-07-27 11:37:43 5537 1

原创 Django --- 开发博客系统

blog开发流程1.分析博客页面:1)完成网站的模块划分2)从模板页面中抽象出父模板,完成模板页面继承3)分析模块当中的数据模型,确定模型类当中的字段2.分析博客实现的功能:1)用户模块的注册登录,增删改查,模型类的继承,form验证,2)一篇文章有一个作者,多个标签,一种类型,添加评论,浏览量,文章点赞3)文章排行榜,归档4)标签云5)文章分页, 文章详情...

2018-07-27 10:41:12 927

原创 MySQL 存储过程 --- 创建-调用-参数

#SQL语句:先编译后执行存储过程(Stored Procedure):  一组可编程的函数,是为了完成特定功能的SQL语句集,经编译创建并保存在数据库中,用户可通过指定存储过程的名字并给定参数(需要时)来调用执行。 优点(为什么要用存储过程?):  ①将重复性很高的一些操作,封装到一个存储过程中,简化了对这些SQL的调用  ②批量处理:SQL+循环,减少流量,也就是“...

2018-07-24 21:29:15 249

原创 详解 Python 单例模式

一、单例模式单例模式是应用开发过程中最简单同时也是最著名的一种创建型设计模式。单例模式提供了一个类只有一个特定类型的对象的机制。通常应用于场景为:日志记录、数据库操作等,程序运行时只能生成一个实例,避免对同一资源产生冲突的访问请求。二、如何设计单例模式(1)重写构造函数__new__方法class Singleton(object):    def __new__(sel...

2018-07-24 15:51:21 272

原创 认识和使用HTTP-Referer

什么是Referer?Referer  是  HTTP  请求header 的一部分,当浏览器(或者模拟浏览器行为)向web 服务器发送请求的时候,头信息里有包含  Referer  。比如我在www.sojson.com 里有一个www.baidu.com 链接,那么点击这个www.baidu.com ,它的header 信息里就有:    Referer=http://www.sojs...

2018-07-23 10:27:19 603

原创 Cookies和Session的区别和理解

官方理解: cookie机制Cookies是服务器在本地机器上存储的小段文本并随每一个请求发送至同一个服务器。IETF RFC 2965 HTTP State Management Mechanism 是通用cookie规范。网络服务器用HTTP头向客户端发送cookies,在客户终端,浏览器解析这些cookies并将它们保存为一个本地文件,它会自动将同一服务器的任何请求缚上这些coo...

2018-07-21 16:03:39 1295

原创 Django---超好用的web框架

1. url 理解url :   统一资源定位符。是对可以从互联网上得到的资源的位置和访问方法的一种简洁的表示,是互联网上标准资源的地址。互联网上的每个文件都有一个唯一的URL,它包含的信息指出文件的位置以及浏览器应该怎么处理它。基本URL包含模式(或称协议)、服务器名称(或IP地址)、路径和文件名.2. MVC简介1)大部分开发语言中都有MVC框架2)MVC框架的核心思想是:解耦...

2018-07-21 15:43:57 848

原创 MongoDB使用方法

1.MongoDB介绍 MongoDB 是由C++语言编写的,是一个基于分布式文件存储的开源数据库系统。在高负载的情况下,添加更多的节点,可以保证服务器性能。MongoDB 旨在为WEB应用提供可扩展的高性能数据存储解决方案。MongoDB 将数据存储为一个文档,数据结构由键值(key=>value)对组成。MongoDB 文档类似于 JSON 对象。字段值可以包含其他文...

2018-07-21 15:41:21 221

原创 强大的Python库之Pandas

1 简介和使用场景Python Data Analysis Library 或 pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。2 ...

2018-07-20 18:22:52 414

原创 简单算法:二分查找概念 和 Pyhton应用

       概念:  二分查找又称折半查找,优点是比较次数少,查找速度快,平均性能好,占用系统内存较少;其缺点是要求待查表为有序表,且插入删除困难。因此,折半查找方法适用于不经常变动而查找频繁的有序列表。首先,假设表中元素是按升序排列,将表中间位置记录的关键字与查找关键字比较,如果两者相等,则查找成功;否则利用中间位置记录将表分成前、后两个子表,如果中间位置记录的关键字大于查找关键字,则进一...

2018-07-19 11:47:13 333

原创 Redis详解

Redis 简介Redis 是完全开源免费的,遵守BSD协议,是一个高性能的key-value数据库。Redis 与其他 key - value 缓存产品有以下三个特点:Redis支持数据的持久化,可以将内存中的数据保存在磁盘中,重启的时候可以再次加载进行使用。 Redis不仅仅支持简单的key-value类型的数据,同时还提供list,set,zset,hash等数据结构的存储。...

2018-07-19 09:10:35 422

原创 MySql简单认识和操作

一.  mysql介绍:查看数据库排名:  https://db-engines.com/en/ranking当前使用的数据库,主要分为两类:o 文档型,如sqlite,就是一个文件,通过对文件的复制完成数据库的复制o 服务型,如mysql、postgre,数据存储在一个物理文件中,但是需要使用终端以tcp/ip协议连接,进行数据库的读写操作    关系型数据库MySQL,非关...

2018-07-19 08:53:27 212

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除