自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小白

从零开始爬,猜猜我会走多远?

原创 新闻类型分类

分类问题Demo 这应该是我能想到最简单的方法惹, 应该是我能想明白的 emm 这中不仅仅用于新闻分类,可以扩展为 标签分类。 这里仅用新闻做实验 鬼知道我参考了多少博客, 一个能直接跑起来的都没有 ,非常抱歉博客参考太多找不到了 思路 通过不同种类新闻提出关键词 使用gensim 训练 建立...

2019-09-16 10:34:43 2363 0

原创 Java面向对象基础

文章目录JAVA 基础 面向对象什么是成员变量、局部变量、静态变量成员变量示例局部变量示例静态变量示例成员变量和静态变量的区别一句话 private 和 public构造方法例如通过构造方法初始化参数this 关键字示例一: 通过this区分成员变量 用于赋值示例二: 通过this访问成员方法静...

2019-05-10 01:22:38 79 0

原创 初探Python内存

Python中的堆栈内存 以我的理解: python解释器中也开辟了堆栈,栈是用于存放指令集的,而堆是存放变量的 Python内存分配 以512字节为阙值分为大小对象,大对象直接分配内存,小对象使用专用内存分配器。小对象按固定长度对齐后,再分成不同类别,以便于复用和管理。 首先,向系...

2018-07-19 09:18:59 1537 0

原创 redis

Redis 基础 redis是什么 redis是一个开源的、使用C语言编写、支持网络交互、可持久化的Key-Value数据库 它通常被称为数据结构服务器 数据模型 Redis的外围由一个键、值映射的字典构成。与其他非关系型数据库主要不同在于:Redis中的值的类型不仅限于字符串,...

2018-06-08 14:41:18 237 0

原创 restframework(二)

restframework 认证 基础使用 class Authentication(BaseAuthentication): """用户验证""" def authenticate(self, requ...

2018-05-23 20:32:22 606 1

原创 restframework(一)

restframework restframework是django对restful架构扩展的第三方库 restful架构 主要原则 网络上的所有事物都被抽象成为资源 每个资源都有唯一的资源标识符 同一个资源具有多种表现形式(xml, json等) 对资源的各种操作不会修改资源标...

2018-05-22 14:41:15 5662 0

原创 ModelForm

ModelForm Model可以理解为数据库,Form是Form组建, ModelForm一个Form组建的扩展类,可直接关联Model, 也就是说会有强耦合。但是用起来简单哇 举个栗子 先直接看例子吧 model.py class User(models.Model): ...

2018-04-28 11:51:29 279 0

原创 ajax解决csrf

ajax跨站请求 方式一 $.ajax({ url: "/cookie_ajax/", type: "POST", data: { "username": "Q1mi", &qu...

2018-04-08 23:12:23 1794 0

原创 前端插件sweetalert

一个比较好看的弹窗插件 ——收集记录 提示框内容比较好看 还有动画。里面function中可以写ajax代码 进行前后端交互 这是一个bootstrap的扩展。在github上发现的 只需导入 sweetalert.js 和 sweetalert.css 当然 还有bootstrap.cs...

2018-04-08 22:48:36 308 0

原创 Django ORM相关操作

ORM 相关操作 十三条常用方法 方法 解析 返回类型 all() 查询所有结果 返回QuerySet filter(**kwargs) 它包含了与所给筛选条件相匹配的对象 返回QuerySet get(**kwargs) 返...

2018-04-08 21:51:26 384 0

原创 Django ORM基础

Django ORM ORM介绍 ORM概念 对象关系映射(Object Relational Mapping,简称ORM)模式是一种为了解决面向对象与关系数据库存在的互不匹配的现象的技术。 简单的说,ORM是通过使用描述对象和数据库之间映射的元数据,将程序中的对象自动持久化到关系...

2018-04-08 21:50:47 175 0

原创 分页工具

功能 主要文件在utils-paging.py 自己写的简单的分页 为了可扩展前端样式,并没有自动生成 分页代码仅将其 进行封装 配合前端的模版代码使用 API Paging(page_now, data, page_nub=11, page_index=10) :param pa...

2018-04-06 17:11:24 289 2

原创 08-requests库的基础入门

requests库的基础入门 r = requests.get(url) # r 是Response 信息 # get请求的是Request信息 Response对象包含爬虫返回的内容 Response对象的属性 属性 说明 r.status_code HTTP请求的返回状...

2018-03-29 09:09:11 193 0

原创 列表推导式总结

list1 = [11, [22, 3], [4, ], [55, 66], 8, [9, [7, [12, [34, [26]]]]]] 如这个list 如何将这些中括号去掉 去括号,要知道一句话字符串操作要比类型操作容易。 所以我的第一反应是 li = str(list1).rep...

2018-03-27 19:15:18 1073 0

原创 装饰器的一些使用方法

装饰器的一些使用方法 在类中写装饰器 方式一: class Foo: def __init__(self): self.name = 'CharmNight' def inners(funcs): def in...

2018-03-25 18:45:15 498 0

原创 selenium小玩具

selenium小玩具 selenium是一个自动化的工具,之前写过一次爬虫,感觉挺好玩的。 根据Excel表格中的数据自动填入网页中,需求就是这个。一开始感觉挺简单的,写起来也挺简单的,demo也挺好,就是在用真实数据跑的时候各种BUG··· 想法和现实的差距太大了 实现思路 需要...

2018-03-24 23:09:25 171 0

原创 Python爬取百度图库

Python爬取百度图库 页面分析 通过Chrome 的开发者模式,我们可以很发现 百度图库是通过ajax 加载图片的。 每一次都会发送一个请求:https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&a...

2018-03-20 23:26:06 991 0

原创 07-Selenium基础

Selenium 自动化测试工具, 支持多种浏览器。 爬虫中主要用来解决JavaScript渲染的问题 驱动浏览器来做各种动作(跳转、查询、……)——支持主流浏览器 模拟浏览器访问,拿到浏览器渲染后的页面 安装 pip install selenium 基本使用 from...

2018-03-17 15:09:51 179 0

原创 06-pyquery基础

PyQuery 强大又灵活的网页解析库。如果你觉得正则写起来太麻烦,如果你觉得BeautifulSoup语法太难记,如果你熟悉jQuery的语法,那么PyQuery就是你的绝佳选择。 初始化 字符串初始化 html = """ <di...

2018-03-17 15:09:24 372 0

原创 05-BeautifulSoup基础

BeautifulSoup 方便又灵活的网页解析库,处理高效,支持多种解析器。 利用它不用编写正则表达式即可方便的实现网页信息的提取 html = """ <html><head><tit...

2018-03-17 15:09:00 143 0

原创 04-正则表达式练习

正则表达式 什么是正则表达式 正则表达式是对字符串操作的一种逻辑公式,就是用事先定好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑 正则表达式非Python独有, re模块实现 常见匹配模式 re.match...

2018-03-17 15:08:36 214 0

原创 03-Requests库

Requests库 Requests库是基于urllib库的基础上创建出来的,相对更加方便。 安装Requests库 pip install requests 引入实例 import requests response = requests.get('...

2018-03-17 15:07:56 214 0

原创 02-Urllib库基础

Urllib库 什么是Urllib库 Python 内置的HTTP请求库 1. urllib.request 请求模块 2. urllib.error 异常处理模块 3. urllib.parse url解析模块 4. urllib.robotparser r...

2018-03-17 15:06:54 149 0

原创 01-爬虫基础概念

什么是爬虫 请求网站并提取数据的自动化程序 Request 与 Response 浏览器就发送消息给该网址所在的服务器,这个过程叫做HTTP Request 服务器收到浏览器发送的消息后,能够根据浏览器发送消息的内容,做相应处理,然后把消息回传给浏览器。这个过程叫做HTTP Res...

2018-03-17 14:54:32 1082 0

原创 Mysql索引

Mysq索引 什么是索引 索引在MySQL中也叫做“键”,是存储引擎用于快速找到记录的一种数据结构。索引对于良好的性能 非常关键,尤其是当表中的数据量越来越大时,索引对于性能的影响愈发重要。 索引优化应该是对查询性能优化最有效的手段了。索引能够轻易将查询性能提高好几个数量级。 简单的...

2018-03-04 19:51:09 167 0

原创 MySQL约束

MySQL约束 五种完整性约束 约束是一种限制,他通过对表的行或列的数据做出限制,来确保表的数据的完整醒、唯一性 非空约束 NOT NULL:非空约束 指定某列不能为空 创建一个非空约束 create table db1( id int not null...

2018-03-03 19:37:55 735 0

原创 MySQL全家桶

MySQL全家桶 视图 视图:是一个虚拟的表,其内容由查询定义。同真实表一样,视图包含一系列带有名称的列和行的数据 视图是虚拟表,本身不存储数据,而是按照指定的方式进行查询 视图的特点 视图的列可以来自不同的表,是表的抽象和逻辑意义上建立的新关系。 视图是由基本表(实表)产生的...

2018-03-02 23:15:10 477 0

原创 SQL逻辑查询语句执行顺序

SQL逻辑查询语句执行顺序 SQL语句定义顺序 看一段伪代码 SELECT DISTINCT <select_list> FROM <left_table> <join_type> JOIN &...

2018-02-28 21:16:12 156 1

原创 MySQL数据库——基础操作

MySQL数据库——基础操作 命名规范 可以由字母、数字、下划线、@、#、$ 区分大小写 唯一性 不能使用关键字如: CREATE SELECT 不能单独使用数字 最长128位 MySQL 的语法不区分大小写 数据库操作 创建数据库 语法 #语法: CREAT...

2018-02-28 21:15:20 230 0

原创 mysql数据库安装

mysql基础概念 概述 数据库(Database,简称DB)   数据库技术是计算机应用领域中非常重要的技术,它产生于20世纪60年代末,是数据管理的最新技术,也是软件技术的一个重要分支。   简单的说,数据库就是一个存放数据的仓库,这个仓库是按照一定的数据结构(数据结构是指数据...

2018-02-28 21:13:28 226 0

原创 Python 魔术方法小结

Python 类中的双下方法 从常用的开始:快被自己蠢哭了 一、 _ _ init __ 实例化对象时调用 class Foo: def __init__(self,name): self.name = name f = Foo('CharmN...

2018-02-23 22:42:44 1709 0

原创 python偏函数编程

python偏函数编程 对于Python,简洁是一个核心原则,在python2.5以后引入了一个概念——偏函数 为什么要使用偏函数 当然是为了简洁啦~更好的支持DRY编程原则 (DRY编程原则是指强调不要写重复代码) 如果我们定义了一个函数,需要4个参数,上层有很多函数需要调用这个函...

2018-02-21 01:38:45 201 0

原创 ctypes——模块

ctypes 声明——以下代码均在python3.6下测试执行的 初识 msvcrt.printf只打印一个字符 python3.x中 import ctypes msvcrt = ctypes.cdll.msvcrt message_string = 'Hel...

2018-02-19 23:08:19 5033 0

原创 random——模块

random——产生伪随机数 模块用途 random 模块是为各种分布实现伪随机数发生器。 几乎模块中所有函数都依赖于基本函数random(),它在半开放范围[0.0,1.0)内产生一个统一的随机浮点数。Python使用Mersenne Twister作为核心生成器。它生成53位...

2018-02-14 18:02:39 5169 0

原创 bisect——模块

bisect ​ ——这是一个python的针对有序 数组的插入和排序操作的一个模块 首先看看bisect这个模块中都有什么方法吧 import bisect [print(i) for i in dir(bisect)if i.find('__') ==...

2018-02-14 16:32:52 7568 0

转载 python PEP8规范

python PEP8规范 1、    代码布局设计 1.1    缩进 使用四个空格来进行缩进  换行的时候可以使用反斜杠,最好的方法是使用园括号,在使用反斜杠的时候,在反斜杠的后直接回车,不能有任何空格存在 比较好的做法如下: 对准开始的分隔符: # Aligned...

2018-02-04 18:53:11 247 0

原创 dis模块——神奇的字节码

dis模块 入门 Python代码先翻译成字节码,又由Python虚拟机来执行字节码,python的字节码类似汇编指令的中间语言,一个Python语言会对用若干字节码指令,虚拟机一条条执行指令,从而完成程序的执行 Python dis 模块支持对Python代码进行反汇编, 生成字节码指令。 ...

2018-02-04 12:36:07 697 0

原创 整理一些小知识点

随机更新 自启动目录 是登录自己用户时才能开机启 C:\Users\Night\AppData\Roaming\Microsoft\Windows\Start Menu\Programs\Startup 把文件拷贝进去 登录所有用户时都能开机启动 C:\ProgramData\Microso...

2018-01-28 02:20:03 133 0

转载 logging

logging 库采用模块化的方式提供了几种类型的组件:loggers,handlers,filters,formatters。 Loggers 暴露了应用程序代码可以直接使用的接口 Handlers 发送日志记录(由 loggers 创建)到合适的目的地 Filters 提供了细粒度的方法...

2018-01-28 01:56:45 216 0

原创 面向对象

面向对象 初识面向对象 面向对象 什么都是对象,1是对象 ‘str’是对象 方法是对象 类也是对象,对象是一种体现,面向对象是一种思想。可以理解成:面向过程变成是在不停的搬砖,而面向对象编程是指点江山(分配任务),并不是一味的考虑怎么做,而是考虑如何分配。 面向对象,你就是上帝,上...

2018-01-27 20:19:24 120 0

提示
确定要删除当前文章?
取消 删除