自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 字符串列表字典集合函数方法

2018-12-28 19:30:29 138

原创 ***HTTP响应状态码大全***

HTTP响应状态码大全1xx : 信息100 : Continue服务器接收到部分请求,一旦服务器未拒绝该请求,客户端应继续发送其余请求;101 :Switching Protocols 服务器转换协议(服务器将遵从客户端的请求转换到另外一种协议)2xx : 成功200 : OK 请求成功(紧随GET和POST请求的应答文档);201 : Created 请求被创建完成,同时新的资源被...

2018-12-20 19:56:16 142

原创 Cookie和Session的定义和区别

Cookie 和 Session 定义和区别一、定义Cookie概念:访问网站后再本地存储的相关网站信息;是服务器再本地机器上存储的文本,并随着每一个请求发送到同一服务器上,是客户端保存状态的一种方式。Cookie的内容包括:名字,值,过期时间,路劲和域。路劲和域:构成cookie的作用范围过期和时间:表示当前cookie的生命周期为浏览器会话期间,关闭浏览器则cook...

2018-12-20 13:29:02 322

原创 windows7-64/mysql-8.0.13-winx64跳过密码并重置

1、在bin目录下打开命令窗,输入命令:net stop mysql,停止服务;2、(开启跳过密码验证登录)输入命令:mysqld --console --skip-grant-tables --shared-memory;3、在bin目录下打开新的命令窗,无密码登录,输入命令:mysql -u root -p;4、将密码设置为空>>>            先选...

2019-01-18 19:44:17 1297

原创 Scrapy-Redis分布式案列

###实现代码# -*- coding: utf-8 -*-import scrapyfrom ..items import ShengshiItemfrom scrapy_redis.spiders import RedisSpiderclass ShengshiSSpider(RedisSpider): name = 'shengshi_s' # allowed...

2019-01-07 15:12:57 143

原创 matplotlib绘制sin函数

import numpy as npimport matplotlib.pyplot as plt设置画布大小,添加子图fig = plt.figure(figsize=(4, 4))plt.rcParams[‘font.sans-serif’]=‘SimHei’ #改字体plt.rcParams[‘axes.unicode_minus’]=False #唯一编码Falseax =fi...

2019-01-03 20:02:57 4151 1

原创 多线程编程

一、进程的基本概念1.进程(Process)是Windows系统中的一个基本概念,它包含了一个运行程序所需要的资源。(内存、配置文件、参数、变量等)2.一个运行着的应用程序在操作系统中就被视为一个进程,进程可以包含一个或多个线程。3.线程是操作系统分配处理器时间的基本单位,在一个进程中可以有多个线程同时执行代码。4.进程之间是相对独立的,一个进程无法访问另一个进程的数据(分布式计算除外)...

2019-01-02 22:28:59 96

原创 python格式化日期

格式化符号python中时间日期格式化符号:%y 两位数的年份表示(00-99)%Y 四位数的年份表示(000-9999)%m 月份(01-12)%d 月内中的一天(0-31)%H 24小时制小时数(0-23)%I 12小时制小时数(01-12)%M 分钟数(00=59)%S 秒(00-59)%a 本地简化星期名称%A 本地完整星期名称%b 本地简化的月份名称%B 本地...

2018-12-27 20:10:24 275

原创 爬虫常见的动态HTML

JsvaScriptJsvaScript 是网络上最常用也是支持者最多的客户端脚本语言,它可以收集用户的跟踪数据,不需要重载页面直接提交表单,在页面嵌入多媒体文件,甚至运行网页游戏;jQueryjQuery 是一个十分常见的库,70%最流行的网站和30%的其他网站都在使用,一个网站使用jQuery的特征,源代码里包含了jQuery入口:如果在网站上遇到jQuery,那么采集这个网站数据的...

2018-12-25 20:35:31 743

原创 网络协议http和https的区别

HTTP:是互联网上应用最为广泛的一种网络协议,是一个客户端和服务器端请求和应答的标准(TCP),用于从WWW服务器传输超文本到浏览器的传输协议,它可以使浏览器更加高效,使网络传输减少。端口:80HTTPS:是以安全为目标的HTTP通道,简单说是HTTP的安全版,即HTTP下加入SSL层,HTTP的安全基础是SSL,因此加密的详细内容就需要SSL。HTTPS协议的主要作用可分为两种:一种是...

2018-12-24 19:25:46 183

原创 BeautifulSoup 爬取案例

import requestsfrom bs4 import BeautifulSoupimport json一、获取页面内容def get_content(page):base_url = 'https://hr.tencent.com/position.php?'data = {'keywords': 'python', 'tid': 0, 'lid...

2018-12-24 19:15:02 293

原创 糗事百科实例

import requestsfrom lxml import etreepage=1 #爬取第一页base_url=‘https://www.qiushibaike.com/8hr/page/%d/’%page #请求地址headers={‘User-Agent’: ‘Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.3...

2018-12-22 20:25:36 146

原创 正则表达式在爬虫中的基础知识

正则表达式在爬虫的基础知识一、爬虫的四个主要步骤:1、明确目标(明确准备在哪个范围或者网站搜索)2、爬(将确定范围的网站内容全部爬下来)3、取(去掉无用处的数据)4、处理数据(按照要求将数据存储和使用)二、正则表达式定义1、正则表达式又称规则表达式,通常被用来检索,替换那些符合某个模式或规则的文本。2、对字符串操作的一种逻辑公式,组成一个“规则字符串”,用来表达对字符串的一种过滤逻...

2018-12-21 20:48:46 119

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除