自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(37)
  • 收藏
  • 关注

原创 58同城字体解密函数(二)

from fontTools.ttLib import TTFontimport base64from io import BytesIOdef make_font_file(base64_string:str): #将base64编码的字体字符串解码成二进制编码 bin_data = base64.decodebytes(base64_string.encode()) ...

2018-11-30 16:33:01 1519 4

原创 58同城的字体解密(一)

在爬虫的时候,经常会遇到一些反爬机制,但在反爬中字体加密属于比较难解决的一部分。今天介绍一个比较简单的解密方法。1、首先找到加密的字体,打开58的一个链接:https://zz.58.com/pinpaigongyu/?utm_source=market&spm=u-LlFBrx8a1luDwQM.sgppzq_zbt&PGTID=0d100000-0015-67a3-d744...

2018-11-30 14:36:55 5410

转载 数据库三大范式详解

参考资料    https://blog.csdn.net/w__yi/article/details/19934319作者写的很好,调理清晰,不需要再进行整理。

2018-11-28 08:50:39 300

原创 Navicat Premium 12破解方法,亲测有效

1、按步骤安装Navicat Premium,如果没有可以去官网下载:http://www.navicat.com.cn/download/navicat-premium2、安装好后下载激活文件:https://pan.baidu.com/s/1kVgTd6R  提取密码:t1yp3、下载好后解压文件,可以看到如下目录:4、重启启动软件即可...

2018-11-27 15:49:32 4000 1

原创 Python基础面试题。很基础也特别容易被面试到。

1.HTTP和Session的区别http是用于从万维网服务器传输超文本到本地浏览器的传送协议。基于TCP/IP通信协议来传送数据,主要特点:【1、简单快速,请求方法:get,head,post,因为协议简单,使的HTTP服务器的程序规模小,通信速度快。2、灵活,HTTP允许传输任意类型的数据对象。3、无连接,限制每次连接只处理一个请求,服务器处理完请求,并受到客户的应答后,即断开连接,这种方式...

2018-11-24 08:52:50 394

转载 使用正则表达式匹配中国运营商手机号的正则表达式(不含港澳台地区)

匹配手机号码的正则表达式:^1([358][0-9]|4[579]|66|7[0135678]|9[89])[0-9]{8}$目前匹配号段中国电信号段133、149、153、173、177、180、181、189、199中国联通号段130、131、132、145、155、156、166、175、176、185、186中国移动号段134(0-8)、135、136、137、138、...

2018-11-23 22:14:08 2525

转载 基础才是王道——TCP/IP详解学习笔记 这位仁兄写得太好了

写的真的很棒,开头就感觉到了明显的不一样,瞬间对整个概念都有了一定的认知。http://www.cnblogs.com/fengzanfeng/articles/1339347.html   

2018-11-23 20:52:31 483

转载 详细解析Cookie和Session的作用和工作原理,适合新手学习

一、Cookie详解(1)简介因为HTTP协议是无状态的,即服务器不知道用户上一次做了什么,这严重阻碍了交互式Web应用程序的实现。在典型的网上购物场景中,用户浏览了几个页面,买了一盒饼干和两饮料。最后结帐时,由于HTTP的无状态性,不通过额外的手段,服务器并不知道用户到底买了什么。为了做到这点,就需要使用到Cookie了。服务器可以设置或读取Cookies中包含信息,借此维护用户跟服务器...

2018-11-23 20:02:29 341

转载 深度解析HTTP协议

HTTP简介HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网(WWW:World Wide Web )服务器传输超文本到本地浏览器的传送协议。HTTP是一个基于TCP/IP通信协议来传递数据(HTML 文件, 图片文件, 查询结果等)。HTTP是一个属于应用层的面向对象的协议,由于其简捷、快速的方式,适用于分布式超媒体信息系...

2018-11-23 18:57:43 618

转载 机器学习十大算法系类

https://blog.csdn.net/v_JULY_v/column/info/datamining

2018-11-22 21:30:00 222

原创 python线程安全队列

一直困扰我的问题,在博客园和CSDN中都查阅过资料,答案千奇百怪,查阅官网跟几位大牛交流后做了一个小总结:python中的list,dict,set,tuple都不是线程全队列。因为例如list在append()或者remove()的时候,资源是共享的,然后python没有在这些队列里面封装锁。但python中的queue队列属于线程安全,他底部封装了锁。所谓线程安全,就是一个线程在同一时...

2018-11-22 13:40:44 4440

原创 利用朴素贝叶斯分析鸢尾花,代码有详细解释。

#导入所需要的包from sklearn.naive_bayes import GaussianNBimport numpy as npimport pandas as pdfrom pandas import Series,DataFrameimport matplotlib.pyplot as pltfrom sklearn.datasets import load_irisf...

2018-11-21 20:51:49 9834 1

转载 numpy中np.c_和np.r_的区别

作者写的很好,简单明了。例子import numpy as npa = np.array([1, 2, 3])b = np.array([4, 5, 6])c = np.c_[a,b]print(np.r_[a,b])print(c)print(np.c_[c,a])np.r_是按列连接两个矩阵,就是把两矩阵上下相加,要求列数相等,类似于pandas中的concat(...

2018-11-21 20:16:31 321

原创 机器学习中numpy的meshgrid的理解和作用

刚开始学习numpy的时候,见到过一次meshgrid函数,当时没有深入理解,也不知道干涉么用的,在后面的i项目中见到好几次,然后查阅了一些好的博客,然后在这里自己做了一下总结。在项目中经常遇到这种情况,那么他什么意思和想要表达什么结果呢?x = np.linspace(xmin,xmax,300)y = np.linspace(ymin,ymax,300)xx,yy = np.m...

2018-11-21 20:08:18 1955

原创 Python面试题

1、Python是如何进行内存管理的?答:从三个方面来说,一对象的引用计数机制,二垃圾回收机制,三内存池机制一、对象的引用计数机制python内部使用引用计数,来保持追踪内存中的对象,所有对象都有引用计数。引用计数增加的情况:1,一个对象分配一个新名称2,将其放入一个容器中(如列表、元组或字典)引用计数减少的情况:1,使用del语句对对象别名显示的销毁2,引用超...

2018-11-20 22:48:40 77

原创 TCP滑动窗口机制

1、A与B之间通过三次握手四次挥手建立TCP连接。在报文的交互过程中,B将自己的缓冲区大小(为3)告诉给A,然后A也将自己的缓冲区大小发送给B,这样A与B都知道了彼此的缓冲区,即窗口大小。2、A开始发送数据,A知道B的缓冲区为3,然后连续发送三个数据,停止发送,等待B的相应。B接收数据,放到缓冲区里面,然后进程读取缓存区里的报文,读取一个,缓存区空出来一个,然后B向A发送相应,告诉A有一个...

2018-11-20 21:51:21 220

原创 机器学习中:autopct = '%0.3f%%',代表的意思。

a = '%3.1f%%'% 1000 # 1000.0%a = '%0.3f%%'% 1000 #1000.000%a = '%1.1f%%'% 100 #100.0%a = '%6.1f%%'% 100 #100.0%小数点前面的数字对产生的结果没有任何影响,小数点后面的数字表示保留小数点几位。...

2018-11-20 20:53:13 19559 4

原创 机器学习中,数据预处理:fit_transform()和transform()的区别

# 从sklearn.preprocessing导入StandardScaler from sklearn.preprocessing import StandardScaler # 标准化数据,保证每个维度的特征数据方差为1,均值为0,使得预测结果不会被某些维度过大的特征值而主导 ss = StandardScaler() # fit_transform()先拟合数据,再标准化...

2018-11-20 20:06:33 1034

原创 浅谈解析python线程安全锁问题

当多个线程几乎同时修改某一个共享数据的时候,需要进行同步控制线程同步能够保证多个线程安全访问竞争资源,最简单的同步机制是引入互斥锁。互斥锁为资源引入一个状态:锁定/非锁定。某个线程要更改共享数据时,先将其锁定,此时资源的状态为“锁定”,其他线程不能更改;直到该线程释放资源,将资源的状态变成“非锁定”,其他的线程才能再次锁定该资源。互斥锁保证了每次只有一个线程进行写入操作,从而保证了多线...

2018-11-20 16:09:47 252

原创 如何防止决策树过拟合的几种方法

一.什么是过度拟合数据?    过度拟合(overfitting)的标准定义:给定一个假设空间H,一个假设h属于H,如果存在其他的假设h'属于H,使得在训练样例上h的错误率比h'小,但在整个实例分布上h'比h的错误率小,那么就说假设h过度拟合训练数据.   overfittingt是这样一种现象:一个假设在训练数据上能够获得比其他假设更好的拟合,但是在训练数据外的数据集上却不能很好的拟合数...

2018-11-19 22:32:30 14553

原创 对方向导数和梯度的理解

在微积分课程中,我们知道函数在某一点的导数(微商)代表了函数在该点的变化率。微分和积分,它们的定义都是建立在极限的基础上。对于单变量函数f(x),它在x0处导数是:当x趋近于x0时,函数的改变量与自变量的改变量的比值的极限,即微商(导数)等于差商的极限 对于单变量函数,自变量只有一个,当x趋近于x0时只能在直线上变动,移动的方向只有左右两方。然而,对于多变量函数,自变量有多个,表示自...

2018-11-19 21:18:35 2246

原创 机器学习中正则化项L1和L2的直观理解

机器学习中几乎都可以看到损失函数后面会添加一个额外项,常用的额外项一般有两种,一般英文称作ℓ1ℓ1-norm和ℓ2ℓ2-norm,中文称作L1正则化和L2正则化,或者L1范数和L2范数。L1正则化和L2正则化可以看做是损失函数的惩罚项。所谓『惩罚』是指对损失函数中的某些参数做一些限制。对于线性回归模型,使用L1正则化的模型建叫做Lasso回归,使用L2正则化的模型叫做Ridge回归(岭回归)。...

2018-11-19 20:45:02 208

原创 机器学习Knn算法的理解与预测年收入阶段的项目Python代码实现。

最简单最初级的分类器是将全部的训练数据所对应的类别都记录下来,当测试对象的属性和某个训练对象的属性完全匹配时,便可以对其进行分类。但是怎么可能所有测试对象都会找到与之完全匹配的训练对象呢,其次就是存在一个测试对象同时与多个训练对象匹配,导致一个训练对象被分到了多个类的问题,基于这些问题呢,就产生了KNN。     KNN是通过测量不同特征值之间的距离进行分类。它的思路是:如果一个样本在特征空间...

2018-11-19 19:35:44 2369 2

转载 极大似然估计详解

https://blog.csdn.net/zengxiantao1994/article/details/72787849

2018-11-19 16:22:40 206

转载 机器学习算法中的过拟合与欠拟合

https://blog.csdn.net/u014696921/article/details/62883249##1

2018-11-19 11:53:50 195

原创 python中的yield函数的使用,并结合生产者与消费者案例。之前一直不太明白,就做了一个程序,依次执行,查看结果一目了然。

# encoding=utf-8#send函数与yield函数都是python中的内部封装函数,两者需要相结合使用#函数执行顺序:调用A,执行1,输出:要开始啃骨头了...,然后执行2,输出:consumer消费者A#执行到3,函数停止,因为没有send函数调用。#调用,执行1,输出:要开始啃骨头了...,然后执行2,输出:consumer消费者B#调用函数C,执行7,输出:正在生产...

2018-11-15 18:03:52 282

原创 在sqlite中创建表自增的时候报错:sqlite(near "AUTO_INCREMENT": syntax error)

SQLite中的自增关键字:AUTO_INCREMENT、INTEGER PRIMARY KEY与AUTOINCREMENTSQLite不支持关键字AUTO_INCREMENTAUTO_INCREMENT不生效的问题在SQLite中,自增字段需要使用关键字INTEGER PRIMARY KEY ...

2018-11-15 12:27:52 2955

原创 使用装饰器,查看函数的运行时间。深度解析python中对时间函数的使用

# Python time clock() 函数以浮点数计算的秒数返回当前的CPU时间。用来衡量不同程序的耗时,比time.time()更有用。# 这个需要注意,在不同的系统上含义不同。在UNIX系统上,它返回的是"进程时间",它是用秒表示的浮点数(时间戳)。# 而在WINDOWS中,第一次调用,返回的是进程运行的实际时间。而第二次之后的调用是自第一次调用以后到现在的运行时间。# (实际上...

2018-11-15 12:24:31 505

转载 简单理解正则化。

1. 正则化的目的:防止过拟合!2. 正则化的本质:约束(限制)要优化的参数。关于第1点,过拟合指的是给定一堆数据,这堆数据带有噪声,利用模型去拟合这堆数据,可能会把噪声数据也给拟合了,这点很致命,一方面会造成模型比较复杂(想想看,本来一次函数能够拟合的数据,现在由于数据带有噪声,导致要用五次函数来拟合,多复杂!),另一方面,模型的泛化性能太差了(本来是一次函数生成的数据,结果由于噪声的干...

2018-11-14 14:48:56 1189

原创 # 有一对兔子,从出生后第3个月起每个月都生一对兔子,小兔子长到第三个月 # 后每个月又生一对兔子,假如兔子都不死,问每个月的兔子总数为多少? # 分析后得:初始值是 1,1。从第3个数开始,每个数是

def tuzi_number(month): #range函数包前不包后 tuzi = [1,1] for i in range(1,month-1): if month <3: break #当month=4的时候,i= 1,2,然后x = tuzi数列的相加 else: ...

2018-11-12 22:48:15 154

原创 #输入年月日,输出该天是今年的第多少天

import datetimedef which_day(year,month,day): dt = datetime.date(year,month,day) du = dt.timetuple() print(du.tm_yday)#输入年月日year = int(input("请输入年份"))month = int(input("请输入月份"))day ...

2018-11-12 22:47:40 245

原创 清晰解读什么是RESTful API?

要弄清楚什么是RESTful API,首先要弄清楚什么是REST。REST -- REpresentational State Transfer,英语的直译就是“表现层状态转移”。如果看这个概念,估计没几个人能明白是什么意思。那下面就让我来用一句人话解释一下什么是RESTful:URL定位资源,用HTTP动词(GET,POST,PUT,DELETE)描述操作。     Resource:资源...

2018-11-09 13:12:09 208

原创 HTTP请求返回的数字代表的具体含义

一些常见的状态码为:  200 - 服务器成功返回网页  404 - 请求的网页不存在  503 - 服务器超时  下面提供 HTTP 状态码的完整列表。点击链接可了解详情。您也可以访问 HTTP 状态码上的 W3C 页获取更多信息。  1xx(临时响应)  表示临时响应并需要请求者继续执行操作的状态码。  100(继续)请求者应当继续提出请求。服务器返回此代码表示已...

2018-11-08 09:00:27 1147

原创 修改redis配置,使其他电脑能连接本机的redis数据库

在Ubuntu中,如果你的redis是编译的,直接在redis 下的redis.conf 文件中把 bind 127.0.0.1 注释掉,或者改为:bind 0.0.0.0,并将protected-mode yes   改为  protected-mode no如果redis是安装的话,输入whereis redis ,然后显示  /etc/redis   然后cd 到这个文件目录下,修改re...

2018-11-06 20:31:32 3931

转载 10分钟pandas教程

https://blog.csdn.net/Yan_Joy/article/details/78095115

2018-11-06 20:01:18 272

原创 在使用scrapy爬虫的过程中,在命令控制台输入scrapy crawl 项目名 出现报错:ModuleNotFoundError: No module named 'win32api'

解决办法:在cmd命令窗口输入:pip install pypiwin32

2018-11-02 14:09:54 897

原创 通过pip命令导出和导入Python环境安装包

导出Python环境安装包pip freeze > packages.txt这将会创建一个 packages.txt文件,其中包含了当前环境中所有包及各自的版本的简单列表(即pip list 所列出的包列表)安装导入Python环境包 pip install -r packages.txt场景:开发完一个自动化测试框架后,需要将该框架移植到另外一个系统去运行,但是很多的依赖包都是...

2018-11-02 12:18:10 652

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除