自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 将程序部署到linux服务器上并自动化运行遇见的问题

一、Crontab简介首先用的是Crontab命令,crond 是linux下用来周期性的执行某种任务或等待处理某些事件的一个守护进程,与windows下的计划任务类似,当安装完成操作系统后,默认会安装此服务 工具,并且会自动启动crond进程,crond进程每分钟会定期检查是否有要执行的任务,如果有要执行的任务,则自动执行该任务。接着是一些指令:1. 创建或编辑crontab文件:...

2019-04-28 15:17:22 378

转载 正态分布

正态分布(概率密度函数)公式:正态分布应该是统计里面最重要的一个分布,也叫高斯分布,前面也提过,这是在连续随机变量的一种密度函数对该密度函数求定积分就会得到某一范围的概率值(即概率)。正态分布在实际生活中非常常见如一个人手指的生长长度,因为手指不会无限长,最终它会收敛到某一个值,增长的过程是一个连续的过程,因为你的手指是一厘米一厘米的长,在这一厘米之间还有无数个数值希望能理解这...

2018-08-13 21:56:27 722

转载 Bias(偏差)和Variance(方差)

Error = Bias^2 + Variance+Noisebias:反映的是模型在样本上的输出与真实值之间的误差,即模型本身的精准度,即算法本身的拟合能力variance:反映的是模型每一次输出结果与模型输出期望之间的误差,即模型的稳定性。反应预测的波动情况。简单的例子理解Bias和Variance想象你开着一架黑鹰直升机,得到命令攻击地面上一只敌军部队,于是你连打数十梭子,结...

2018-08-09 15:18:59 370

转载 推荐系统之隐语义模型(LFM)

一 基本概念LFM(latent factor model)隐语义模型,这也是在推荐系统中应用相当普遍的一种模型。那这种模型跟ItemCF或UserCF有什么不同呢?这里可以做一个对比:对于UserCF,我们可以先计算和目标用户兴趣相似的用户,之后再根据计算出来的用户喜欢的物品给目标用户推荐物品。而ItemCF,我们可以根据目标用户喜欢的物品,寻找和这些物品相似的物品,再推荐给用户。...

2018-08-06 21:28:45 223

转载 Bagging,Boosting,GBDT和RF

Boosistraping:意思是依靠你自己的资源,称为自助法,它是一种有放回的抽样方法,它是非参数统计中一种重要的估计统计量方差进而进行区间估计的统计方法。其核心思想和基本步骤如下:(1)采用重抽样技术从原始样本中抽取一定数量(自己给定)的样本,此过程允许重复抽样。(2)根据抽出的样本计算统计量T。(3)重复上述N次(一般大于1000),得到统计量T。(4)计算上述N个统计量...

2018-08-05 22:50:24 388

转载 对数学中的一些距离的理解

本文从公式上表述了欧几里得距离、曼哈顿距离、切比雪夫距离记忆闵可夫斯基距离之间的关系。一般而言,定义一个距离函数 d(x,y), 需要满足下面几个准则:1) d(x,x) = 0 // 到自己的距离为0 2) d(x,y) >= 0 // 距离非负 3) d(x,y) = d(y,x) // 对称性: 如果 A 到 B 距离是 a,那么 B 到 A 的距离也应该是 a 4) d...

2018-08-04 15:26:39 2595

原创 简单了解决策树

在一个随机事件中,某个事件发生的不确定度越大,熵也就越大,那我们要搞清楚所需要的信息量越大。在信息熵的定义中,假设两个随机变量x和y是相互独立的,那么分别观测两个变量得到的信息量应该和同时观测两个变量的信息量是相同的,我们用h()来表示信息量,即:h(x+y) = h(x) + h(y),比如小明今天失业了和今天失恋了是两个独立事件,单独一个一个知道和一起知道,对大家来说都挺好笑的,不是,对大...

2018-08-01 22:50:09 206

转载 简单理解贝叶斯公式

贝叶斯公式:给定一组所关心事件的先验概率,如果你收到新的信息,那么更新你对于事件发生概率的法则为: 某城市发生了一起汽车撞人逃跑事件,该城市只有两种颜色的车,蓝色15%,绿色85%,事发时有一个人在现场看见了,他指证是蓝车。但是根据专家在现场分析,当时那种条件能看正确的可能性是80%。那么,肇事的车是蓝车的概率到底是多少?令B是城市里车为蓝色的事件,G为车子是绿色的事件,E为观察到...

2018-07-30 22:44:39 46703 4

原创 Redis环境配置

百度Redis 菜鸟教程中选择Redis安装在Github上寻找资源,MSOpenTech/redis 选择要下载的版本安装RedisDesktopManager在Github上寻找资源

2018-07-16 15:57:34 162

原创 如何实现一台电脑安装Anaconda2和Anaconda3两个版本

操作步骤1.首先安装主版本,在这里我们选择Anaconda2,按照正常步骤安装即可,这里假定安装目录为D:\Anaconda2。2.在这一步打上那两个勾。第一个选项是将安装目录加入到系统的PATH环境变量中,以后在CMD中便可以直接用python命令启动python。 第二个选项是让其他IDE能够检测到Anaconda2并将Anaconda2作为默认的Python 2.7。安装好Anacond

2017-11-10 09:49:50 1770

原创 Scrapy爬取知乎用户信息遇见的问题

首先在将ROBOTSTXT_OBEY设置成False之后运行爬虫进行测试,发现错误,错误码为500.经检查发现是缺少User-Agent.在setting中找到DEFAULT_REQUEST_HEADERS,添加上User-Agent.再次运行爬虫,爬取成功。然后进行个人主页爬取,再次发现错误,错误码为401查询后发现是缺少请求头authoriz

2017-07-04 16:05:00 692 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除