自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 Python字符串之encode & decode

1. Encode将str类型编码成bytes类型:>>>strs = '中文English'>>>strs.encode('utf-8')b'\xe4\xb8\xad\xe6\x96\x87English'>>>strs.encode('gb2312') ...

2019-05-13 16:30:25 276

原创 正态分布、t分布、卡方分布、F分布的关系与差异

要理解这些分布,要从基础的正态分布开始。下面是维基百科对正态分布的介绍:正态分布(英语:normal distribution)又名高斯分布(英语:Gaussian distribution),是一个非常常见的连续概率分布。正态分布在统计学上十分重要,经常用在自然和社会科学来代表一个不明的随机变量。若随机变量 X服从一个位置参数为

2019-04-25 11:12:08 102378

原创 F检验的应用

对于正态总体来说,两个总体的方差比较可以用F-分布来检验:两个独立样本分别来自正态总体1(σ12)和正态总体来2(σ22), 其样本方差分别为S12 和S22。若σ12=σ22,则S12S22{\frac{S_1^2}{S_2^2}}S22​S12​​的抽样分布服从F分布,分子自由度为n1-1, 分母自由度为n2-1 。F的临界值取决于分子自由度为n1-1, 分母自由度为n2-1 和

2019-04-25 11:05:15 7716

原创 秒懂np.nonzero, np.argwhere, np.where

习惯用np.where,乍看到np.argwhere时没清楚干嘛又多个这玩意儿,干脆理一下。先创建样本数据如下:np.nonzero得到数据中非零值的索引数组,如果输入数据为list,则返回一个array,若为两维及以上数据,返回相应数量的array。np.argwhere如果仅输入数据,未设置条件,则相当于是np.nonzero的转置,即np.transpose(np.non...

2019-04-23 12:12:22 3940

原创 Mac 设置Virtualbox虚拟机Ubuntu14.04与主机互ping并联网

其实之前设置过一次,因手贱升级了Ubuntu到16.04导致无法登录虚拟机了,具体问题有机会再补充,避免再有人掉坑。。。重装回了Ubuntu14.04, 按先前理解的,主要是设置NAT和桥接网络让虚拟机与主机互ping且联网,但这次却老是不成功,懊恼不已!遂在网上又找了一通设置的方法,七七八八整很多,浪费不少时间,所以决定要整理好供参考。其实真很简单,大致分为三步:1. 设置NAT网络NA...

2019-04-18 15:45:37 786

原创 Softmax Regression损失函数的求导

softmax regression 代价函数: J(θ)=−1m[∑i=1m∑j=1kI{y(i)=j}logeθjTX(i)∑l=1keθlTX(i)]J(\theta) = -\frac{1}{m}\left[\sum_{i=1}^{m}\sum_{j=1}^{k}I\{y^{(i)}=j\}log \frac{e^{{\theta_j^T}{X^{(i)}}}}{\sum_{l=1}...

2019-03-31 17:09:13 765

原创 Lightgbm运行 OMP: Error #15: Initializing libomp.dylib, but found libiomp5.dylib already initialize

运行lightgbm 2.2.3时出现如下错误:OMP: Error #15: Initializing libomp.dylib, but found libiomp5.dylib already initialize下面有一段解释:OMP: Hint This means that multiple copies of the OpenMP runtime have been linke...

2019-03-26 14:54:35 1898

原创 最通俗易懂的p value讲解

什么是p value?这个问题,曾一度让我怀疑我根本都没有学懂知识,只是像规则一样记住然后胡乱使用而已。此番记录就当再次考验我是否真正理解到p value的含义。p value,代表在原假设条件下,实验事件可能发生的概率。举例说明:抛一枚硬币,正面朝上和反面朝上的概率是一样的,各50%,但这是有前提条件的,即硬币是均匀的(原假设),才能保证正反面出现的概率相同。现在将该硬币抛掷5次,那么在原假...

2019-03-24 09:45:45 35513 1

原创 决策树(二):CART回归树与Python代码

上一篇介绍了决策树的基本概念,特征划分标准及ID3、C4.5和CART分类树的算法,本文着重对CART回归树的内容进行补充。本文概览:首先介绍CART回归树的算法,然后是创建CART回归树的主要步骤,最后是实现该过程的Python代码。一、CART回归树算法CART回归树处理的是回归问题,数据集的标签不再是离散的类别值,而是一系列的连续值的集合。CART回归树不同于线性回归模型,不是通过...

2019-03-13 20:43:15 3256

原创 决策树:ID3、C4.5、CART算法与Python实现

一、决策树的基本概念决策树(Decision Tree)算法是一类常用的机器学习算法,在分类问题中,决策树算法通过样本中某一些属性的值,将样本划分到不同的类别中。决策树跟人在做决策的思考方式很想像,先考虑重点选项,不符合则可最优先做出决策。长得帅不帅才华横溢会认字教练级小白热爱早鸭子相亲对象有才吗?不去喜欢羽毛球吗?不去去喜欢游泳吗?去不去1. 划分标准在决定是否去见相亲对象时,该女提出...

2019-03-11 17:03:04 1455

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除