机器学习进阶day1

最大似然估计的概念

最大似然估计就是在已知样本的前提下,找出使得样本发生最大的概率的参数值。
求解最大似然估计的步骤:
(1) 概率密度函数相乘得到似然函数
(2) 对似然函数取对数得到对数似然函数
(3) 对对数似然函数求导
(4)求解

赔率

公平赔率为概率的倒数
真实赔率为公平赔率×α(小于1的系数)

PCA的理解

实际操作,将样本在某个方向上进行投影,使得样本降维
主方向:使得在某个方向投影后的方差最大的方向称为PCA的主方向

One-hot编码

对一些文本类别转换成数值类型的数据,会导致样本特征膨胀
函数
pd.get_dummies(data)
get_dummies 是利用pandas实现one hot encode的方式
指定列进行one-hot编码
pd.get_dummies(df.列名)

pd.Categorical() 识别数据中的不同数据的个数
x.categories——返回类别
x.codes——返回序号

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值