算法进阶

数据清洗

庄家与赔率

赔率的举例定义:
张衡与张顺进行400米自由泳比赛,宋江开赌场坐庄,规定:张衡赢赔率为3,张顺赢赔率为2.假定不存在平局
赌徒李逵为张衡下注10两。
比赛结束后,若最终张衡赢,则宋江付赌徒李逵30两,赌本10两归庄家所有,即李逵赚20两;若张顺赢,赌本归庄家所有,李逵赔10两。
假定张衡赢的概率为0.8,宋江给出的赔率为张衡1.25,张顺为5,则宋江的盈亏分析如下假定所有赌徒中,共有a元买张衡,b元买张顺,则开赛前宋江收入为a+b元
开赛后的赔付期望为:
E(y) = 0.81.25a + 0.25b= a+b
综上所述,p为选手获胜概率,而赔率为1/p则庄家在期望上不赔不赚。称为公平赔率
而在实际生活中,庄家总是会将公平赔率乘以某小于1的系数k,定位真实赔率。
庄家对于k的取值不公开!!!

交通流模型

nagel-Schreckenberg交通流模型
路上有N辆车,以不同的速度向前行驶,模拟堵车问题。有以下假设:
假设某辆车的当前速度是v,若前方可见范围内没车,则它在下一秒的车速提高到v+1,直到达到规定的最高限速
若前面有车,前车的距离为d,且d<v,则它下一秒的车速降低到d-1
每辆车会以概率p随机减速v-1
在这里插入图片描述

模糊查询与替换

在这里插入图片描述

莺尾花数据集

在这里插入图片描述

主成分分析PCA

PCA的原理计算实例
1、问题的描述
在这里插入图片描述
这个是一个已经去掉均值的矩阵。其中每一行是一个维度,而每一列是一个样本。去均值的运算时针对每一个维度进行的运算,也就是说每一行减去这一行的均值
2、计算过程
2.1 计算协方差矩阵
由于已经进行了去均值化,所以可以直接求取协方差矩阵。需要注意的是,协方差矩阵计算的是每一个维度之间的协方差,不是计算样本之间的协方差,所以本例中的协方差矩阵为一个2x2的矩阵。
在这里插入图片描述
在这里需要注意的是,通过MATLAB计算协方差矩阵与手工计算有两点不同:
  (1) 这里前面乘以的是1515,这个是有偏估计,但是MATLAB计算的时候乘以的是1414,计算的是无偏估计。
  (2) 在 MATLAB 中,默认每一列是一个维度。所以如果输入原始的数据(2行5列)会返回一个5行5列的协方差矩阵。所以应该先对矩阵进行转置在求解协方差矩阵。
计算协方差的特征值和特征向量
通过求解方程
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

one-hot 编码

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值