对于机器学习,掌握数学的必要性在于更深入理解算法的思路,把数学的描述性基础交给机器,机器才最终有优化甚至创造精确的数学模型的可能。
Some Basic Mathematics for Machine Learning
尝试用自己的理解归纳一些基本的公理和应用。
概率加法:
公式:P(A U B) = P(A) + P(B) - P(AB)
典型:假设今天道-琼斯指数上升的概率为0.54, 明天上升的概率为0.52, 今明两天均上升的概率是0.28, 则道-琼斯指数在这两天内都不上升的概率是多少?
解答:另A为今天的上升事件, B为明天的上升事件
P(A U B) = P(A) + P(B) - P(AB)
= 0.54 + 0.52 - 0.28
= 0.78
P(!(A U B)) = 1- 0.78 = 0.22
条件概率
公式:P(A|B) = P(AB) / P(B)
典型: 赌大小游戏,设样本空间S= [{大,大},{大,小}, {小,小}, {小,大}]中的四个样本点出现的概率相等, 则在下面任一条件下,两次均为开大的条件概率为多少?
a) 第一次开大
b) 至少一次开大
解答:
a) P(A|B) = P(AB) / P(B)
= (1/4) / (2/4)
= 1/2
b) P(A|B) = P(AB) / P(B)
= (1/4) / (3/4)
= 1/3
典型: 市场上有16只股票,某日9只上升,7只下跌,若随机先后买入两只不同的股票,那买到两只均为上升的股票的概率是多少?
解答: 另B1, B2分别是第一只和第二只买入的股票。
P(B1B2) = P(B2|B1) * P(B1)
= 8/15 * 9/16
= 3/10
随机变量和期望值(均值)
伯努利随机变量
随机变量X只取1或0,且若X取1的概率为p,取0的概率为1-p,则这样的随机变量称为p的伯努利随机变量。(那不就是赌大小吗 ^…^)
二项随机变量
典型:还是赌大小,考虑玩n次,每次猜对的概率是p。随机变量X是猜对的次数,这个就是二项随机变量,其概率分布为: