定义在样本空间上的实值函数,称为随机变量。
如果随机变量的函数值是实数轴上独立的点(有限个或无限个),则称为离散型随机变量。
如果随机变量的函数值是实数轴上某个区间所有的点(区间可以是负无穷大到正无穷大),则称为连续随机变量。
找了一篇比较好的文章,有图文,帮助理解:
《随机变量》 https://www.jianshu.com/p/2149deee83fe
用一段代码来示例:
import numpy as np
import pandas as pd
randomNumbers = np.random.choice([1, 2, 3, 4, 5], size=100, replace=True, p=[0.3, 0.1, 0.2, 0.1, 0.3])
'''四个参数,a size replace p,其中a可以是列表或者是整数,size表示要生成的列表长度,replace表示是否可以出现同样的元素,p是指对应元素出现的概率'''
print(type(randomNumbers))
print(randomNumbers)
#离散型随机变量
ret = pd.Series(randomNumbers).value_counts()
print(type(ret))
print(ret)
#统计次数
ret = ret / 100
print(type(ret))
print(ret)
#统计概率分布
运行结果:
<class 'numpy.ndarray'>
[3 2 5 1 3 1 5 1 2 1 3 1 5 1 3 1 5 1 1 1 5 1 3 3 4 3 3 1 5 4 5 1 2 5 5 1 5
2 2 5 1 5 5 3 5 1 2 1 1 4 3 1 1 3 5 3 1 3 3 5 3 1 4 1 1 5 3 1 5 5 5 1 3 5
1 1 4 3 5 1 1 5 3 5 1 5 3 5 1 1 5 3 4 1 5 5 1 1 1 1]
<class 'pandas.core.series.Series'>
1 38
5 29
3 21
4 6
2 6
dtype: int64
<class 'pandas.core.series.Series'>
1 0.38
5 0.29
3 0.21
4 0.06
2 0.06
dtype: float64