1.问题描述
深度学习通常需要标注海量数据,比如标注1000张图,假设最大允许次品数量为10,检查数据是只抽取25%(250张图),在此假设条件下抽到次品的概率是多少?(0.94453)
2.排列定义
排列的定义:从n个不同元素中,任取m(m≤n,m与n均为自然数)个不同的元素按照一定的顺序排成一列,叫做从n个不同元素中取出m个元素的一个排列;从n个不同元素中取出m(m≤n个元素的所有排列的个数,叫做从n个不同元素中取出m个元素的排列数
排列数-n件产品按顺序抽取m件产品的组合数,从10件商品中抽2件的排列数=10*9
A
n
m
=
n
∗
(
n
−
1
)
∗
(
n
−
2
)
.
.
.
(
n
−
m
+
1
)
=
n
!
(
n
−
m
)
!
A^m_n=n*(n-1)*(n-2)...(n-m+1)=\frac{n!}{(n-m)!}
Anm=n∗(n−1)∗(n−2)...(n−m+1)=(n−m)!n!
A
2
10
=
10
∗
9
=
90
A^{10}_2=10*9=90
A210=10∗9=90
3.组合定义
组合的定义:从n个不同元素中,任取m(m≤n)个元素并成一组,叫做从n个不同元素中取出m个元素的一个组合;从n个不同元素中取出m(m≤n)个元素的所有组合的个数,叫做从n个不同元素中取出m个元素的组合数。
C
n
m
=
n
∗
(
n
−
1
)
∗
(
n
−
2
)
.
.
.
(
n
−
m
+
1
)
1
∗
2
∗
3...
m
=
n
!
(
n
−
m
)
!
(
m
!
)
C^m_n=\frac{n*(n-1)*(n-2)...(n-m+1)}{1*2*3...m}=\frac{n!}{(n-m)!(m!)}
Cnm=1∗2∗3...mn∗(n−1)∗(n−2)...(n−m+1)=(n−m)!(m!)n!
C
2
10
=
10
∗
9
2
∗
1
=
45
C^{10}_2=\frac{10*9}{2*1}=45
C210=2∗110∗9=45
4.计算代码及公式
设商品数量为N,次品数量为M,抽取数量Ck
抽到k件次品概率 = 抽k件次品组合数*抽Ck-k正常商品组合数/抽Ck件商品组合数
抽
到
k
件
次
品
概
率
=
C
M
k
∗
C
N
−
M
C
k
−
k
/
C
N
C
k
抽到k件次品概率 =C^k_M*C^{Ck-k}_{N-M}/C^{Ck}_{N}
抽到k件次品概率=CMk∗CN−MCk−k/CNCk
clc
clear
close all;
%%
%排列的定义:从n个不同元素中,任取m(m≤n,m与n均为自然数,下同)
%个不同的元素按照一定的顺序排成一列,叫做从n个不同元素中取出m个元素的一个排列;
%从n个不同元素中取出m(m≤n)个元素的所有排列的个数,叫做从n个不同元素中取出m个元素的排列数
%排列数-n件产品按顺序抽取m件产品的组合数 A 10,2 10*9
%n*(n-1)*(n-2)*(n-m+1) ----n!/(n-m)!
%组合的定义:从n个不同元素中,任取m(m≤n)个元素并成一组,叫做从n个不同元素中取出m个元素的一个组合;
%从n个不同元素中取出m(m≤n)个元素的所有组合的个数,叫做从n个不同元素中取出m个元素的组合数。
%n!/(n-m)!/m!,C10,2 = 10*9/2*1
%%
%问题1,100件产品中存在10件次品,抽取10次,抽到次品的概率为多少?
%抽1件次品到10件次品概率累加
%抽1件次品概率为C(10,1)*C(100-10,9)/C(100,10)
p=0;
N=1000;%商品数量
M=10;%次品数量
CK=250;%抽取数量
for k=1:CK
if k>M
pi=0;
else
%抽到k件次品概率 = 抽k件次品组合数*抽CK-k件正常商品组合数/抽CK件商品组合数
pi = nchoosek(M,k)*nchoosek(N-M,CK-k)/nchoosek(N,CK);
end
disp(pi);
p = p + pi ;
end
disp(['抽到存在次品的概率:' num2str(p)]);
%抽到存在次品的概率:0.94453