新的学期又开始了,又要开始更新博客了
和上学期不同的是这学期的科目少了许多的文科,取而代之的是相当多的数学课目,所以不得不把之前的高数书本,概率论书本和线性代数找了出来,开始复习,而且很多的内容都和概率论有关系,还好之前花了比较多的时间在概率论上
这周自然语言处理课程做了一个例题:
用到了一下公式
P(ABCDE)=P(A)P(B|A)P(C|AB)P(D|ABC)P(E|ABCD)
由此得二元语法模型P(ABCDE):
P(ABCDE)=P(A|BOS)P(B|A)P(C|B)P(D|C)P(E|D)P(EOS|E)
假设语料库有以下3个句子,计算P(BROWN READ A BOOK)
(“BROWN READ HOLY BIBLE”,
“MARK READ A TEXT BOOK”,
“HE READ A BOOK BY DAVID”)
P(BROWN READ A BOOK)
=P(BROWN|BOS) * P(READ|BROWN) * P(A|READ) * P(BOOK|A) * P(EOS|BOOK)
=(1/3) * 1 * (2/3) * (1/2) * (1/2)
=1/18