地址:
http://www.cs.princeton.edu/courses/archive/spr04/cos598B/bib/BroderCFM-minwise.pdf
在一些paper上有看到对oov的统计,有两种,一种是OOV_type(只关心OOV种类), 一种是OOV_token(次数)... 可参考这篇论文,这篇论文的实验中统计了两种数据
http://www.cs.umd.edu/~zqhuang/index_files/PCFGLA-feature-rich.pdf