就不介绍整个过程了,说几个凉的点:
- 词频是怎么统计的
- emb到底是怎么做的
- auc
- pctr校准
- trie树
- 堆排序
词频统计是hadoop的map reduce做的
AUC 横坐标 真正率 = tp/(tp+fn)
纵坐标 假正率 = fp/(fp+tn)
阈值从1到0
trie树是真的麻烦啊
堆排序 这个我都好几次挂到这上面了 今天必须写出来
每天起来写一次堆排序 艹了
.
就不介绍整个过程了,说几个凉的点:
词频统计是hadoop的map reduce做的
AUC 横坐标 真正率 = tp/(tp+fn)
纵坐标 假正率 = fp/(fp+tn)
阈值从1到0
trie树是真的麻烦啊
堆排序 这个我都好几次挂到这上面了 今天必须写出来
每天起来写一次堆排序 艹了
.