- 博客(12)
- 收藏
- 关注
原创 2021-07-02
最近在写一个基于关键词的语义泛化系统的关键词提取部分。 想试试自己写TF-IDF和TextRank方法 因为没有学过python所以是边学边写,对文档转化不太了解,摸索了很久才搞好,搞好后又发现自己TF和IDF的计算用的都是一个文档,偏差很大,然后分出语料库和测试文档,再重写了循环。 之后又发现这样子每次都要算IDF,计算量太大,每次都得跑好几分钟才能跑完,然后把语料库的IDF计算结果打印成一个txt文档,下次计算IDF时就能直接用词查找相应的IDF值,不需要重复计算了。 整合完后,发现自己跑出的结果不算太
2021-07-02 14:50:58 63
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人