NLP
文章平均质量分 85
anthea_luo
这个作者很懒,什么都没留下…
展开
-
看起来为空的字符串,长度却是1?
这一篇放在NLP下面 但其实与机器学习/神经网络没啥关系,不过广义上看 也是在"自然语言处理"中遇到的问题..linux下 发现一些奇怪的问题,看起来为空的字符串,长度却是1:控制台运行的部分代码如下:my_list = [][my_list.append(x) for line in qfl_df['text'] for x in jieba.cut(line) if len(x) == 1]my_counter = Counter(my_list) print(my_counter.原创 2022-01-23 18:05:16 · 1020 阅读 · 0 评论 -
LabeledSentence TaggedDocument TaggedLineDocument 区别 及doc2vec相关
在网上搜的一些doc2vec的例子,在处理数据时,有的用的LabeledSentence 也有用TaggedDocument 也有用TaggedLineDocument的。这几个名字长得好像,就搜了一下区别。大部分是讲 LabeledSentence TaggedDocument的区别,前者是老旧版本,不推荐使用,而推荐用后者。但 TaggedDocument TaggedLineDocument 的区别就搜不到了。翻源码看一下 就知道了:本人gensim 版本3.8.1L...原创 2021-06-11 13:35:28 · 1172 阅读 · 3 评论