自然语言处理
轻羽羽
学编程的美食爱好者,
有问题欢迎邮件联系szysunyi@163.com
展开
-
自然语言处理---主要流程
# 小写化 # 分词 # 去停用词与无效高频词 # TF-IDF:学习一个词对文本的重要性 # 向量化:word2vec向量化词汇(产生词嵌入模型) # 词袋原创 2019-11-28 14:03:40 · 164 阅读 · 0 评论 -
自然语言处理---词袋
# https://blog.csdn.net/a40850273/article/details/81119103 ''' 词袋模型将一段文本作为一个个分离的词进行处理,通过不同类文本中可能出现词的差异对文本进行分类。必须指出的是对于文本分类,上下文对于其真正的类别有着强相关性。个人理解此类方法可能只是为了算法的简易性选择性地放弃了文本中的上下文信息,或者说只关注词频信息也能够获得符合要求的文...原创 2019-11-28 14:02:51 · 237 阅读 · 0 评论