文本相似度
呜啦吧哈
这个作者很懒,什么都没留下…
展开
-
运用Python+Word2vec实现文本相似度
运用Python+Word2vec实现文本相似度// An highlighted blockimport pymssqlimport pandas as pdimport jieba#from gensim import corpora, models,similarities#import numpy as np#import nltkfrom gensim.models.wo...原创 2020-03-02 15:37:18 · 772 阅读 · 0 评论 -
基于词频统计的文本相似度
基于词频统计的文本相似度// An highlighted block# -*- coding: utf-8 -*-"""Created on Fri Oct 26 14:29:01 2018@author: 呜啦吧哈"""import pymssqlimport pandas as pdimport jieba#import jieba.analyse as anaim...原创 2018-11-20 10:26:47 · 1568 阅读 · 3 评论 -
文本去重
删除根据文章标题删除重复文章:eg:头脑风暴 —— 创新药投资及研发成功率的思考 头脑风暴丨创新药投资及研发成功率的思考 迈博斯生物与奕安济世生物药业合并成立Transcenta Holding,加速推进建设国际化整合型生物制药公司 官宣!迈博斯生物与奕安济世生物药业合并成立 Transcenta Holding,加速推进建设国际化整合型生物...原创 2019-01-04 15:19:03 · 896 阅读 · 0 评论