python-jieba分词-对比字符串相似度

最新推荐文章于 2024-02-23 14:46:08 发布

VIP文章食我大招啦

最新推荐文章于 2024-02-23 14:46:08 发布

阅读量1.8k

点赞数 3

分类专栏：数据处理文章标签： python 分词

本文链接：https://blog.csdn.net/qq_43692386/article/details/101364229

版权

接到一个需求，对比数据库中酒店名字相似度

那么说干就干，这里在网上进行查询，jieba分词十分符合我们的需求，那么看了一些例子之后开始写demo。
代码如下

import jieba
import numpy as np
import pymysql




class Similarity():
    def __init__(self):
        self.db = pymysql.connect(host='localhost', port=3306, user='root',
                             passwd='123456', db='dazhong', charset='utf8mb4')
        self.cursor = self.db.cursor()

    def get_word_vector(self, word1, word2):
        cut1 = jieba.cut(word1)
        cut2 = jieba.cut(word2)
        list_word1 = (','.join(cut1)).split(',')
        list_word2 = (','.join(cut2)).split(',')
        # 列出所有的词,取并集
        key_word = list(set(list_word1 + list_word2))
        # 给定形状和类型的用0填充的矩阵存储向量
        word_vector1 = np.zeros(len(key_word))
        word_vector2 = np.zeros(len(key_w

最低0.47元/天解锁文章

优惠劵

食我大招啦

关注关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
python-jieba分词-对比字符串相似度

接到一个需求，对比数据库中酒店名字相似度那么说干就干，这里在网上进行查询，jieba分词十分符合我们的需求，那么看了一些例子之后开始写demo。代码如下import jiebaimport numpy as npimport pymysqlclass Similarity(): def __init__(self): self.db = pymysql....
复制链接

扫一扫