计算两个属性名称的相似度(毕设第一周2016.1.9)

本文介绍了计算两个属性名称相似度的方法,包括词组拆分、对应匹配和使用同义词词林计算相似度。在词组拆分中,通过递归函数去除停用词。在对应匹配中,根据汉语特征为不同位置的词赋予不同权重。最后,利用同义词词林计算两词的相似度。
摘要由CSDN通过智能技术生成

1月9日,今天晚上实现了一个小的模块,感觉不错,记录一下。
实现了:计算两个属性名称的相似度
算法包括
- 对一个词组进行拆分
- 将两个词组对应起来
- 根据同义词词林计算两个词的相似度

1. 将一个词组拆分为几个意群
例如:“最喜欢的颜色”可以拆分为“最”、“喜欢”、“的”、“颜色”,进一步将停用词“的”删去。
算法主体部分为一个递归函数:

list strTolist(tstr){
if len(tstr) == 0: #递归基
    return []
for i=1 to len(tstr){#遍历字符串中每个字
    if tstr[:i] in worddict and tstr[:i+1] not 
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值