几种文本相似度算法的C++实现

1、最小编辑距离

namespace levenshtein
{
bool compare_char_(char c1, char c2)
{
	return c1 == c2;
}

size_t ins_(char c)
{
	return 1;
}

size_t del_(char c)
{
	return 1;
}

size_t sub_(char c1, char c2)
{
	return compare_char_(c1, c2) ? 0 : 2;
}

size_t compare_(const std::string& ref_s, const std::string& ref_l)
{
	size_t len_s = ref_s.length();
	size_t len_l = ref_l.length();

	size_t** distance = new size_t*[len_s + 1];
	for(size_t i = 0; i < len_s + 1; ++i)
	{
		distance[i] = new size_t[len_l + 1];
	}

	distance[0][0] = 0;

	for(size_t i = 1; i < len_s + 1; ++i)
	{
		distance[i][0] = distance[i - 1][0] + del_(ref_s.at(i - 1));
	}

	for(size_t i = 1; i < len_l + 1; ++i)
	{
		distance[0][i] = distance[0][i - 1] + ins_(ref_l.at(i - 1));
	}

	for(size_t i = 1; i < len_s + 1; ++i)
	{
		for(size_t j = 1; j <
  • 1
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值