向量空间模型文档相似度计算实现（C#）

最新推荐文章于 2024-03-31 22:30:42 发布

Felomeng

最新推荐文章于 2024-03-31 22:30:42 发布

阅读量1.3w

点赞数 2

分类专栏：编程技术语言学研究 DotNet和Mono 文章标签：文档 c# dictionary string regex 优化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/felomeng/article/details/4023990

版权

本文档介绍了如何使用C#实现向量空间模型（VSM）来计算文档之间的相似度。提供了构造函数、相似度计算方法以及统计文档词频词典的方法。代码中包含了降维词表，可用于优化相似度计算效率。

摘要由CSDN通过智能技术生成

读者可以根据自己的需要进行加壳或改写，本文权当抛砖引玉。

笔者加的壳在：

http://download.csdn.net/source/1143450

VSM模型介绍：

http://blog.csdn.net/Felomeng/archive/2009/03/25/4024078.aspx

using System;

using System.Collections.Generic;

using System.Linq;

using System.Text;

using System.Text.RegularExpressions;

namespace Felomeng.VSMSimilarity

{

class SVMModle

{

/// <summary>

/// 降维词表

/// </summary>

private List<string> reducingKeys = new List<string>();

/// <summary>

/// 构造函数：使用降维表

/// </summary>

/// <param name="reducingKeys">降维词表</param>

public SVMModle(List<string> reducingKeys)

{

this.reducingKeys = reducingKeys;

}

最低0.47元/天解锁文章

关注

2
点赞
踩
15

收藏

觉得还不错? 一键收藏
10
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 10

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。