Bag of words（matlab实现）

最新推荐文章于 2024-07-25 10:30:20 发布

每天读点paper

最新推荐文章于 2024-07-25 10:30:20 发布

阅读量5.6k

点赞数

分类专栏：图像处理and模式识别

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yiqiwangxi/article/details/48138645

版权

Bag of Words（BoW）通过K-means聚类训练样本，测试样本与类心比较生成直方图。例如，训练样本[a,b,c,d,e,f]聚类为6类，测试样本[a,b,c,d]生成直方图[1,1,1,1,0,0]。BoW结合K-means和Hard Voting，使用欧氏距离矢量化计算，适合作为入门学习。" 114687878,10535184,使用ALS算法预测用户音乐评分,"['推荐系统', '协同过滤', '矩阵分解', 'Java项目', '数据挖掘']

摘要由CSDN通过智能技术生成

Bag of Word主要思想：将训练样本特征Kmeans聚类，对测试样本的每个特征，计算与其最近的类心，相应类别计数count加1，这样每个测试样本可以生成ncenter维的直方图。

比如：训练样本特征a、b、c、a、d、f、e、b、e、d、c、f，如果类别数ncenter为6，则可以聚成6类[a,b,c,d,e,f]注意实际聚类时类心不一定为训练样本中特征，因为kmeans聚类更新类心时都重新计算。

假如一个测试样本特征为：a、b、c、d.那么经过BoW生成6维的直方图[1,1,1,1,0,0].

其实前面就是kmeans，然后Hard voting。关于kmeans不细说了，就是更新类心的过程，一直到类心变化在误差范围内。

kmeans聚类时用的训练数据中center个随机数据初始化，后面用的欧氏距离度量，其中计算欧氏距离时用了矢量化编程，加速运算。

最低0.47元/天解锁文章

每天读点paper

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

每天读点paper CSDN认证博客专家 CSDN认证企业博客

码龄13年

88: 原创

13万+: 周排名

193万+: 总排名

13万+: 访问

: 等级

2233: 积分

39: 粉丝

14: 获赞

10: 评论

23: 收藏

私信

关注

热门文章

分类专栏

最新评论

华为OJ（从单向链表中删除指定值的节点）
Deep Learning小舟: 好棒！（￣ˇ￣)
华为OJ（表达式求值）
倚楼观风雨: 如下两组数据处理有问题： 9+8)*7 //死循环 (9+8*7 //崩溃
华为OJ（放苹果）
T-MAC彤: return place_apple(m,m); 个人觉得这一步好像有点多余啊
华为OJ（查找兄弟单词）
Greatwall232: 博主你好，如果输入：3 abc aab aba abb 1 输出结果就会是3 aab。程序不能判断有重复字母的单词
华为OJ（素数伴侣）
前行的路上: 方法二的dp转移方程确实有问题（我是看不懂）。我用二分图解出来的结果确实和很网上很多人贴出来的dp解法答案不一样，经过验证，dp确实有问题。牛客上的判题也有问题，真是醉了。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。