- 博客(2)
- 收藏
- 关注
原创 机器学习——不同对象之间的相似性度量
机器学习中,常常需要估算不同对象之间的相似性度量(Similarity Measurement),我们通常采用的方法就是计算对象之间的“距离”(Distance)。对于不同的对象,采用的方法也是需要考虑的。本文主要列举集合、字符串和概率分布这三个对象下的相似性度量。希望对你了解估算相似度量有一个简单的理解。 1、度量两个集合之间的相似性 杰卡德相似系数是衡量两个集合相似度的一种指标。两个集合A和B...
2018-11-07 21:04:55
1632
原创 CentOS中对Hadoop使用JPS命令后没有DataNode出现
使用JPS命令后没有DataNode出现 问题可能发生原因: 多次格式化namenode所致。在执行文件系统格式化时,会在namenode数据文件夹(即配置文件中dfs.name.dir在本地系统的路径)中保存一个current/VERSION文件,记录namespaceID,标识了所格式化的 namenode的版本。如果频繁的格式化namenode,那么datanode中保存(即配置文件中...
2018-09-15 21:13:45
5469
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人