- 博客(2)
- 收藏
- 关注
原创 肘部法则和轮廓系数
一、肘部法则–聚类数量选择肘部法则的计算原理是成本函数,成本函数是类别畸变程度之和,每个类的畸变程度等于每个变量点到其类别中心的位置距离平方和(类内部的成员彼此越紧凑则类的畸变程度越小,越分散越大)。在选择类别数量上,肘部法则会把不同值的成本函数值画出来。随着值的增大,每个类包含的样本数会减少,于是样本离其重心会更近平均畸变程度会减小。随着值继续增大,平均畸变程度的改善效果会不断减低。值增大过程...
2020-02-12 15:32:44
12394
1
原创 算法学习
文档表示:向量空间模型(Vector Space Model,VSM):向量空间模型是一种将文档转化成向量的方式,向量中的每个元素是一个个的实数,每个元素对应着一个词(term),实数是通过tf-idf计算出来的。向量空间模型并没有考虑词与词之间的顺序,也没有抓住词与词之间的关系,它假设各个词之间是相互独立的。词嵌入:词嵌入是一种对文本算法学习后的表示形式,甚至,你可以理解为一个单词在算法...
2019-09-17 20:30:55
109
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人