自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 肘部法则和轮廓系数

一、肘部法则–聚类数量选择肘部法则的计算原理是成本函数,成本函数是类别畸变程度之和,每个类的畸变程度等于每个变量点到其类别中心的位置距离平方和(类内部的成员彼此越紧凑则类的畸变程度越小,越分散越大)。在选择类别数量上,肘部法则会把不同值的成本函数值画出来。随着值的增大,每个类包含的样本数会减少,于是样本离其重心会更近平均畸变程度会减小。随着值继续增大,平均畸变程度的改善效果会不断减低。值增大过程...

2020-02-12 15:32:44 12394 1

原创 算法学习

文档表示:向量空间模型(Vector Space Model,VSM):向量空间模型是一种将文档转化成向量的方式,向量中的每个元素是一个个的实数,每个元素对应着一个词(term),实数是通过tf-idf计算出来的。向量空间模型并没有考虑词与词之间的顺序,也没有抓住词与词之间的关系,它假设各个词之间是相互独立的。词嵌入:词嵌入是一种对文本算法学习后的表示形式,甚至,你可以理解为一个单词在算法...

2019-09-17 20:30:55 109

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除