深度学习
文章平均质量分 93
机器学习的一个分支
小王同学2024
这个作者很懒,什么都没留下…
展开
-
机器学习 - 聚类 (Clustering)
**K-均值**是最普及的聚类算法,算法接受一个未标记的数据集,然后将数据聚类成不同的组。**K-均值**是一个迭代算法,假设想要将数据聚类成n个组,其方法为:1. 首先选择$K$个随机的点,称为**聚类中心**(**cluster centroids**);2. 对于数据集中的每一个数据,按照距离$K$个中心点的距离,将其与距离最近的中心点关联起来,与同一个中心点关联的所有点聚成一类。3. 计算每一个组的平均值,将该组所关联的中心点移动到平均值的位置。重复步骤2、3直至中心点不再变化。原创 2021-09-21 18:51:27 · 976 阅读 · 0 评论 -
机器学习 - 支持向量机 (Support Vector Machines)
文章目录1. 优化目标2. 大边界的直观理解 (Large Margin Intuition)1. 优化目标这里的假设函数是缘自逻辑回归(Logistic),它也就是用到了 sigmoidsigmoidsigmoid 函数图像如上。其中, zzz 表示θTx\theta^TxθTx。在逻辑回归中:如果有一个 y=1y=1y=1的样本,希望hθ(x){{h}_{\theta }}\left( x \right)hθ(x) 趋近1,这样代价函数 JJJ 才会最小, 从而正确地将此样本分类。在 sigm原创 2021-09-17 09:07:02 · 217 阅读 · 0 评论 -
性能度量 - 对学习器泛化能力的评估
如何计算“测试误差”? 需要利用性能度量,例如:均方差,错误率等,即“测试误差”的一个评价标准。有了评估方法和性能度量,就可以计算出学习器的“测试误差”,但由于“测试误差”受到很多因素的影响,例如:算法随机性或测试集本身的选择。1. 最常见的性能度量 - 错误率与精度2. 查准率/查全率/F13. ROC与AUC4. 代价敏感错误率与代价曲线原创 2021-09-16 12:27:25 · 1664 阅读 · 0 评论