- 博客(2)
- 收藏
- 关注
原创 KNN算法对手写字体进行分类
距离它最近的5个样本中,有3个红色2个蓝色,所以最后待判样本会被判为红色这一类。如下图,图中现在有两类,一类是红色,另一类是蓝色,假设中间的方块是我们的待判样本点,现在我们需要判断方块属于那一类。最近邻的核心数学知识,就是距离的计算和权重的计算。我们把需要预测的点作为中心点,然后和它周围的一定半径内的已知点计算距离,挑选前。我们可以k取一个区间段的不同值,然后输出它的准确率,选取准确率最高的k的值。然后,将距离从小到大排序,找距离待判样本最近的k个样本,这里k等于3。首先,计算所有样本点到待判样本的距离。
2023-11-03 11:30:44 82
原创 sklearn决策树和随机森林分类
例:现在我需要做一个是否去逛街购物的决策,其中有几个因素共同影响我做这个决策:空余的时间、合适的天气、足够的资金和志同道合的伙伴。最后是是否有一起去的伙伴,如果有伙伴,那么就去,否则不去。如果做的是分类任务,就将n棵树的结果投票作为最后的输出结果,如果做的是回归任务,就将最后的n棵树的结果的均值作为最后的输出结果。第一,天气因素,如果是晴天,我们就打球,如果是雨天我们就不打球。第二,球场是否满员,如果满员,我们就不打球,如果不满员我们就打球。第三,是否需要加班,如果加班则不打球,如果不需要加班则打球。
2023-11-02 16:48:52 77
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人