自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 《机器学习入门与实践-基于scikit-learn和Keras》课后习题答案-第三章

1. Logistic回归是根据一组给定的自变量来估计离散值,通过将数据拟合到预测函数来预测事件发生的概率。如果要预测一朵鸢尾花是哪种类型的,先获取已知鸢尾花类型的特征数据,再根据特征训练模型,最后用训练了的模型预测待判断类型的鸢尾花,可得该花朵的类型。(1) 模型假设自变量之间无线性关系,这种假设可能会导致多重共线性问题,从而影响模型的解释性和预测准确性。(3)模型忽略自变量之间的交互效应、这种忽略会导致基于存在交互关系的自变量的模型预测性能下降。

2024-02-09 13:40:58 484 1

原创 《机器学习入门与实践-基于scikit-learn和Keras》课后习题答案-第四章

说明一下,此程序中的训练集和测试集是被随机划分的,基于不同训练集和测试集的KNN模型的精度是不同的。3. KNN算法的原理简单地说是通过分析与其距离最近的K个邻近节点的类别来判断一个新节点的类别。(4)根据多数表决法将未知节点归类到K个最邻近样本中最多数的那种类别。(2)样本不平衡的时候,对稀有类别的预测准确率低;(3)建立KD树、球树之类的模型时需要大量的内存;(1)计算量大,尤其是当特征数非常多的时候;(4)使用的是懒散学习方法,基本上学习;(2)计算未知节点与已知节点之间的距离;

2024-02-07 20:14:38 385

原创 《机器学习入门与实践-基于scikit-learn和Keras》课后习题答案-第七章

4. 损失函数,分类器参数矩阵的范数。1. 最大边距超平面。2. 铰链,正则化项。

2024-02-04 13:34:49 334 1

原创 《机器学习入门与实践-基于scikit-learn和Keras》课后习题答案-第五章

4. 信息熵是训练数据集中的类别与某一属性之间的互信息,表示两事件之间信息的重复部分。6. 决策树算法被广泛应用于商业、农业、气象学、交通、军事、教育等众多领域,如客户群体的分类、农作物的分类、交通数据分析等。由结果可知,第1和第7特征组合下训练出的模型准确率最高。程序只绘制用准确率最高模型进行分类的效果图(见下图)。比较后可知,胎生动物的信息增益量最大,选择此属性对决策树的根节点进行划分。Gain(D,胎生动物)=0.689。Gain(D,水生动物)=0.045。Gain(D,会飞)=0.045。

2024-02-02 21:33:03 626

原创 《机器学习入门与实践-基于scikit-learn和Keras》课后习题答案-第一章

1. 监督学习、无监督学习、强化学习。7. 山鸢尾,变色鸢尾,维吉尼亚鸢尾。9. 特征,花萼长度,花瓣长度。6. Python,机器学习。5. 查准率,查全率。8. 训练集,测试集。

2024-02-01 16:05:05 423

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除