自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 模型评价与优化

1.过拟合与欠拟合欠拟合与过拟合: 训练数据 预测数据 欠拟合 不准确 不准确 过拟合 准确 不准确 好模型 准确 准确 欠拟合可以通过观察训练数据及时发现,通过优化模型结果解决。 如何解决过拟合问题:原因:模型结构过于复杂(维度过高);使用了过多属性,模型训练时包含了干扰项信息。 解决办法:简化数据模型(使用低阶模型,如线性模型);数据PCA处理;模型训练时,增加正则...

2020-11-01 19:44:06 1716

原创 机器学习其他常用技术

1.决策树任务:根据用户的学习动力,能力提升意愿,兴趣度,空余时间,判断其是否适合学习本门课程。逻辑回归: 决策树:决策树是一种对实例进行分类的树形结构,通过多层判断区分目标所属类别。本质:通过多层判断,从训练数据集中归纳出一组分类规则。优点:计算量小,运算速度快;易于理解,可清晰查看各种属性的重要性。缺点:忽略属性间的相关性;样本类别分布不均匀时,容易影响模型表现求解:假设给定训练数据集,其中,为输入实例,m为特征个 数,为类标记,,N为样本容量。目标...

2020-10-31 17:55:59 1145

原创 机器学习之聚类(实战)

1.无监督学习按照特征进行划分,没有对与错,寻找数据的共同点。机器学习的一种方法,没有给定事先标记过的训练示例,自动对输入的数据进行分类或分群。优点:算法不受监督信息的约束,可能考虑到新的信息。 不需要标签数据,极大程度扩大数据样本。主要应用:聚类分析clustering,关联规则,维度缩减与监督学习的区别:没有数据标签y监督学习:训练数据{} 无监督学习:训练数据{}无监督学习常用算法:聚类分析聚类分析又称群分析,根据对象某些属性的相似度,将其自动划分类别。 聚类分析

2020-10-30 21:14:15 728 1

原创 机器学习之逻辑回归(实战源码)

分类问题介绍任务:输入:电子邮件;输出:此邮件为垃圾文件/普通邮件流程:标注样本邮件是垃圾邮件还是普通邮件 获取批量的样本邮件及其标签,学习其特征(计算机实现) 针对新邮件,自动判断其类别特征:用于帮助判断是否为垃圾邮件的属性发件人包含:%&*... 正文包含:现金,领取等分类:定义:根据已知样本的某些特征,判断一个新样本属于哪一类别。 基本框架:y=f(x1,x2.....xn),判断类别为N,如果y = N 方法逻辑回归:建立逻辑回归方程,判断类别 KNN近邻

2020-10-28 21:02:47 995 1

原创 机器学习之线性回归(思想)

scikit-learn:是python对机器学习的一款开源框架库,可以进行数据预处理,分类,回归,降维,模型选择等常用的机器学习算法。缺点:不支持深度学习,强化学习;只能用python。线性回归过程:寻找a,b(y=ax+b) from sklearn.linear_model import LinearRegressionIr_model = LinearRegression()Ir_model.fit(x, y) 展示a,b a = Ir_model.coef_.

2020-10-27 23:39:49 371

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除