![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习(毕业设计)
文章平均质量分 78
以B站视频学习为基础,分享机器学习的心得
郭雅琦hh
这个作者很懒,什么都没留下…
展开
-
机器学习之特征工程
特征工程1、特征提取:从文字,图像,声音等其他非结构化数据中提取新信息作为特征。2、特征创造:把现有特征进行组合,或互相计算,得到新的特征。3、特征选择:从所有的特征中,选择出有意义,对模型有帮助的特征,以避免必须将所有特征都导入模型去训练的情况。在做特征选择之前一定要先跟数据提供者交流,所以特征选择的第一步,其实是根据我们的目标,用业务常识来选择特征。特征工程的第一步是理解业务。当所遇到的情况和数据无法通过业务理解来进行特征选择。则可以通过四种方法进行特征选择:1.过滤法(Filter原创 2021-09-09 19:27:04 · 515 阅读 · 0 评论 -
机器学习——回归树(参数、属性和接口)
回归树之 重要参数,属性及接口criterion回归树衡量分枝质量的指标,支持的标准有三种:1)输入"mse"使用均方误差mean squared error(MSE),父节点和叶子节点之间的均方误差的差额将被用来作为特征选择的标准,这种方法通过使用叶子节点的均值来最小化L2损失2)输入“friedman_mse”使用费尔德曼均方误差,这种指标使用弗里德曼针对潜在分枝中的问题改进后的均方误差3)输入"mae"使用绝对平均误差MAE(mean absolute error),这种指标使用叶节点的中转载 2021-05-06 20:31:49 · 605 阅读 · 0 评论 -
决策树之建立一棵树(代码模板)防止过拟合、剪枝参数
建立一棵树1、导入需要的算法库和模块from sklearn import treefrom sklearn.datasets import load_winefrom sklearn.model_selection import train_test_split2、探索数据wine = load_wine()wine.data.shapewine.target#如果wine是一张表,应该长这样:import pandas as pdpd.concat([pd.DataFrame(w原创 2021-04-29 09:39:18 · 1221 阅读 · 0 评论 -
机器学习——分类树DecisionTreeClassifier
DecisionTreeClassifier——分类树classsklearn.tree.DecisionTreeClassifier(criterion=’gini’, splitter=’best’, max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features=None, random_state=None, max_leaf_nodes=None, min_im转载 2021-04-25 08:20:50 · 2888 阅读 · 0 评论 -
机器学习入门篇——sklearn入门&决策树在sklearn中的实现
机器学习入门篇——sklearn入门&决策树在sklearn中的实现什么是sklearn1、sklearn是一个开源的基于Python语言的机器学习工具包2、sklearn 通过NumPy,SciPy和Matplotlib等python数值计算的库实现高效的算法应用3、它涵盖了几乎所有的主流机器学习算法为什么选择sklearn它很有深度,必须对算法掌握很好才能用好sklearn,且它缺乏优秀的解读,并且是通往数据挖掘工程师的起点。开发环境是Jupyter lab(Python3.9.原创 2021-04-23 11:17:09 · 360 阅读 · 3 评论