ML
文章平均质量分 85
learning-striving
积跬步以至千里,积细流以成江海。
展开
-
plt.plot(x,y,color,linestyle,marker)函数参数详解
需要注意的是,`plt.plot()`函数的参数比较多,不同的参数组合可以实现各种各样的效果。具体使用时需要根据需求进行选择和调整,以获得期望的绘图效果。`plt.plot()`函数是matplotlib库中用于绘制线条图的函数,它有多个参数可以控制绘图的各个方面。原创 2023-05-20 15:43:06 · 15954 阅读 · 0 评论 -
手写数字识别代码详解
手写数字识别代码详解,手写数字识别数据集原创 2023-04-10 11:31:24 · 1803 阅读 · 1 评论 -
集成学习、Bagging集成原理、随机森林构造过程、随机森林api与案例、boosting集成原理、梯度提升决策树(GBDT)、XGBoost与泰勒展开式
集成学习、Bagging集成原理、随机森林构造过程、随机森林api与案例、boosting集成原理、梯度提升决策树(GBDT)、XGBoost与泰勒展开式,bagging集成与boosting集成的区别原创 2023-01-16 15:23:25 · 875 阅读 · 0 评论 -
决策树生成、决策树可视化、决策树算法api、泰坦尼克号乘客生存预测案例代码
决策树算法api、决策树生成、决策树可视化、泰坦尼克号乘客生存预测案例代码,graphviz安装及使用DecisionTreeClassifier(criterion=’gini’,max_depth=None,random_state=None)criterion:特征选择标准,"gini"或者"entropy",前者代表基尼系数,后者代表信息增益,默认"gini",即CART算法,min_samples_split:内部节点再划分所需最小样本数,这个值限制了子树继续划分的条件,如果某节点的样本数少原创 2023-01-07 20:37:59 · 1010 阅读 · 0 评论 -
graphviz安装及使用、决策树生成
切换至生成的tree.dot文件所在的data目录下,执行以下命令。勾选添加至当前用户的系统路径,创建桌面图标可选,点击下一步。使用命令dot -version,若显示如下界面则安装成功。在data或bin目录下生成tree.png决策树,如下。使用以下语句生成dot文件。执行tree.dot文件。选择安装位置,下一步。tree.png如下。该网址使用时失效了。原创 2023-01-07 20:22:22 · 2283 阅读 · 0 评论 -
字典特征提取、文本特征提取、jieba分词处理、tf-idf文本特征提取概念及代码实现
字典特征提取、文本特征提取、jieba分词处理、tf-idf文本特征提取概念及代码实现,特征提取:将任意数据(如文本或图像)转换为可用于机器学习的数字特征,特征值化是为了计算机更好的去理解数据原创 2023-01-06 20:20:54 · 1561 阅读 · 0 评论 -
机器学习训练集、验证集、测试集,分类问题和回归问题评估指标,交叉验证法,macro avg与weighted avg含义,roc_auc_score与classification_report函数
机器学习训练集、验证集、测试集,分类问题和回归问题评估指标,数据集划分方式:交叉验证法,precision、recall、f1-score与accuracy介绍,maro avg:宏平均,计算方式为每个类型的算术平均,weighted avg:加权平均,是用每个类型样本数量与对应权重相乘再除以所有类别的样本总数,ROC、AUC原创 2022-08-09 17:07:37 · 6787 阅读 · 2 评论 -
逻辑回归、激活函数sigmoid、损失及优化、案例代码实现
逻辑回归概念及原理,激活函数sigmoid函数,损失以及优化,逻辑回归API,sklearn.linear_model.LogisticRegression,良/恶性乳腺癌肿瘤分类预测案例代码实现原创 2022-12-23 21:50:06 · 2151 阅读 · 0 评论 -
过拟合与欠拟合原因及解决办法、正则化类别、维灾难、正则化线性模型、岭回归、Lasso 回归、Elastic Net (弹性网络)、岭回归函数及案例使用、sklearn模型的保存和加载
有一系列猫和狗的图片,通过对猫和狗用一些描述性特征如颜色等构造一个分类器对其进行分类,单个颜色特征可能无法得到一个准确的分类器,需加入一些其他特征,随着特征的增加,分类器性能随之增加,即分类准确率更高,但当特征数量达到一定规模后,分类器性能是下降的。线性回归进行训练学习的时候模型会变得复杂,这里就对应前面再说的线性回归的两种关系,非线性关系的数据,也就是存在很多无用的特征或者现实中的事物特征跟目标值的关系并不是简单的线性关系。随着维度的增加,分类器性能逐步上升,到达某点之后,其性能便逐渐下降。原创 2022-12-11 14:22:58 · 3615 阅读 · 0 评论 -
线性回归函数LinearRegression、随机梯度下降函数SGDRegre使用,波士顿房价预测,sklearn.metrics.mean_squared_error(y_true, y_pred)
线性回归api,LinearRegression,随机梯度下降SGDRegressor,波士顿房价预测,sklearn.metrics.mean_squared_error(y_true, y_pred)均方误差回归损失,FutureWarning: Function load_boston is deprecated; `load_boston` is deprecated in 1.0 and will be removed in 1.2原创 2022-12-10 11:31:13 · 1757 阅读 · 0 评论 -
全梯度下降算法、随机梯度下降算法、小批量梯度下降算法、随机平均梯度下降算法、梯度下降算法总结
全梯度下降算法(FGD)、随机梯度下降算法(SGD)、随机平均梯度下降算法(SAGD)、小批量梯度下降算法(Mini-batch gradient descent,MGD)梯度下降优化算法,动量法、Adagrad、Adadelta、RMSProp、Adam原创 2022-12-09 10:57:09 · 3866 阅读 · 0 评论 -
线性回归线性关系、非线性关系、常见函数导数、损失函数与优化算法、正规方程与单变量函数梯度下降、多变量函数梯度下降
线性回归概念、公式、定义、特点,线性回归的特征与目标的关系分析,线性回归API sklearn.linear_model.LinearRegression(),常见函数导数,损失函数与优化算法,单变量函数梯度下降,多变量函数的梯度下降,什么是线性回归原创 2022-12-08 14:33:22 · 1529 阅读 · 0 评论 -
交叉验证、网格搜索、模型选择与调优、鸢尾花案例增加K值调优与Facebook人造世界签到位置train.csv数据预测代码实现
交叉验证、交叉验证目的,网格搜索,模型选择与调优,鸢尾花案例增加K值调优,Facebook人造世界数据预测sklearn.model_selection.GridSearchCV(estimator, param_grid=None,cv=None),什么是交叉验证和网格搜索,facebook人造世界签到数据下载原创 2022-12-07 15:57:33 · 948 阅读 · 0 评论 -
特征工程特征预处理归一化与标准化、鸢尾花种类预测代码实现
特征工程目的:把数据转换成机器更容易识别的数据 scikit-learn:提供几个常见的实用程序函数和转换器类,以将原始特征向量更改为更适合下游估计器的表示形式。即通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程特征的单位或大小相差较大,或某特征的方差相比其他的特征要大出几个数量级,容易影响(支配)目标结果,使得一些算法无法学习到其它的特征,故需要进行归一化/标准化处理需要用到一些方法进行无量纲化,归一化:把数据映射到(默认为[0,1])之间,海伦约会数据dating.txt下载原创 2022-12-06 16:25:01 · 1278 阅读 · 0 评论 -
鸢尾花数据种类预测、分析与处理、scikit-learn数据集使用、seaborn作图及数据集的划分
鸢尾花种类预测,scikit-learn中数据集介绍、查看数据分布,seaborn安装,sns.lmplot(x, y)作图、数据集的划分,鸢尾花数据集,鸢尾花数据分析与处理原创 2022-12-05 17:52:16 · 4392 阅读 · 1 评论 -
K邻近算法k值选取以及kd树概念、原理、构建方法、最近邻域搜索和案例分析
k邻近算法k值选择,kd树,kd树的原理,什么是kd树,kd树构造方法,kd树案例分析,kd树的建立构建, 最近邻域的搜索,近似误差,估计误差,kd树如何构建原创 2022-12-05 11:46:55 · 2061 阅读 · 2 评论 -
K邻近算法概述、欧式距离、Scikit-learn使用 、kNN邻近算法距离度量、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、标准化欧氏距离、余弦距离、汉明距离、杰卡德距离、马氏距离
K-邻近算法概述、KNN实现流程,机器学习流程,欧式距离、Scikit-learn使用K-近邻算法APIsklearn.neighbors.KNeighborsClassifier(n_neighbors=5)、kNN邻近算法距离度量、曼哈顿距离、切比雪夫距离、闵可夫斯基距离、标准化欧氏距离、余弦距离、汉明距离、杰卡德距离、马氏距离原创 2022-12-04 16:07:29 · 2187 阅读 · 0 评论 -
jupyter notebook代码自动补全设置、jupyter notebook中Nbextensions扩展安装
jupyter notebook如何设置代码自动补全,jupyter notebook中jupyter_contrib_nbextensions扩展安装,jupyter notebook自动补全代码设置,如何设置jupyter notebook的代码自动补全原创 2022-11-23 10:49:43 · 1751 阅读 · 0 评论 -
Matplotlib绘制折线图、散点图、柱状图、直方图、饼图代码
Matplotlib常见图形绘制,Matplotlib绘制折线图、Matplotlib绘制散点图、Matplotlib绘制柱状图、Matplotlib绘制直方图、Matplotlib绘制饼图代码,Matplotlib绘图函数原创 2022-11-22 22:00:07 · 3698 阅读 · 0 评论 -
Matplotlib用法使用、Matplotlib绘图作图画图
Matplotlib概念定义,Matplotlib绘图/画图/作图,matplotlib用法使用、什么是Matplotlib,Matplotlib常用函数用法,Matplotlib图像添加辅助功能信息,Matplotlib一个坐标系绘制多个图像,Matplotlib多个坐标系绘制多个图像,Matplotlib绘制数学函数图像原创 2022-11-22 17:35:04 · 3708 阅读 · 0 评论 -
conda创建虚拟环境命令、jupyter notebook启动打开和使用
conda创建虚拟环境命令步骤,anaconda创建虚拟环境命令、更换镜像源命令,什么是jupyter notebook,jupyter notebook打开和使用,jupyter notebook中cell单元操作模式及常用快捷键,requirements.txt文件安装库和依赖,jupyter notebook打开方式原创 2022-11-21 20:17:13 · 5648 阅读 · 0 评论