求学之路 - 机器学习
求学之路
GQ177
好好学习,天天向上。
展开
-
机器学习 - 如何理解激活函数和增益值的关系
增益值思考.jpg增益值(系数)和激活函数的关系计算增益值增益值(系数)和激活函数的关系在学习Pytorch的激活函数过程中,提到了增益值的概念。表中的gain,即增益值是指张量的数据输入到激活函数之后标准差的变化。例如对于0均值,1标准差的数据而言,经过激活函数tanh之后,标准差会减少5/3倍左右,如果对与经过激活函数后的数据进行增益变换(一般来说是乘上增益系数),可以使当前模块和激活函数连续作用后的输出张量元素分布服从一个比较合理的值。那么,为什么要让张量的元素分布服从一个比较合理的值,又原创 2020-12-05 17:59:50 · 1706 阅读 · 4 评论 -
Python - SkLearn库的使用
Python - SkLearn库的使用SkLearn简介数据的预处理标签编码数据集的标准化构建训练集和测试集建立预测模型K近邻算法(KNN)朴素贝叶斯算法决策树算法逻辑回归算法支持向量机算法随机森林(集成方法)Adaboost (集成方法)梯度提升树GBDT(集成方法)SkLearn简介即scikit-learn库,是当今最流行的机器学习算法库之一,可以用来解决分类和回归问题。数据的预处理标签编码from sklearn.preprocessing import LabelEncoderen原创 2020-08-29 12:49:05 · 1543 阅读 · 0 评论 -
机器学习 - 防止过拟合方法-正则线性模型
防止过拟合的方法正则线性模型岭回归(Ridge Regression)套索回归(Lasso Regression)弹性网络(Elastic Net)在机器学习的过程中要防止因为参数过多或模型过于复杂导致的过拟合,减少过拟合的一个方法时对模型正则化,降低模型训练的自由度,例如降低多项式的阶数。正则线性模型在执行正则化之前,须对数据进行缩放(StandardScaler…)。岭回归(Ridge Regression)岭回归Ridge Regression的方法是在训练模型的成本函数1中添加一个等于原创 2020-08-15 12:24:14 · 366 阅读 · 0 评论 -
机器学习 - 数据集(.csv文件或.excel文件)的基本处理
Python - 对数据集(csv文件)的基本处理操作载入数据集数据集抽样数据集统计修改数据集1修改数据集2持更操作载入数据集import pandas as pddata = pd.read_csv('数据集的文件路径或者URL',header)# header为表头,默认为第0行,header = None 默认没有表头,会自动添加数字作为列数数据集抽样显示数据集data # 显示数据集data.sample(int n) # 随机显示 n 条数据, 默认n = 1dat原创 2020-06-25 15:11:51 · 16441 阅读 · 0 评论