机器学习知识积累
文章平均质量分 84
.
海洋 之心
阿里云社区专家博主,图神经网络-大数据-推荐系统研究者,专注于计算机领域前沿技术的分享等人工智能算法研究工作
展开
-
基于Bi-LSTM与CRF实现中文命名实体识别任务
本数据集共包含约2.7万中文文本,其中包括约2.08万训练集,0.23万验证集和0.46万测试集。数据集分别命名为example.train,example.dev,example.test,保存在datasets目录下。1.训练集:包含文本和对应的标签,用于模型训练。2.验证集:包含文本和对应的标签,用于模型训练和参数调试。3.测试集:包含文本和对应的标签,用于预测结果、验证效果。原创 2022-10-13 06:00:00 · 2251 阅读 · 32 评论 -
基于TF-IDF与逻辑回归模型实现文本实体关系抽取任务
简述训练集中有8000个句子,测试集中有2717个句子。数据介绍train.txt内容范围test.txt数据来源来自官方网站http://semeval2.fbk.eu/semeval2.php的原始数据探索方向SemEval-2010 Task#8的两个工具官方输出文件格式检查器:semeval2010_task8_format_checker.plSemEval-2010任务8的官方得分手:semeval2010_task8_scorer-v1.2.pl。原创 2022-10-12 06:00:00 · 982 阅读 · 0 评论 -
基于逻辑回归方法完成垃圾邮件过滤任务
文章目录案例实战:基于逻辑回归方法完成垃圾邮件过滤任务1、任务描述2、数据集3、方法概述4、数据可视化及数据预处理4.1 读取数据4.2 数据分析4.3 数据可视化4.4 数据预处理4.5 数据集划分和向量化CountVectorizer统计词频矩阵5、模型训练5.1 加载模型5.2 训练模型5.3 预测结果6、模型评估6.1 测试集准确率6.2 不同分类器的结果分析6.3 预测结果展示案例实战:基于逻辑回归方法完成垃圾邮件过滤任务1、任务描述我们日常学习以及工作中会收到非常多的邮件,除了与学习工作原创 2021-02-02 23:36:12 · 4648 阅读 · 12 评论 -
基于KMeans、DBSCAN新闻聚类分群
文章目录案例实战:新闻聚类分群1、导入相关库2、读取数据3、中文分词4、文本向量化:建立词频矩阵5、构造特征矩阵6、模型搭建(1)、通过KMeans算法进行聚类分群(2)、通过DBSCAN算法进行聚类分群7、利用余弦相似度进行模型优化案例实战:新闻聚类分群1、导入相关库from sklearn.feature_extraction.text import CountVectorizerfrom sklearn.cluster import KMeansfrom sklearn.cluster i原创 2021-01-28 15:22:44 · 4488 阅读 · 20 评论 -
基于聚类算法完成航空公司客户价值分析任务
文章目录案例实战:基于聚类算法完成航空公司客户价值分析任务1、任务描述2、数据集2.1 数据集中字段含义3、方法3.1 数据预处理3.2 特征工程3.2.1 RFM模型3.2.2 变体-LRFMC模型3.2.3 标准化3.3 模型训练与对数据的预测3.3.1 KMeans聚类算法3.4 尝试使用RFM模型3.5 DBSCAN模型对LCRFM特征进行计算3.9 根据LCRFM结果进行分析(1)重要保持客户(2)重要发展客户(3)重要挽留客户(4)一般客户(5)低价值客户结果分析决策案例实战:基于聚类算法完原创 2021-02-02 20:01:34 · 14480 阅读 · 10 评论 -
基于特征工程完成对贷款数据集Lending Club的预处理
文章目录案例实战:基于特征工程完成对贷款数据集Lending Club的预处理1、数据集2、基本流程3、特征提取和处理3.1 数值特征缩放数据离散化分箱-简单分箱3.2 类别特征标签编码独热编码3.3 特征交叉4、特征选择4.1 过滤法4.2 封装法4.3 嵌入法案例实战:基于特征工程完成对贷款数据集Lending Club的预处理1、数据集Lending Club 创立于2006年,主营业务是为市场提供P2P贷款的平台中介服务,公司总部位于旧金山。因此合理地对用户进行信用等级划分对贷款业务有着至关原创 2021-02-03 20:54:51 · 3243 阅读 · 0 评论 -
python 用pip安装tensorflow(超简单的一句话)
如果你已经装好了pip,那就直接否则pip install --upgrade pippip install tensorflow==2.7.0 # CPUpip install tensorflow-gpu==2.7.0 # GPU之后就可以完美使用!!!原创 2021-12-08 10:44:37 · 9188 阅读 · 0 评论 -
python 用pip安装mediapipe(超简单的一句话)
如果你已经装好了pip,那就直接pip install mediapipe之后就可以完美使用!!!原创 2021-12-08 10:40:15 · 6021 阅读 · 5 评论 -
【深度学习系列】(二)--An overview of gradient descent optimization algorithms
文章目录一、摘要二、介绍三、梯度下降变体3.1 批量梯度下降(Batch gradient descent)3.2 随机梯度下降(Stochastic gradient descent)3.3 小批量梯度下降(Mini-batch gradient descent)四、面临的困难五、梯度下降优化算法5.1 动量(Momentum)5.2 Nesterov accelerated gradient5.3 Adagrad5.4 Adadelta5.5 RMSprop5.6 Adam5.7 算法的可视化5.8 使原创 2021-11-26 22:06:28 · 566 阅读 · 0 评论 -
【深度学习论文解读系列】(一)--Dropout原理剖析
文章目录Dropout: A Simple Way to Prevent Neural Networks from overfitting一、摘要二、介绍三、动机四、模型描述五、学习Dropout网络ReferencesDropout: A Simple Way to Prevent Neural Networks from overfitting一、摘要具有大量参数的深度神经网络是非常强大的机器学习系统。然而,在这样的网络中,过度拟合是一个严重的问题。大型网络的使用速度也很慢,因此很难在测试时通过组原创 2021-11-24 12:01:14 · 2358 阅读 · 0 评论 -
【深度学习】Dropout原理以及代码实现
Drouout起源随着深度学习的发展,各种网络结构层出不穷,导致网络越来越深,数据的容纳量越来越大,模型的参数也越来越多,这样就会导致神经网络很容易过拟合,过拟合的模型几乎是不能用于实践中的,因为拟合的数据与测试数据不一致,导致模型的泛化性能较低。由于这个问题,现在有很多解决办法,比如使用集成模型,同时训练多个模型,最终让几个模型进行加权,这样能够解决过拟合是因为使用了不同的模型,每个模型拟合到的数据特征不同,最终由于互补,能够使模型的泛化性能更强,随机森林就是很经典的ensemble模型,分别单独训练原创 2021-11-24 11:59:53 · 3667 阅读 · 0 评论 -
【机器学习】GBM和随机森林都是基于树的算法,它们有什么区别?
如果需要完整代码可以关注下方公众号,后台回复“代码”即可获取,阿光期待着您的光临~GBM和随机森林都是基于树的算法,它们有什么区别?RF采用bagging技术做出预测;GBM采用boosting技术做出预测bagging技术,数据集采用bootstrap随机采样的方法被划分为n个样本,对多棵树的结果进行加权或者取平均;boosting在第一轮预测之后,增加分类出错的样本权重,减小错误率高的基学习器(树)的权重,持续进行,一直到达停止标准。RF采用减小方差提高模型精度,生成树之间没有相关性;GBM原创 2021-11-14 18:47:08 · 922 阅读 · 0 评论 -
【机器学习】贝叶斯网络实现一个简单的拼写检查
如果需要完整代码可以关注下方公众号,后台回复“代码”即可获取,阿光期待着您的光临~文章目录代码实践2021人工智能领域新星创作者,带你从入门到精通,该博客每天更新,逐渐完善各个知识体系的文章,帮助大家更高效学习。请用贝叶斯网络实现一个简单的拼写检查算法步骤:1)建立一个足够大的文本库2)对文本库的每一个单词统计其出现频率3)根据用户输入的单词,得到其所有可能的拼写相近的形式4)比较所有拼写相近的词在文本库的出现频率。频率最高的那个词,就是正确的拼法首先自己建立文本库(外文文献.原创 2021-11-06 18:50:17 · 1695 阅读 · 1 评论 -
【机器学习】基于组平均的AGNES算法,支持多维数组,距离用欧式距离
如果需要完整代码可以关注下方公众号,后台回复“代码”即可获取,阿光期待着您的光临~文章目录编程实现2021人工智能领域新星创作者,带你从入门到精通,该博客每天更新,逐渐完善各个知识体系的文章,帮助大家更高效学习。自己实现基于组平均的AGNES算法,语言不限。要能支持多维数组,距离用欧式距离numpy实现相似性度量方式:average-cluster绘制层次树图编程实现import numpy as npimport pandas as pdfrom scipy.clus.原创 2021-11-06 16:50:11 · 897 阅读 · 0 评论 -
【机器学习】线性分类——线性判别分析LDA(理论+图解+公式推导)
如果需要完整代码可以关注下方公众号,后台回复“代码”即可获取,阿光期待着您的光临~文章目录一、概述二、数学原理推导1.数学符号2.定义类均值、方差3.构造目标函数三、求解目标函数2021人工智能领域新星创作者,带你从入门到精通,该博客每天更新,逐渐完善机器学习各个知识体系的文章,帮助大家更高效学习。一、概述本篇讲解一种新的分类算法,它就是LDA(线性判别分析),它是一个比较经典的一个二分类算法,不过现在不怎么流行了,但是整个算法的思想很具有意义。它是一种基于降维的方式将所有的样本映射到.原创 2021-08-23 15:38:14 · 3183 阅读 · 0 评论 -
【机器学习】线性分类——高斯判别分析GDA(理论+图解+公式推导)
如果需要完整代码可以关注下方公众号,后台回复“代码”即可获取,阿光期待着您的光临~文章目录一、概述二、高斯判别分析1.算法思想2.数据的分布假设3.最大似然估计4. 求解参数 ϕ\phiϕ5.求解参数 μ1\mu_1μ16.求解参数 μ2\mu_2μ27.求解参数 Σ\SigmaΣ8.特别公式2021人工智能领域新星创作者,带你从入门到精通,该博客每天更新,逐渐完善机器学习各个知识体系的文章,帮助大家更高效学习。一、概述首先在讲高斯判别分析之前先看一下线性分类的几种常见模型。.原创 2021-08-24 14:58:28 · 2236 阅读 · 0 评论 -
sklearn 中 ShuffleSplit 函数 的详细使用方法 (机器学习)
ShuffleSplit函数的使用方法1、原理用于将样本集合随机“打散”后划分为训练集、测试集(可理解为验证集,下同)类似于交叉验证2、函数形式ShuffleSplit(n_splits=10, test_size=’default’, train_size=None, random_state=None)3、重要参数n_splits:划分数据集的份数,类似于KFlod的折数,默认为10份test_size:测试集所占总样本的比例,如test_size=0.2即将划分后的数据集中20%作原创 2021-02-08 22:04:44 · 5894 阅读 · 4 评论 -
sklearn 多种模型的学习曲线 拟合中的特性与运行速度(机器学习)
文章目录案例实战:多种模型的学习曲线1、导入相关库2、定义画图函数3、准备数据4、循环调用函数画图案例实战:多种模型的学习曲线1、导入相关库from sklearn.ensemble import RandomForestClassifier # 随机森林模型from sklearn.tree import DecisionTreeClassifier # 决策树from sklearn.linear_model import LogisticRegression # 逻辑回归from skl原创 2021-02-08 22:20:19 · 831 阅读 · 1 评论 -
【机器学习】集成学习(Boosting)——梯度提升树(GBDT)算法(理论+图解+公式推导)
如果需要完整代码可以关注下方公众号,后台回复“代码”即可获取,阿光期待着您的光临~文章目录一、引言二、提升树提升树算法前向分步算法提升树算法流程三、梯度提升树GBDT算法流程泰勒一阶展开2021人工智能领域新星创作者,带你从入门到精通,该博客每天更新,逐渐完善机器学习各个知识体系的文章,帮助大家更高效学习。一、引言之前我们使用Boosting模型讲解了AdaBoost算法模型的原理,采用加法模型和向前分步算法,它是采用了很多个基学习器按照一定权重进行线性组合。fM(x)=∑m=1Mam.原创 2021-08-27 20:34:23 · 3589 阅读 · 1 评论 -
【吴恩达课后编程作业】第二周作业 (附答案、代码) Logistic回归 神经网络、深度学习、机器学习
【吴恩达课后编程作业】Course 1 - 神经网络和深度学习 - 第二周作业 - 具有神经网络思维的Logistic回归上一篇:【课程1 - 第二周测验】 ✌✌✌✌目录 ✌✌✌✌下一篇:【课程1 - 第三周测验】首先说明一下,本问参考了zsffuture的博客、何宽的博客以及Github上fengdu78老师的文章进行学习我们要实现一个能够识别猫的图片的简单神经网络numpy:matplotlib:python的画图工具h5py:读取h5格式文件的工具lr_utils:用于加载训练及原创 2021-02-17 12:43:02 · 1199 阅读 · 3 评论 -
特征工程之数据预处理——哑变量处理
文章目录前言一、get_dummies1、导库,创建表格2、调用哑变量方法3、删除无用列4、修改列的名字二、OneHotEncoder1、导库2、调用OneHotEncoder函数总结前言机器学习在建模期间一般使用的是纯数值型数据,但是在实际生活中往往数据中会掺杂一些文本数据,例如人员信息中的性别等,这里的男,女,我们可以转化成为线性不相关的矩阵,如(1,0)、(0,1),在机器学习中这被称为哑变量。本节介绍两种方法来实现数值与非数值的转化,分别是pandas库中的get_dummies()和skl.原创 2021-01-22 19:20:11 · 4133 阅读 · 0 评论 -
【机器学习】集成学习(Boosting)——XGBoost算法(理论+图解+公式推导)
如果需要完整代码可以关注下方公众号,后台回复“代码”即可获取,阿光期待着您的光临~文章目录一、引言二、XGBoost算法1.xgboost算法原理2.构造目标函数3.泰勒级数近似目标函数4.将树结构引入目标函数4.1 表示第k棵树的预测值4.2 表示树的模型复杂度4.3 参数化目标函数5.贪心算法构建最优树2021人工智能领域新星创作者,带你从入门到精通,该博客每天更新,逐渐完善机器学习各个知识体系的文章,帮助大家更高效学习。一、引言XGBoost是陈天奇等人开发的一个开源机器学习项目,.原创 2021-08-28 22:28:29 · 9043 阅读 · 1 评论 -
【机器学习】决策树——CART分类回归树(理论+图解+公式)
如果需要完整代码可以关注下方公众号,后台回复“代码”即可获取,阿光期待着您的光临~文章目录一、概述二、CART决策树1.分类树1.1 基尼系数1.1 特征离散1.2 特征连续2.回归树三、剪枝算法2021人工智能领域新星创作者,带你从入门到精通,该博客每天更新,逐渐完善机器学习各个知识体系的文章,帮助大家更高效学习。一、概述针对于ID3和C4.5只能处理分类的问题,后来有人提出了CART,该模型是由Breima等人在1984年提出的,它是被应用广泛的决策树学习方法,它可以用于分类与回归问.原创 2021-08-26 15:50:17 · 13944 阅读 · 4 评论 -
梯度下降算法原理 神经网络(Gradient Descent)
在求解神经网络算法的模型参数,梯度下降(Gradient Descent)是最常采用的方法。下面是我个人学习时对梯度下降的理解,如有不对的地方欢迎指出。1、✌ 梯度定义 微积分我们学过,对多元函数的各个变量求偏导数,把求得的各个参数的偏导数以向量的形式写出来,就是梯度。比如函数f(x,y),原创 2021-02-17 17:26:47 · 1313 阅读 · 5 评论 -
sklearn.preprocessing.PolynomialFeatures多项式特征
生成多项式和交互特征。生成一个新的特征矩阵,该矩阵由度小于或等于指定度的特征的所有多项式组合组成。例如,如果输入样本是二维且格式为[a,b],则2阶多项式特征为[1,a,b,a ^ 2,ab,b ^ 2]。参量属性度int,默认= 2多项式特征的程度。interact_only bool,默认为False如果为真,只有相互作用特征产生:是至多产品特征degree 不同输入特征(因此不是 ,等)。x[1] ** 2x[0] * x[2] ** 3include_bias bool,默认原创 2021-02-01 09:25:48 · 878 阅读 · 3 评论 -
独热编码(One-Hot Encoding)和 LabelEncoder标签编码 区别 数据预处理:(机器学习) sklearn
文章目录独热编码和 LabelEncoder标签编码1、介绍2、代码测试2.1 导入相关库2.2 读取数据2.3 查看缺失值2.4 利用中位数填补年龄2.5 删除Embarked的缺失行2.6 查看每个特征的类别2.7 对标签进行LabelEncoder编码2.8 利用pandas的哑变量处理2.9 对特征进行哑变量处理2.10 对特征进行独热编码2.11 、模型测试2.11.1 独热编码2.11.1 LabelEncoder编码独热编码和 LabelEncoder标签编码1、介绍对于一些特征工程,原创 2021-02-11 10:59:04 · 4459 阅读 · 1 评论 -
XGBoost Python API参考以及各参数意义
常规参数参数参数描述可选值booster使用哪种增压器,可以是gbtree, gblinar或dart。Gbtree和dart采用基于树的模型,而gblinear采用线性函数‘gbtree’、‘gblinar’、‘dart’,默认gbtreesilent是否打印运行信息0代表打印,1,默认0nthread用于运行xgboost的并行线程数默认最大数num_pbuffer预测缓冲区的大小,通常设置为训练实例的数量。缓冲器用于保存最后一个助推步的预测结果原创 2021-05-26 17:10:47 · 408 阅读 · 0 评论 -
【机器学习】线性分类——朴素贝叶斯分类器NBC(理论+图解+公式推导)
如果需要完整代码可以关注下方公众号,后台回复“代码”即可获取,阿光期待着您的光临~文章目录概述算法流程2021人工智能领域新星创作者,带你从入门到精通,该博客每天更新,逐渐完善机器学习各个知识体系的文章,帮助大家更高效学习。概述本篇文章重点要讲解的是朴素贝叶斯分类器该算法同高斯判别分析一样,是一种概率生成模型,都是基于 P(Y∣X)P(Y|X)P(Y∣X) 做分析,但是与高斯判别分析不同的是,朴素贝叶斯多做了一个假设,就是数据的不同维度之间独立,每个维度之间没有任何关系。这样做假设.原创 2021-08-24 14:58:59 · 1198 阅读 · 0 评论 -
硬核:科学家打造全套人工神经系统,让瘫痪病人重新控制身体
来源【IT之家】来源:智东西 作者:信仪 责编:姜戈地址链接1 月 29 日消息,据外媒 IEEE Spectrum 报道,美国一组神经科学家和工程师研发了一套人造神经系统,能让瘫痪的人重新控制自己的肢体。2015 年,这组研究人员对他们的研究成果进行了测试检验。测试者当时胸部以下已瘫痪了三年有余,但借助这套设备,他可以握住简易的吉他接口,用右手的手指按下指板键,左手敲击弹奏杆,使用《吉他英雄》电子游戏弹奏了一些音符。测试者的动作不依赖于体内受损的脊柱,而是使用了一种叫做 “神经搭桥(neura原创 2021-02-04 12:03:51 · 514 阅读 · 1 评论 -
【机器学习】决策树——ID3和C4.5(理论+图解+公式推导)
如果需要完整代码可以关注下方公众号,后台回复“代码”即可获取,阿光期待着您的光临~文章目录一、概述二、算法流程1.决策树的if-then准则2.过拟合现象3.特征空间的划分4.特征选择准则4.1 信息熵4.2 信息增益4.3 信息增益比(增益率)三、ID3决策树四、C4.5决策树五、剪枝算法1.预剪枝2.后剪枝2021人工智能领域新星创作者,带你从入门到精通,该博客每天更新,逐渐完善机器学习各个知识体系的文章,帮助大家更高效学习。一、概述决策树是一类非常经典的算法,很多集成模型的基学习器.原创 2021-08-26 13:34:03 · 2340 阅读 · 0 评论 -
【机器学习】(19)使用sklearn实现估计器的调参方法
使用sklearn实现估计器的调参方法有些刚刚接触机器学习的人总是弄混超参数和参数的意思,在深度学习中超参数对应着我们的网络学习到的参数,就是每一层的权重w,而参数就是网络的层数或者epoch这些。而在机器学习中也是如此,举个例子,对于随机森林来说,我们调的树的棵树就是超参数,而参数就是我们模型内部有关书的形状的一些参数。可以这样说,超参数的选择决定着模型参数的值,我们调整超参数的目的就是使模型内部的参数能够尽可能拟合数据集。但是我们刚刚接触的时候,不知道每个参数的意义或者是参数范围很广,很难找出一原创 2021-06-07 17:04:04 · 597 阅读 · 0 评论 -
lightGBM Python API参考以及各参数意义
模型参数参数名参数描述可选值boosting_type模型提升方式‘gbdt’、‘dart’、‘goss’、‘rf’num_leaves每个基学习器的最大叶子默认31max_depth基学习器树的最大深度默认-1,没有限制learning_rateboosting学习率默认0.1n_estimators基学习器的数量默认10max_bin特征值的分桶数默认255subsample_for_bin用于分箱的样本数默认500原创 2021-05-26 17:12:14 · 739 阅读 · 0 评论 -
【机器学习】线性分类——感知机算法(理论+图解+公式推导)
如果需要完整代码可以关注下方公众号,后台回复“代码”即可获取,阿光期待着您的光临~文章目录概述感知机算法原理2021人工智能领域新星创作者,带你从入门到精通,该博客每天更新,逐渐完善机器学习各个知识体系的文章,帮助大家更高效学习。概述本篇文章将要讲解的算法为感知机算法,它最初是一种最简单的二分类算法,后来根据它的提出不断衍生了很多基于它的相关算法,比如支持向量机还有现在比较流行的神经网络,可以说神经网络就是多层感知机的叠加,不过还是优质的神经网络结构还是有其它的其它的网络块的。感知机.原创 2021-08-23 11:40:44 · 1400 阅读 · 0 评论 -
【机器学习】集成学习——Stacking模型融合(理论+图解)
如果需要完整代码可以关注下方公众号,后台回复“代码”即可获取,阿光期待着您的光临~文章目录一、引言二、Stacking集成模型1.Stacking原理2.实现代码2021人工智能领域新星创作者,带你从入门到精通,该博客每天更新,逐渐完善机器学习各个知识体系的文章,帮助大家更高效学习。一、引言对于单个模型来说很难拟合复杂的数据,而且对于单模型来说,模型的抗干扰能力较低,所以我们希望可以集成多个模型,结合多个模型的优缺点提高模型的泛化能力。针对于集成学习一般有两种方式,第一种为Boosti.原创 2021-08-29 13:16:25 · 38454 阅读 · 6 评论 -
【机器学习】(18)使用sklearn实现交叉验证
使用sklearn实现交叉验证1.交叉验证如果我们使用模型在一个数据集上面进行测试是不对的,因为只要我们的模型不断进行训练样本,最终肯定会拟合所有的数据,但是这样来说该模型会对在训练过程中没有见过的数据失去作用,这种情况就是过拟合。我们为了要避免这种情况,就要在训练开始将数据分为训练集和测试集x_train,x_test,一般有的还分成验证集x_val训练集:用于去训练模型参数验证集:用于验证模型每次更新参数是否正确,帮忙选择模型在训练集上最优参数测试集:用于检验最终训练好的模型的泛化效果sc原创 2021-06-06 20:52:51 · 2011 阅读 · 0 评论 -
【机器学习】(25)使用sklearn实现管道和复合估计器
使用sklearn实现管道和复合估计器我们在学习机器学习的过程中会发现我们跑代码经常是首先对数据预处理标准化、降维这些,然后用模型评估,就是感觉有一个大体的步骤,所以scikit开发了一种库,里面有一个管道功能,它就可以将我们所有的步骤放到同一的管道,一并执行,类似于生产线一样,第一步的产品交给第二道部门进行处理。1.管道(Pipline)刚才说了管道可以将一些基本功能进行封装,他还有一些别的功能,如果我们在封装转化器的时候,有模型参与且作为最后一个,那么整个管道就可以作为一个大的评估器,也就具有fi原创 2021-06-08 18:07:25 · 252 阅读 · 0 评论 -
Python 数据归一化、标准化、正则化 (机器学习)
文章目录数据归一化、标准化、正则化1、归一化2、标准化3、正则化4、代码测试4.1 导库4.2 创建数据4.3 查看原始数据的均值、方差4.4 归一化4.5 标准化4.6 正则化数据归一化、标准化、正则化1、归一化是将数据放缩到0~1区间,利用公式(x-min)/(max-min)2、标准化将数据转化为标准的正态分布,均值为0,方差为13、正则化正则化的主要作用是防止过拟合,对模型添加正则化项可以限制模型的复杂度,使得模型在复杂度和性能达到平衡。常用的正则化方法有L1正则化和L2正则化。L原创 2021-02-11 17:25:12 · 2549 阅读 · 6 评论 -
Pytorch出现‘Tensor‘ object is not callable解决办法
出现该现象原因可能是因为调取张量的属性,而写成了函数形式,把括号去掉原创 2021-02-15 14:07:23 · 9776 阅读 · 6 评论 -
【机器学习】(27)使用sklearn实现数据预处理
使用sklearn实现数据预处理我们有时候发现将我们的训练数据扔到模型中,发现结果并不是很好,原因有几点,一有可能是模型不适合该类数据,而是可能数据很脏,没有经过处理。常见的一些处理方式有标准化(Standardization)、正则化(Normalizer)、缩放等。我们需要将数据进行一系列的处理让我们的模型可以更容易地拟合数据。1.标准化(Standardization)我们经常会发现一般在训练数据之前都会将数据进行标准化。这是因为有些机器学习算法的假设就是我们的数据符合正态分布,但显示中原创 2021-06-09 18:45:30 · 604 阅读 · 0 评论 -
Tensorflow 出现 ‘Tensor‘ object is not callable解决办法
出现该现象原因可能是因为调取张量的属性,而写成了函数形式,把括号去掉原创 2021-02-15 14:08:18 · 4998 阅读 · 5 评论