![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
lightis_tian
Science is for love
展开
-
Tensorflow2 导入自定义预训练模型
网上大多数都是直接调用tf的内置application中的预训练模型,这里用自己训练好的预训练模型。预训练模型的最后全连接层不要,只保留前面的捕捉特征的层且这些层权重冻结不参与接下来的训练。不冻结也可以,这样相当于从新训练,就没起到预训练模型的效果。大致代码如下:# 加载模型base_model = tf.keras.models.load_model('model-best.h5')# 得到最后一个全连接之前的层last_layer = base_model.get_layer(index=原创 2020-07-28 17:00:19 · 1435 阅读 · 3 评论 -
Pandas筛选包含特定字符的列
问题提出:比如有一个三百多列的数据集,想要快速找到包含xxx的列,这里有三种方法if判断+列表解析式[x for x in df.columns if 'xxx' in x]str.contain()+列表解析式[x for x in df.columns[df.columns.str.contain('xxx')]]filter函数df.filter(like='x...原创 2020-03-31 18:02:17 · 11712 阅读 · 0 评论 -
【第一章】让计算机在数据中学习 1-7章(上)
本章要点:机器学习的基本概念三种学习类型和主要术语成功设计一个机器学习系统的基础安装python1.构建智能机器将数据转化为信息2.机器学习三种主要类型监督学习标记数据直接反馈预测收益/未来无监督学习无数据标记无反馈发现数据中隐藏的结构强化学习决策过程奖励机制学习系列动作/行为3.用监督学习做预测比如做一个垃圾邮件过滤:我们用监督...翻译 2019-06-16 22:32:53 · 272 阅读 · 0 评论 -
【第二章】训练简单的分类机器学习算法
在本章中,我们会用到两个分类算法,感知机和可调线性参数。本章要点如下:构建机器学习的直觉基本的数据处理和可视化运用线性分类算法翻译 2019-07-25 15:16:58 · 249 阅读 · 0 评论 -
自适应线性神经元和梯度下降
这一节我们会了解单层神经网络的一种形式:自适应线性神经元(Adaline)。 这个算法的有趣之处在于它阐述了定义和最小化损失函数的关键概念,这位后面许多机器学习分类算法,如逻辑回归,支持向量机和回归模型等打下了基础。自适应线性神经元和感知机的关键差别在于权重的更新是根据线性激活函数而不是感知机里的分段函数。在Adaline中,这个线性激活函数ϕ(z)\phi(z)ϕ(z)仅仅是净输入的确...翻译 2019-07-27 19:07:15 · 630 阅读 · 0 评论 -
DataWhale机器学习高级算法梳理Day2-GBDT
GBDT:Gradient Boosting Decision Tree(梯度增强决策树)以决策树为基学习器的梯度增强集成算法。集成学习三种主要方法:boosting, bagging, stackingboosting通过分步迭代来构建模型。梯度提升方法:通过在迭代的每一步沿着梯度最陡方向降低损失,来构建一个学习器。优点:1) 可以设置不同的可微函数处理各类学习任务。2) 引入bag...原创 2019-08-09 20:50:40 · 238 阅读 · 0 评论 -
DataWhale机器学习高级算法梳理Day1-随机森林
1. 集成学习集成学习(Ensemble learning)通过构建多个学习器来完成学习任务,有时也被称为多分类器系统,基于委员会的学习等等。结构如下:个体学习器通常由一个现有的学习算法从训练数据中产生。集成中只包含同种类型的个体学习器叫同质学习器,也叫基学习器,相应的算法被称为基学习算法。对应包含不同类型的个体学习器的集成,叫异质学习器,由不同的学习算法组成。此时,集成里的个体学习器被称...原创 2019-08-07 20:48:13 · 284 阅读 · 0 评论 -
DataWhale机器学习高级算法梳理Day4-LightGBM算法梳理
LightGBMLightGBM是一个实现GBDT算法的框架,支持高效率的并行训练,并且具有以下优点:更快的训练速度更低的内存消耗更好的准确率分布式支持,可以快速处理海量数据和XGBoosting等GBDT算法相比的主要优化点:基于 Histogram 的决策树算法带深度限制的 Leaf-wise 的叶子生长策略直方图做差加速直接支持类别特征(Catego...原创 2019-08-15 15:35:16 · 262 阅读 · 0 评论 -
DataWhale机器学习高级算法梳理Day3-XGBoosting
算法原理参考文章:Gradient Boosting梯度提升-GBDT与XGBoost解析及应用 理解XGBoost集成算法梳理——XGBoost回顾前面的梯度提升算法,知道梯度提升使用前序模型的预测值fm−1(xi)f_{m-1}(x_i)fm−1(xi)和标签值yiy_iyi之间的残差Dm^={(xi,rim)i=1,2…n}\hat{D_m}=\{(x_i, r_{im})i...原创 2019-08-12 20:45:45 · 247 阅读 · 0 评论