- 博客(16)
- 资源 (2)
- 收藏
- 关注
原创 [机器学习速成课程] 嵌套 (Embeddings):编程练习-学习笔记
稀疏数据和嵌入简介学习目标:将影评字符串数据转换为稀疏特征矢量使用稀疏特征矢量实现情感分析线性模型通过将数据投射到二维空间的嵌入来实现情感分析 DNN 模型将嵌入可视化,以便查看模型学到的词语之间的关系在此练习中,我们将探讨稀疏数据,并使用影评文本数据(来自 ACL 2011 IMDB 数据集)进行嵌入。这些数据已被处理成 tf.Example 格式。(数据:urls_pos.txt包含被判定为好...
2018-03-29 00:58:03 988
原创 [机器学习速成课程] 多类别神经网络 (Multi-Class Neural Networks):编程练习-学习笔记
使用神经网络对手写数字进行分类学习目标:训练线性模型和神经网络,以对传统 MNIST 数据集中的手写数字进行分类比较线性分类模型和神经网络分类模型的效果可视化神经网络隐藏层的权重我们的目标是将每个输入图片与正确的数字相对应。我们会创建一个包含几个隐藏层的神经网络,并在顶部放置一个归一化指数层,以选出最合适的类别。设置首先,我们下载数据集、导入 TensorFlow 和其他实用工具,并将数据加载到 ...
2018-03-25 13:26:43 1239
原创 [机器学习速成课程] 神经网络简介 (Introduction to Neural Networks)-学习笔记
“非线性”意味着您无法使用形式为的模型准确预测标签。也就是说,“决策面”不是直线。之前,我们了解了对非线性问题进行建模的一种可行方法 - 特征组合。playground练习(https://developers.google.com/machine-learning/crash-course/introduction-to-neural-networks/playground-exercises)...
2018-03-25 11:52:18 344
原创 [机器学习速成课程] 训练神经网络 (Training Neural Networks):编程练习-学习笔记
提高神经网络性能学习目标:通过将特征标准化并应用各种优化算法来提高神经网络的性能注意:本练习中介绍的优化方法并非专门针对神经网络;这些方法可有效改进大多数类型的模型。导入,与之前一样import mathfrom IPython import displayfrom matplotlib import cmfrom matplotlib import gridspecfrom matpl...
2018-03-25 00:43:02 1307
原创 [机器学习速成课程] 神经网络简介 (Introduction to Neural Networks):编程练习-学习笔记
神经网络简介学习目标:使用 TensorFlow DNNRegressor 类定义神经网络 (NN) 及其隐藏层训练神经网络学习数据集中的非线性规律,并实现比线性回归模型更好的效果在之前的练习中,我们使用合成特征来帮助模型学习非线性规律。一组重要的非线性关系是纬度和经度的关系,但也可能存在其他非线性关系。现在我们从之前练习中的逻辑回归任务回到标准的(线性)回归任务。也就是说,我们将直接预测 med...
2018-03-21 23:40:47 252
原创 [机器学习速成课程] 稀疏性正则化 (Regularization for Sparsity)-学习笔记
稀疏性和 L1 正则化学习目标:计算模型大小通过应用 L1 正则化来增加稀疏性,以减小模型大小降低复杂性的一种方法是使用正则化函数,它会使权重正好为零。对于线性模型(例如线性回归),权重为零就相当于完全没有使用相应特征。除了可避免过拟合之外,生成的模型还会更加有效。L1 正则化是一种增加稀疏性的好方法。导入,跟之前一样import mathfrom IPython import display...
2018-03-20 00:18:49 7791
原创 [机器学习速成课程] 分类 (Classification):编程练习-学习笔记
逻辑回归学习目标:将(在之前的练习中构建的)房屋价值中位数预测模型重新构建为二元分类模型比较逻辑回归与线性回归解决二元分类问题的有效性将问题构建为二元分类问题数据集的目标是 median_house_value,它是一个数值(连续值)特征。我们可以通过向此连续值使用阈值来创建一个布尔值标签。我们希望通过某个城市街区的特征预测该街区的住房成本是否高昂。为了给训练数据和评估数据准备目标,我们针对房屋价...
2018-03-17 00:36:51 462
原创 [机器学习速成课程] 分类 (Classification)-学习笔记
准确率准确率是一个用于评估分类模型的指标。通俗来说,准确率是指我们的模型预测正确的结果所占的比例。正式点说,准确率的定义如下:对于二元分类,也可以根据正类别和负类别按如下方式计算准确率:其中,TP (True positive)= 真正例,TN(True negative) = 真负例, FP(False positive) = 假正例,FN(False negative) = 假...
2018-03-16 14:44:55 495
原创 [机器学习速成课程]简化正则化 (Regularization for Simplicity)-学习笔记
L₂ 正则化请查看以下泛化曲线,该曲线显示的是训练集和验证集相对于训练迭代次数的损失。图 1. 训练集和验证集损失。图 1 显示的是某个模型的训练损失逐渐减少,但验证损失最终增加。换言之,该泛化曲线显示该模型与训练集中的数据过拟合。根据奥卡姆剃刀定律,或许我们可以通过降低复杂模型的复杂度来防止过拟合,这种原则称为正则化。也就是说,并非只是以最小化损失(经验风险最小化)为目标:而是以最小化损失和复杂...
2018-03-16 13:26:53 677
原创 [机器学习速成课程]特征组合 (Feature Crosses)-学习笔记
特征组合学习目标:通过添加其他合成特征来改进线性回归模型(这是前一个练习的延续)使用输入函数将 Pandas DataFrame 对象转换为 Tensors,并在 fit() 和 predict() 中调用输入函数使用 FTRL 优化算法进行模型训练通过独热编码、分箱和特征组合创建新的合成特征设置与之前一样import mathfrom IPython import displayfrom ...
2018-03-12 23:27:56 5962
原创 [机器学习速成课程]表示 (Representation)-学习笔记
设置和之前一样,我们先加载并准备加利福尼亚州住房数据。import mathfrom IPython import displayfrom matplotlib import cmfrom matplotlib import gridspecfrom matplotlib import pyplot as pltimport numpy as npimport pandas as p...
2018-03-12 00:43:52 792
原创 [机器学习速成课程]验证 (Validation)-学习笔记
设置我们首先加载并准备数据。这一次,我们将使用多个特征,因此我们会将逻辑模块化,以对特征进行预处理:import mathfrom IPython import displayfrom matplotlib import cmfrom matplotlib import gridspecfrom matplotlib import pyplot as pltimport numpy a...
2018-03-11 23:52:53 3333
原创 [机器学习速成课程]使用 TensorFlow 的起始步骤(First Steps with TensorFlow)-学习笔记
设置在此第一个单元格中,我们将加载必要的库。import mathfrom IPython import displayfrom matplotlib import cmfrom matplotlib import gridspecfrom matplotlib import pyplot as pltimport numpy as npimport pandas as pdfro...
2018-03-11 23:13:24 1281
原创 [机器学习] nnCostFunction -学习笔记
在练习4的代码中:[a,b] = max([0 0 1 0 0 0 0 0 0 0; 0 1 0 0 0 0 0 0 0 0; 0 0 0 1 0 0 0 0 0 0],[],2)a = 1 1 1b = 3 2 4Y = eye(K)(y, :); 这行代码的作用:将十进制转换成10个位,例如:9变成0 0 0 0 0 0 0 0 1 0>>...
2018-03-10 23:20:20 856
原创 [机器学习] Non-linear Hypothesis -学习笔记
Suppose you are learning to recognize cars from 100×100 pixel images (grayscale, not RGB). Let the features be pixel intensity values. If you train logistic regression including all the quadratic term...
2018-03-08 23:00:07 1569 1
原创 [机器学习速成课程]表示法-学习笔记
编程学习 地址:https://colab.research.google.com/notebooks/mlcc/feature_sets.ipynb?hl=zh-cn#scrollTo=UzoZUSdLIolFQ1:为什么决定使用‘median_income’与‘latitude’作为minimal_features?minimal_features = [ "median_income", ...
2018-03-07 22:34:25 408
《MATLAB 神经网络43个案例分析》包含代码和测试数据
2018-04-08
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人