丢了橘子的夏天-CSDN博客

原创卷积神经网络

目前为止，我们仅仅通过将图像数据展平成一维向量而忽略了每个图像的空间结构信息，再将数据送入一个全连接的多层感知机中。因为这些网络特征元素的顺序是不变的，因此最优的结果是利用先验知识，即利用相近像素之间的相互相关联性，从图像数据中学习到有效的模型。表格数据我们找的模式可能设计特征之间的交互，但是我们不能预先假设任何与特征交互相关的先验结构，这种情况下多层感知机可能是最好的选择，然而对于高维感知数据，这种缺少结构的网络可能会变得不实用。卷积神经网络是一类强大的，为处理图像数据而设计的神经网络。

2023-10-19 21:14:42 86

原创如何找到最优线性回归模型

预测值（线性回归模型公式f（x）=wx+b）和真实值差的平方，求和，所有样本求和，但是为了构建一个不会随着训练集大小变大而自动变大的成本函数，我们将计算平均平方误差而不是总平方误差，我们通过像这样除以m来实现。按照惯例，机器学习使用的成本函数实际上是除以2乘以m，这里的额外除以2是为了让我们后面的一些计算看起来更整洁，有无除以2，成本函数仍然有效。在机器学习中，不同的人会针对不同的应用程序使用不同的成本函数，但是平方误差成本函数是线性回归最常用的函数。

2023-10-13 22:19:19 421

原创监督学习与无监督学习

监督学习（Supervised Learning）是机器学习的一种主要范式，它涉及使用带有标签的训练数据来训练模型，以便模型能够学习输入数据和输出标签之间的关系。在监督学习中，我们的目标是让模型从已知的训练数据中推断出一个映射，然后将该映射应用于新的未标记数据，以进行预测或分类。无监督学习的目标是从未标记的数据中发现数据中的结构、模式、关系或规律。：为了评估监督学习模型的性能，通常会将其应用于测试数据集，并使用不同的性能指标，如准确率、精确度、召回率、均方误差等来衡量模型的效果。

2023-10-10 22:10:13 178 1

原创机器学习介绍

机器学习（Machine Learning，缩写为ML）是人工智能（AI）的一个分支领域，它关注如何使计算机系统具备从经验中学习和改进性能的能力，而无需明确地编程。机器学习旨在让计算机系统能够自动识别模式、做出预测和进行决策，而无需进行显式的规则编码。

2023-10-10 20:17:54 141 1

原创梯度下降法

首先，定义一个损失函数，它用于衡量模型的性能，通常表示为 J(θ)，其中 θ 代表模型的参数。损失函数的选择取决于具体的问题，例如均方误差（Mean Squared Error）用于回归问题，交叉熵损失（Cross-Entropy Loss）用于分类问题。梯度下降法（Gradient Descent）是一种用于优化目标函数的迭代算法，通常用于机器学习和深度学习中，以调整模型参数以最小化损失函数。：一旦停止条件满足，梯度下降算法会返回最终的参数向量，这个向量使损失函数的值达到了局部最小值或全局最小值。

2023-10-10 16:01:32 111 1

原创吴恩达深度学习-学习笔记p7-p20

为了训练logistic回归模型的参数w以及b，需要定义一个成本函数，误差就是计算出来的预测值y和真实y值之间的差，误差平方看起来似乎是一个合理的选择，但是用这个的话，梯度下降法就不太好用，所以我们在logistic回归中我们定义一个不同的损失函数，它起着与误差平方相似的作用，这些会给我们一个凸的优化问题，就会很容易做优化。找到w和b，使得其对应的成本函数值J是最小值，现在可以看到成本函数是一个凸函数，为了找到更好的参数值，我们要做的就是用某初始值初始化w和b，凸函数底下的那个红点，

2023-10-07 01:56:20 137 1

原创 k近邻算法

官方概念：给定一个训练数据集，对新的输入实例，在训练数据集中找到与该实例最邻近的K个实例（也就是上面所说的K个邻居），这K个实例的多数属于某个类，就把该输入实例分类到这个类中。根据最下面的例子我们可以知道，求这个样本与那些测试集数据的属性的d（距离），从小到大排序，选取前k个数据，k个里面哪个所属标签多，这个样本就属于哪个标签。在特征空间中，如果一个样本附近的k个最近样本的大多数属于一个类别，则该样本也属于这个类别。k-Nearest Neighbor，KNN分类算法，是机器学习最简单的算法之一。

2023-09-27 21:05:51 72 1

原创 pandas数据处理

pandas是python的一个数据分析包，是基于numpy的一种工具，该工具是为了解决数据分析任务而创建的，它纳入了大量库和一些标准的数据模型，提供了高效的操作大型数据集所需的工具，提供了大量能够使我们快速便捷处理数据的函数和方法。我的理解：pandas是对数据操作的工具包，里面很多函数，比如我用过的。1)清除这一批数据里面的空行，空值，或者是异常于其它大部分值。2）dataframe函数为数据表格设置列名。3）set_option函数设置列名对齐。

2023-09-25 11:17:37 67 1

原创 sklearn之datasets数据集

波士顿房价boston，鸢尾花iris，糖尿病diabetes，手写数字mnist，，，，，等等，加载方式：datasets.load_xxx()，直接这种格式就行，无需从外部网站下载。网址：https://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/，较大数据集，必要时可以在线下载，用datasets.fetch_xx()加载，也就是他是最近几年的真实收集的数据，不是练习入门的数据集，你也可以下载在线的，也可以自己收集。

2023-09-25 11:16:42 381 1

原创鸢尾花识别

iris数据集包含了150个鸢尾花样本，对应3种鸢尾花，各50个样本，以及它们各自对应的4种关于花外形的数据，适用于分类任务。四个特征四个神经元。我们可以利用这些数据进行一个训练。

2023-09-24 22:43:13 950 1

原创识别手写数字

*全称scikit-learn是一个机器学习库，有一些算法是nist数据集的一个子集，mnist数据集可以在这个网站获取http://yann.lecun.com/exdb/mnist/，主要有下面这几个文件：文件内容：总共有6万个测试图像，1万个测试图像，图片标签其中：x_train 保存用来训练的图像，y_train 是与之对应的标签。假设图像中的数字是1，那么标签就是1。x_test 和 y_test 分别为用来验证的图像和标签，也就是验证集。

2023-09-23 18:37:36 106 1

原创吴恩达深度学习-学习笔记p1-p6

1.举例：根据面积预测房价假设有六个房子的房屋面积和价格，根据这个数据集，房屋面积预测房价的函数，这些是一个简单的神经网络神经元的功能就是输入面积完成线性运算，取不小于0的值，最后得到预测价格，这里我们叫这个函数为RELU（线性整流函数rectified linear unit，又称修正线性单元，是一种人工神经网络中常见的激活函数，通常指代以斜坡函数及其变种，他被广泛用于神经网络中。他的原理就是：对于输入的任何负值，输出都为0；对于输入的任何正值，输出与输入相同。即：f（x）=max（0，x）

2023-09-23 12:47:33 118 1