python之机器学习
文章平均质量分 50
理论加实战
陨星落云
这个作者很懒,什么都没留下…
展开
-
DLL load failed while importing _imaging: 找不到指定的模块的解决方法
版权声明:本文为CSDN博主「masteryi-0018」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。原文链接:https://blog.csdn.net/qq_45510888/article/details/121446878。python与pillow的版本关系。卸载当前版本,安装6.2.1版本。转载 2023-12-14 11:22:16 · 3061 阅读 · 0 评论 -
一文了解决策树
决策树决策树是一种非参数监督学习算法,用于分类和回归任务。它具有分层的树结构,由根节点、分支、内部节点和叶节点组成。从上图中可以看出,决策树从一个根节点开始,它没有任何传入的分支。然后从根节点传出的分支馈送到内部节点,也称为决策节点。根据可用特征,两种节点类型都进行评估以形成同质子集,这些子集由叶节点或终端节点表示。叶节点代表数据集中所有可能的结果。例如,假设您正在尝试评估是否应该去冲浪,您可以使用以下决策规则来做出选择:这种类型的流程图结构还创建了一个易于理解的决策表示,允许组织中的不同组更好地翻译 2022-05-07 11:07:01 · 1384 阅读 · 0 评论 -
将sklearn中的分类报告保存为表格csv
import numpy as npimport pandas as pdfrom sklearn.metrics import classification_reportdef save_classification_report(y_true,y_pred,target_names,save_path): # 将分类报告保存至csv文件 acc_report_df = pd.DataFrame(classification_report(y_true, y_pred, targe原创 2021-09-10 15:55:45 · 1085 阅读 · 0 评论 -
pytorch使用dropout防止过拟合
推测与验证现在您已经学会了训练网络,可以将其用于进行预测。 这通常称为推测,是从统计信息中借用的术语。 但是,神经网络倾向于在训练数据上表现得太好,并且无法将其推广到以前从未见过的数据,这称为过拟合,它会削弱推理性能。 为了在训练过程中发现过拟合,我们不在训练集中测试,而在验证集测试性能。 我们在训练过程中监控验证效果时,通过正则化(例如dropout)来避免过拟合。我将向您展示如何在PyTor...翻译 2020-04-07 10:33:16 · 3345 阅读 · 3 评论 -
Fashion-MNIST 分类
Fashion-MNIST 分类构建和训练神经网络。 您将使用Fashion-MNIST数据集,它是MNIST数据集的替代品。 MNIST实际上对于神经网络来说是微不足道的,您可以轻松地获得优于97%的精度。 Fashion-MNIST是一组28x28灰度的衣服图像。 它比MNIST更复杂,因此可以更好地表示神经网络的实际性能,并且可以更好地表示您将在现实世界中使用的数据集。在这里,您将构建...翻译 2020-04-04 19:59:08 · 6985 阅读 · 2 评论 -
pytorch实现mnist手写数字识别(二)
训练神经网络在上一部分中,我们建立的神经网络不是那么好,它对我们的手写数字一无所知。 神经网络的非线性激活函数工作方式类似于通用函数拟合。 有一些函数,可以将您的输入映射到输出。 例如,将手写数字图像分类的概率。 神经网络的强大之处,在于我们可以训练它们以逼近该F函数。只要给定任何具有足够数据和计算时间,就可以得到F函数,但这个函数可能非常复杂。起初,网络是无知的,它不知道将输入映射到输出函...翻译 2020-03-31 15:59:39 · 1315 阅读 · 1 评论 -
分析加州大学学生录取的数据
# -*- coding: utf-8 -*-"""Created on Thu Mar 26 13:34:04 2020@author: 陨星落云"""import pandas as pdimport numpy as npimport matplotlib.pyplot as plt# 读取数据data = pd.read_csv('student_data.csv')...转载 2020-03-26 16:05:00 · 329 阅读 · 0 评论 -
pytorch之线性代数
文章目录矩阵1. 矩阵初始化2. 矩阵元素运算3. 矩阵的乘法4. 矩阵的转置5. 矩阵对应列行的最大值,最小值,和6. 矩阵的其他操作:行列数、切片、复制、非0元素的下标7. 矩阵的行列式8. 矩阵的逆和伪逆9. 矩阵的对称10. 矩阵的秩、迹11. 矩阵求解12. 矩阵的特征值与特征向量(EVD)矩阵1. 矩阵初始化Tensor的初始化# 全零矩阵In [1]: import to...原创 2020-03-23 16:51:19 · 2238 阅读 · 0 评论 -
用感知器实现“与”运算
用感知器实现逻辑运算 - AND (“与”)# -*- coding: utf-8 -*-"""Created on Sat Mar 21 12:01:05 2020@author: 陨星落云"""import pandas as pd# 设置权重与偏置项weight1 = 1weight2 = 1bias = -1.5# 输入与输出test_inputs = [(...原创 2020-03-21 19:23:10 · 1435 阅读 · 0 评论 -
感知机学习算法
感知机学习算法感知机学习算法的原始形式输入:训练数据集 T={,)()(x1,y1),(x2,y2)…(xn,yn),)()(x_1,y_1),(x_2,y_2)…(x_n,y_n),)()(x1,y1),(x2,y2)…(xn,yn)},其中x∈=R,y∈y={-1,+1},i=1,2,…,n学习率 : r(0<r≤1)输出:w,b;感知机模型f(x)=sign(w...原创 2020-03-12 19:25:09 · 656 阅读 · 0 评论 -
K近邻算法(KNN)
K邻近算法(KNN)kNN 可以说是最简单的监督学习分类器了。想法也很简单,就是找出测试数据在特征空间中的最近邻居。我们将使用下面的图片介绍它。上图中的对象可以分成两组,蓝色方块和红色三角。每一组也可以称为一个类。我们可以把所有的这些对象看成是一个城镇中房子,而所有的房子分别属于蓝色和红色家族,而这个城镇就是所谓的特征空间。现在城镇中来了一个新人,他的新房子用绿色圆盘表示。我们要根据他房子...原创 2019-05-13 13:53:31 · 583 阅读 · 0 评论 -
机器学习之特征工程
1.Scikit-learn与特征工程1.1 数据来源与类型大部分的数据都来数据库或者爬虫以及平时的记录等。 数据的类型 按照机器学习的数据分类,可以将数据分成: 标称型:标称型目标变量的结果只在有限目标集中取值,如真与假(标称型目标变量主要用于分类) 数值型:数值型目标变量则可以从无限的数值集合中取值,如0.100,42.001等 (数值型目标变量主要用于回归分析) ...原创 2019-04-21 20:30:00 · 302 阅读 · 0 评论 -
朴素贝叶斯
朴素贝叶斯朴素贝叶斯分类器是一个以贝叶斯定理为基础的多分类的分类器。对于给定数据,首先基于特征的条件独立性假设,学习输入输出的联合概率分布,然后基于此模型,对给定的输入x,利用贝叶斯定理求出后验概率最大的输出y。概率论基础概率定义为一件事情发生的可能性。事情发生的概率可以通过观测数据中的事件发生次数来计算,事件发生的概率等于该事件发生次数除以所有事件发生的总次数。举一些例子:扔出一个硬...原创 2019-05-18 22:00:18 · 526 阅读 · 0 评论 -
sklearn库介绍
sklearn库的共分为6大部分,分别用于完成数据的预处理、模型选择、分类任务、回归任务、聚类任务和降维任务。分类任务回归任务聚类任务降维任务...原创 2019-05-18 22:02:48 · 2552 阅读 · 0 评论 -
scikit-learn数据集介绍
scikit-learn数据集我们将介绍sklearn中的数据集类,模块包括用于加载数据集的实用程序,包括加载和获取流行参考数据集的方法。它还具有一些人工数据生成器。sklearn数据集sklearn.datasets(1)datasets.load_*()获取小规模数据集,数据包含在datasets里(2)datasets.fetch_*()获取大规模数据集,需要从网...原创 2019-05-18 22:06:16 · 3879 阅读 · 0 评论 -
回归模型常见的损失函数
机器学习中的所有算法都依赖于最小化或最大化函数,我们将其称为“目标函数”。最小化的函数组称为“损失函数”。损失函数是衡量预测模型在能够预测预期结果方面的表现有多好的指标。寻找最小值的最常用方法是“梯度下降”。想想这个函数的作用,如起伏的山脉和梯度下降就像滑下山到达最低点。没有一种损失函数适用于所有类型的数据。它取决于许多因素,包括异常值的存在,机器学习算法的选择,梯度下降的时间效率,易于找到衍生...翻译 2019-05-21 01:17:44 · 20688 阅读 · 0 评论 -
线性回归模型
回归算法线性回归线性回归的定义是:目标值预期是输入变量的线性组合。线性模型形式简单、易于建模,但却蕴含着机器学习中一些重要的基本思想。线性回归,是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。优点:结果易于理解,计算不复杂缺点:对非线性的数据拟合不好适用数据类型:数值型和标称型将要用来描述这个回归问题的标记如下:mmm 代表...原创 2019-05-21 10:33:22 · 10212 阅读 · 0 评论 -
决策树
决策树决策树是一种基本的分类方法,当然也可以用于回归。决策树模型呈树形结构。在分类问题中,表示基于特征对实例进行分类的过程,它可以认为是if-then规则的集合。在决策树的结构中,每一个实例都被一条路径或者一条规则所覆盖。通常决策树学习包括三个步骤:特征选择、决策树的生成和决策树的修剪优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理逻辑回归等不能解决的非线性特征数据缺...原创 2019-05-13 13:43:59 · 339 阅读 · 0 评论 -
划分训练、测试集和数据观察
训练集与测试集一般在进行模型的测试时,我们会将数据分为训练集和测试集。在给定的样本空间中,拿出大部分样本作为训练集来训练模型,剩余的小部分样本使用刚建立的模型进行预测。 训练集与测试集 train_test_split 函数利用伪随机数生成器将数据集打乱。默认情况下0.75为训练集,0.25测试集。 sklearn.model_selection.train_test_spli...原创 2019-05-07 12:26:00 · 1092 阅读 · 0 评论