机器学习
文章平均质量分 72
Charliefive
love不如live好
展开
-
Python3《机器学习实战》学习笔记(七):支持向量机原理篇之手撕线性SVM
SVM的英文全称是Support Vector Machines,我们叫它支持向量机。支持向量机是我们用于分类的一种算法。可以参考大佬博客链接:关于对SVM的介绍。SVM就是试图把棍放在最佳位置,好让在棍的两边有尽可能大的间隙。这个间隙就是球到棍的距离。再之后,把这些球叫做data,把棍子叫做classifier, 找到最大间隙的trick叫做,拍桌子叫做kernelling, 那张纸叫做hyperplane。概况问题。原创 2023-04-23 11:57:18 · 571 阅读 · 0 评论 -
Python3《机器学习实战》学习笔记(十):ANN人工神经网络代码详解(数字识别案例以及人脸识别案例)
学习了ANN,手动实现正反向传播,但是准确率很差,浮动在70-80之间。手动实现的感觉就这水平了,没有pytorch框架运行的准确率高。希望继续加油2022快点过去吧。原创 2022-11-16 20:45:45 · 2188 阅读 · 1 评论 -
Python3《机器学习实战》学习笔记(九):ANN人工神经网络基础详解
人工神经网络(Artificial Neural Network,即ANN ),是20世纪80 年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象, 建立某种简单模型,按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型,由大量的节点(或称神经元)之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数(activation function)。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重。原创 2022-11-16 20:28:55 · 1231 阅读 · 0 评论 -
Python3《机器学习实战》学习笔记(六):Logistic回归实战篇之预测病马死亡率
我们使用的数据集一共有100个样本。那么,dataMatrix就是一个1003的矩阵。每次计算h的时候,都要计算dataMatrixweights这个矩阵乘法运算,要进行1003次乘法运算和1002次加法运算。同理,更新回归系数(最优参数)weights时,也需要用到整个数据集,要进行矩阵乘法运算。总而言之,该方法处理100个左右的数据集时尚可,但如果有数十亿样本和成千上万的特征,那么该方法的计算复杂度就太高了。原创 2022-10-28 19:58:37 · 886 阅读 · 0 评论 -
Python3《机器学习实战》学习笔记(五):Logistic回归基础篇之梯度上升算法
通过Logistic回归和梯度上升两方法开始,首先从原理开始推论。收集数据:采用任意方法收集数据。准备数据:由于需要进行距离计算,因此要求数据类型为数值型。另外,结构化数据格式则最佳。分析数据:采用任意方法对数据进行分析。训练算法:大部分时间将用于训练,训练的目的是为了找到最佳的分类回归系数。测试算法:一旦训练步骤完成,分类将会很快。使用算法:首先,我们需要输入一些数据,并将其转换成对应的结构化数值;接着,基于训练好的回归系数,就可以对这些数值进行简单的回归计算,判定它们属于哪个类别;原创 2022-10-28 15:41:34 · 1136 阅读 · 0 评论 -
Python3《机器学习实战》学习笔记(四):朴素贝叶斯实战篇之新浪新闻分类
在训练朴素贝叶斯分类器之前,要处理好训练集,文本的清洗还是有很多需要学习的东西。根据提取的分类特征将文本向量化,然后训练朴素贝叶斯分类器。分类的时候也是一样的去高频词汇数量的不同,对结果也是有影响的的。拉普拉斯平滑对于改善朴素贝叶斯分类器的分类效果有着积极的作用。原创 2022-10-27 15:14:14 · 744 阅读 · 0 评论 -
Python3《机器学习实战》学习笔记(三):朴素贝叶斯基础篇之言论过滤器
一种有监督学习算法,解决的是分类问题,如客户是否流失、是否值得投资、信用等级评定等多分类问题。在某些领域的分类问题中能够与决策树、神经网络相媲美。但由于该算法以自变量之间的独立(条件特征独立)性和连续变量的正态性假设为前提,就会导致算法精度在某种程度上受影响。是基于概率和误判损失选择最优的类别标记生成式模型,通过计算概率来进行分类,可以用来处理多分类问题。对小规模的数据表现很好,适合多分类任务,适合增量式训练,算法也比较简单。对输入数据的表达形式很敏感。原创 2022-10-27 09:59:21 · 345 阅读 · 0 评论 -
Python3《机器学习实战》学习笔记(二):决策树
决策树的分析学习和代码应用原创 2022-10-26 13:49:28 · 707 阅读 · 0 评论 -
机器学习(四)过拟合问题
过拟合问题欠拟合和过拟合两种情况都会导致不准确,中间这种情况会相对准确一点。如果我们有太多的特征,会拟合的很好,但是可能不能识别新的数据减少特征的数量正则化:保留所有的特征,但减少magnitude/values(权重)代价函数使theta3, theta4更小,则theta3, theta4更趋近0才更满足要求,即加入惩罚theta3, theta4更趋近0,相当于简化模型,函数更平滑更简单cost函数(约定俗称 从j=1开始)λ是正则化参数,后边那一堆的作用就是,降低不重要参原创 2022-01-21 20:04:38 · 667 阅读 · 0 评论 -
Python3《机器学习实战》学习笔记(一):k-近邻算法
1.k-近邻法简介1.1 k-近邻法简介存在一个样本数据集合,也称作为训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一个数据与所属分类的对应关系。输入没有标签的新数据后,将新的数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本最相似数据(最近邻)的分类标签。一般来说,我们只选择样本数据集中前k个最相似的数据,这就是k-近邻算法中k的出处,通常k是不大于20的整数。最后,选择k个最相似数据中出现次数最多的分类,作为新数据的分类。举个简单的例子,我们可以使用k-近邻算法分类原创 2022-01-21 13:37:54 · 345 阅读 · 0 评论 -
PyTorch深度学习入门笔记(三)TensorBoard的使用
首先安装TensorBoard从函数介绍可知:这个类主要是将事件文件写入 log_dir文件夹,可以被TensorBoard解析。要用到其成员函数 add_scalar()pip install tensorboardfrom torch.utils.tensorboard import SummaryWriterdef add_scalar( self, tag, scalar_value, global_step=None,原创 2022-01-20 18:19:05 · 941 阅读 · 0 评论 -
PyTorch深度学习入门笔记(二)PyTorch加载数据初认识
一些简单函数的使用获取数据集的数据# Kyrie Irving# !/9462...from torch.utils.data import Datasetimport cv2from PIL import Imageimport os# img = cv2.imread('E:\\CodeCodeCodeCode\\Python-data\\hymenoptera_data\\train\\ants\\5650366_e22b7e1065.jpg', 0)# cv2.imshow('a原创 2022-01-20 17:17:00 · 285 阅读 · 0 评论 -
PyTorch-GPU CUDA cuDnn安装, 入门学习笔记
PyTorch 1.6学习安装1.对Anaconda进行一个新的用于pytorch的分区conda create -n pytorch python=3.6(base) C:\Users\26330>conda activate pytorch(pytorch) C:\Users\26330>pip listPackage Version---------- -------pip 21.3.1setuptools 58.0.4wheel 0.原创 2022-01-20 17:15:10 · 458 阅读 · 0 评论 -
机器学习(三)处理分类以及logistic回归算法的应用
logistic回归算法分类线性回归一般不用于分类问题假设陈述条件概率决策界限不同的参数,可以转化为不同的数学模型,同时也是不同的数学图像逐步转化为概率问题。代价函数为了转化为凸优化函数,有极值如果y=1(条件)且h(x)(y=1下的预测值)等于1 他俩相等,说明预测正确了,Cost(代价值)(惩罚)为0。如果y=1(条件)且h(x)(y=1下的预测值)等于0 他俩完全不相等,说明预测错误了,Cost(代价值)(惩罚)为1。如果y=0(条件)且h(x)(y=0下的预原创 2022-01-20 02:26:42 · 190 阅读 · 0 评论 -
机器学习(二)多元梯度
多元梯度机器学习公式的变化特征缩放 归一化作业一已经用过这个方法了学习率学习率太小的话 收敛速度慢学习率太大的话 会导致这样的结果 可能不会每次迭代都下降 甚至可能不收敛特征和多项式回归将一个变量的多次 拟合在一个方程中正规方程法导数为0 各个偏导均为0下图中的thete是为了求X的左逆,乘转置是为了它拥有逆矩阵,免得没法算了梯度缺点:1.选择学习效率,运行多次2.多次迭代,速度可能慢正规方程1.不需要学习效率和迭代2.如果n很大 时间复杂度O(n2)很慢原创 2022-01-20 00:22:15 · 790 阅读 · 0 评论 -
吴恩达机器学习作业Python实现(一):线性回归
单变量线性回归题目在本部分的练习中,您将使用一个变量实现线性回归,以预测食品卡车的利润。假设你是一家餐馆的首席执行官,正在考虑不同的城市开设一个新的分店。该连锁店已经在各个城市拥有卡车,而且你有来自城市的利润和人口数据。您希望使用这些数据来帮助您选择将哪个城市扩展到下一个城市。数据6.1101,17.5925.5277,9.13028.5186,13.6627.0032,11.8545.8598,6.82338.3829,11.8867.4764,4.34838.5781,126原创 2022-01-19 21:55:59 · 1046 阅读 · 1 评论 -
机器学习系列课程入门
吴恩达机器学习系列课程原创 2022-01-18 19:46:18 · 143 阅读 · 0 评论