机器学习
机器学习
枫城雪
这个作者很懒,什么都没留下…
展开
-
22.深度学习——卷积神经网络
1、 深层的神经网络深度学习网络与更常见的单一隐藏层神经网络的区别在于深度,深度学习网络中,每一个节点层在前一层输出的基础上学习识别一组特定的特征。随着神经网络深度增加,节点所能识别的特征也就越来越复杂。2、卷积神经网络2.1、卷积神经网络与简单的单层神经网络的比较卷积神经网路的错误率很低。2.2、卷积神经网络的发展历史2.3、卷积神经网络的结构分析神经网络(neural networks)的基本组成包括输入层、隐藏层、输出层。而卷积神经网络的特点在于隐藏层分为卷积层和池化层(poo原创 2020-08-10 20:31:45 · 400 阅读 · 0 评论 -
21. 深度学习——感知机和人工神经网络
1、 感知机感知机用来解决分类问题的,线性回归可以解决回归问题。原创 2020-08-06 15:03:07 · 771 阅读 · 0 评论 -
tensorflow的API——tf.one_hot
tf.one_hot 在求交叉熵是会用到,要对目标值(标签值)进行one_hot编码。相当于将多个数值联合放在一起作为多个相同类型的向量,可用于表示各自的概率分布。比如在求交叉熵的时候:交叉熵公式:yi我们知道是softmax后的结果,也就是某个样本是所有类别的每一个类别的概率,yi’ 是真实的结果,也是一个概率,那应该是多少呢?刚刚说了one_hot相当于将多个数值联合放在一起作为多个相同类型的向量,可用于表示各自的概率分布;因此我计算交叉熵是这样的计算的:如上图,一个手写体识别的例子,手写体一原创 2020-08-06 10:50:29 · 215 阅读 · 0 评论 -
15. 深度学习——tensorflow实现线性回归和模型的保存、加载
小程序原创 2020-08-03 11:02:51 · 352 阅读 · 0 评论 -
18. 深度学习——图像的读取(笔记)
1. 图像基本知识像素值就是特征值单通道:每一个像素一个值,叫灰度值在[0~255]之间,三通道,每个像素点3个值。4-D张量是 [样本数,height, width, channels]缩放图片⼤小:减少像素的量;统⼀图⽚的⼤小,去进⾏算法识别。2. 图像基本操作API3.案例狗图片读取1、构造图片文件队列2、构造图片阅读器3、读取图片数据4、处理图片数据代码:import tensorflow as tfimport osmain_path = "F:/文本文件原创 2020-08-03 09:00:11 · 1129 阅读 · 0 评论 -
17.深度学习——文本文件的读取(笔记)
1. 文件读取的一般流程文件队列构造文件阅读器文件内容解码器批处理前3个步骤都是读取一个样本,第四步读取多个样本。2. 每个步骤需要的API读取数据中也用到线程的操作:3. 文件读取案例各种文本文件,这里使用的是txt文件,其他csv之类的都可以。import tensorflow as tfimport osmain_path = "F:/文本文件数据/"# 导入数据的准备file_name = os.listdir(main_path)print(file_原创 2020-08-01 20:26:04 · 519 阅读 · 0 评论 -
16. 深度学习——tensorflow队列和线程(笔记)
1、 Tensorflow队列队列的API1、同步操作示例:完成一个出队列、+1、入队列操作代码# 模拟一下同步操作,先处理数据,然后才能取数据训练import tensorflow as tf# 1.首先定义队列Q = tf.FIFOQueue(3, tf.float32)# 放入一些数据enq_many = Q.enqueue_many([[0.1, 0.2, 0.3], ]) # [,]用逗号隔开指定列表,防止与tensor混淆# 2.定义一些处理数据, 取数据的过程原创 2020-07-30 19:55:31 · 289 阅读 · 0 评论 -
14. 深度学习——Tensorflow基础(笔记)
1、认识Tensorflow1.1 Tensorflow特点2、Tensorflow关闭警告import osos.environ['TF_CPP_MIN_LOG_LEVEL']='2'2.1 图代码import tensorflow as tfimport osos.environ['TF_CPP_MIN_LOG_LEVEL'] = '2'a = tf.constant(3.0)b = tf.constant(2.0)sum = tf.add(a, b)print(原创 2020-07-30 11:30:20 · 181 阅读 · 0 评论 -
13. 机器学习——非监督学习 K-means (笔记)
非监督学习的特点?物以类聚,人以群分非监督学习(unsupervised learning)的方法主要有 K - meansk-means步骤1、k-means API• sklearn.cluster.KMeans2、Kmeans性能评估指标b_i>>a_i: 趋近于1 效果最好b_i<<a_i:趋近于 趋近于-1,效果不好 ,效果不好轮廓系数的值是介于 [-1,1] ,越趋近于1代表内聚度和分离度都相对较优3、Kmeans性能评估指标API• s原创 2020-07-30 10:19:02 · 163 阅读 · 0 评论 -
12. 机器学习——分类算法-逻辑回归
• 广告点击率• 是否为垃圾邮件• 是否患病• 金融诈骗• 虚假账号逻辑回归是解决二分类问题的利器逻辑回归可以和朴素贝叶斯一样给出一个样本属于某一类的概率。它是因为激活函数sigmoid逻辑回归:线性回归的式子作为的输⼊入逻辑回归是样本中那个类别少,就判断每一个样本是这个类别的概率,大于阈值0.5,就认为是否则不是这个类别。它的损失函数和优化对数似然损失函数,有点像之前的信息熵的求法。...原创 2020-07-28 11:03:26 · 143 阅读 · 0 评论 -
11. 机器学习——sklearn 中模型的保存和加载
sklearn模型的保存和加载from sklearn.externals import joblib示例;保存代码from sklearn.datasets import load_bostonfrom sklearn.linear_model import Ridgefrom sklearn.model_selection import train_test_splitfrom sklearn.preprocessing import StandardScalerfrom sklear原创 2020-07-27 11:28:23 · 736 阅读 · 0 评论 -
10. 机器学习——带正则化的岭回归(笔记)
1、过拟合与欠拟合问题:训练数据训练的很好啊,误差也不大,为什么在测试集上面有问题呢?欠拟合:过拟合分析上图1经过训练后,知道了天鹅是有翅膀的,天鹅的嘴巴是长长的。简单的认为有这些特征的都是天鹅。因为机器学习到的天鹅特征太少了,导致区分标准太粗糙,不能准确识别出天鹅。分析上图2机器通过这些图片来学习天鹅的特征,经过训练后,知道了天鹅是有翅膀的,天鹅的嘴巴是长长的弯曲的,天鹅的脖子是长长的有点曲度,天鹅的整个体型像一个"2"且略大于鸭子。这时候机器已经基本能区别天鹅和其他动物了。然后,很不巧已原创 2020-07-27 11:08:18 · 368 阅读 · 0 评论 -
9. 机器学习——线性回归(笔记)
1、回忆回归问题的判定?房价预测销售额预测贷款额度目标值是一个连续的值,就是回归问题。目标值是一个离散的值,就是分类问题。2、线性回归线性回归:寻找⼀一种能预测的趋势2.1 线性关系模型定义自变量就是特征值,因变量就是目标值矩阵:是⼤多数算法计算基础,接下来介绍矩阵和数组的区别2.2 矩阵和数组数组有很多维数,0维就是一个数值,1维、2维等,矩阵就只是有二维。矩阵的二维和数组的二维有啥区别?主要区别在于数学上的运算,数组有加法、乘法运算,矩阵也有乘法运算,矩阵的乘原创 2020-07-27 10:12:26 · 254 阅读 · 0 评论 -
8. 机器学习——分类算法-决策树、随机森林(笔记案例)
1、 决策树1.1 认识决策树决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-then结构,最早的决策树就是利用这类结构分割数据的一种分类学习方法。例子:你如何去划分是否能得到贷款?决策树的实际划分1.2 信息的度量和作用猜谁是冠军?假设有32支球队每猜一次给一块钱,告诉我是否猜对了,那么我需要掏多少钱才能知道谁是冠军?我可以把球编上号,从1到32,然后提问:冠 军在1-16号吗?依次询问,只需要五次,就可以知道结果。32支球队,log32=5比特64支球队,log6原创 2020-07-20 17:27:19 · 771 阅读 · 0 评论 -
7.机器学习——交叉验证和网格搜索(模型的选择与调优)
1.模型的选择与调优交叉验证:为了让被评估的模型更加准确可信1.1 交叉验证过程交叉验证:将拿到的训练数据,分为训练和验证集。以下图为例:将数据分成4份,其中一份作为验证集。然后经过4次(组)的测试,每次都更换不同的验证集。即得到4组模型的结果,取平均值作为最终结果。又称4折交叉验证。1.2 超参数搜索-网格搜索1.3 超参数搜索-网格搜索API代码案例在随机森林部分演示...原创 2020-07-20 11:34:20 · 556 阅读 · 0 评论 -
6. 机器学习——精确率与召回率(笔记)
1. 分类模型的评估• estimator.score()• 一般最常见使用的是准确率,即预测结果正确的百分比1.1 混淆矩阵上面的不需要记,只要记住精确率和召回率。其中召回率考虑的比较多。1.2 精确率(Precision)与召回率(Recall)其他分类标准,F1-score,反映了模型的稳健型2. 分类模型评估API sklearn.metrics.classification_report代码演示from sklearn.naive_bayes import Multin原创 2020-07-20 11:23:13 · 429 阅读 · 0 评论 -
5. 机器学习——分类算法-朴素贝叶斯算法(笔记)
1. 常见的例子1.1 垃圾邮件分类1.2 文章分类2. 概率基础简单的一个例子,职业和体型与女神是否喜欢的关系:2.1 联合概率和条件概率可以看到第一问题很简单4/7,第二个问题是求联合概率 p(程序员,匀称) = p(程序员)p(匀称) = 3/7 * 4/7=12/49。第三个问题是条件概率,p(程序员|喜欢) = 2/4 ;第4个问题也是条件概率,P(产品,超重|喜欢) = P(产品|喜欢)P(超重|喜欢) = 1/2*(1/4) = 1/83. 朴素贝叶斯-贝叶斯公式原创 2020-07-19 19:19:52 · 258 阅读 · 0 评论 -
4. 机器学习——分类算法-k近邻算法
1.KNN的思想通过你的“邻居”来推断出你的类别。比如下面的表格判断最后一部电影是什么类型的,通过计算6部电影与未知电影的距离,从而判断未知电影属于哪一种类型。可以看到第二部电影和未知电影的距离最近,而第二部电影是爱情片,所以未知电影也是爱情片。2.KNN的定义3. 计算距离公式4.sklearn k-近邻算法API5.KNN案例...原创 2020-07-17 20:56:13 · 123 阅读 · 0 评论 -
3. 机器学习——sklearn数据集划分与转换器、估计器
一、数据集划分机器学习一般的数据集会划分为两个部分:训练数据:用于训练,构建模型测试数据:在模型检验时使用,用于评估模型是否有效1.sklearn数据集划分APIsklearn.model_selection.train_test_splitscikit-learn数据集API介绍from sklearn.datasets import load_irisli = load_iris()print('获取特征值')print(li.data)print('获取目标值')pr原创 2020-07-15 21:35:38 · 247 阅读 · 0 评论 -
2. 机器学习——数据的特征预处理(笔记)
1. 特征处理是什么 通过特定的统计方法(数学方法)将数据转换成算法要求的数据。这里主要说数值型数据的预处理。2. 归一化为什么需要归一化比如上面的案例,三个特征同等重要,当一组特征里面的数据很大,而另一组特征数据很小时,比如在K最近邻算法中通过距离,来判断某个数据属于那一类,(72993-35948)^2 + (10.14-6.8)2+(1.0-1.21)2可以看到,数据大的占的比重大会对结果造成很大的影响。原创 2020-06-12 22:03:14 · 225 阅读 · 0 评论 -
1. 机器学习——概述、数据的特征抽取(笔记)
1.人工智能、机器学习、深度学习的关系机器学习可以做什么。学习的书籍推荐学习目标2. 什么是机器学习机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测。从历史数据当中获得规律?这些历史数据是怎么的格式?3. 数据集的结构1. 可用的数据集2. 数据集结构特征值就是房子的面积、位置、楼层、朝向;目标值就是房价。数据中对于特征处理两个包:1.pandas:一个数据读取非常方便以及基本的处理格式的工具;2.sklearn:对于特征的处理提供了强大的接口原创 2020-06-12 11:40:18 · 721 阅读 · 0 评论 -
tf.transpose()函数的理解
tf.transpose()函数的理解简介:参数a表示传入数组假如传入的数组input1如下:import tensorflow as tfimport numpy as npinput1=np.arange(24).reshape((2,3,4))print(input1)input1:[[[ 0 1 2 3] [ 4 5 6 7] [ 8 9 10 ...原创 2019-10-29 16:49:30 · 587 阅读 · 0 评论 -
卷积函数的使用——使用卷积提取图片的轮廓
使用卷积提取图片的轮廓简介: 使用sobel算子,将彩色图片生成带有边缘化信息的图片。本例先载入一张图片,然后使用一个“3通道输入,1通道输出的3x3卷积核”(也就是sobel算子),因为是彩色(三通道)图片,所以使用是三通道。1.首先载入图片:...原创 2019-10-28 17:09:08 · 1411 阅读 · 0 评论 -
numpy.loadtxt() 详细用法
1.numpy.loadtxt 用法 读取txt文件numpy.loadtxt(fname, dtype=, comments='#', delimiter=None, converters=None, skiprows=0, usecols=None, unpack=False, ndmin=0)参数的作用如下:fnameimport numpy as np# 首先给出最简单的l...原创 2019-10-25 19:30:25 · 25023 阅读 · 3 评论 -
卷积函数tf.nn.conv2d()第一部分——介绍(个人笔记)
卷积函数tf.nn.conv2d()tensorflow中使用tf.nn.conv2d()函数实现卷积操作,格式如下:除去参数name,与方法有关的参数共5个,代表的含义:input:需要做卷积的输入图像,要求是一个张量(Tensor),形状是: [batch, in_height, in_width, ...原创 2019-10-24 21:24:11 · 346 阅读 · 0 评论 -
全连接网络训练中的优化技巧(个人笔记)
全连接网络训练中的优化技巧1.欠拟合没有完全拟合到想要得到的真实数据情况2.过拟合原创 2019-10-23 14:44:05 · 2304 阅读 · 0 评论 -
使用带隐含层的神经网络拟合异或操作
使用带隐含层的神经网络拟合异或操作*实例描述:通过构建符合异或规律的数据集作为模拟样本,构建一个简单的多层神经网络来拟合其样本特征完成分类任务。1.数据集介绍所谓的“异或数据”是来源于异或操作。从a)可以看出,当两个数相同时,输出为0,不相同时输出为1,这就是异或的规则。表示为两类数据就是(0, 0)和(1, 1)为一类,(0, 1)和(1, 0)为一类。2.网络模型介绍...原创 2019-10-22 20:24:25 · 557 阅读 · 0 评论