机器学习
文章平均质量分 93
机器学习基础
捌椒
这个作者很懒,什么都没留下…
展开
-
贝叶斯网络、马尔可夫模型、马尔可夫过程、马尔可夫链、马尔可夫网络基本概念
知识储备与简要概括可数集【Countable set】:是指每个元素都能与自然数集N的每个元素之间能建立一一对应的集合。如果将可数集的每个元素标上与它对应的那个自然数记号,那么可数集的元素就可以按自然数的顺序排成一个无穷序列a1,a2,a3,…an,…比如全体正偶数的集合是一个可数集,全体正奇数的集合也是可数集,它们与自然数集可以建立如下的一一对应可数集具有以下性质:1、可数集的子集是至多可数的;2、有限多个可数集的并集是可数的;3、在承认可数选择公理的前提下,可数多个可数集的并集是可原创 2021-04-03 21:31:55 · 4664 阅读 · 1 评论 -
深度学习之卷积网络手写数字图片识别案例
注意:该程序运行环境为:pycharm2020+python3.7+tensorflow2.2 cpu版本因为在学习的过程时,学习视频使用的是tensorflow2.x以下的版本,所以在运行中出现了许多错误,不过已经更正。下面代码都可正常运行。需注意的是:当导入mnist数据集时会报出ModuleNotFoundError: No module named ‘tensorflow.examples.tutorials’ 错误原因是tensorflow_core中缺tutorial文件夹解决办法就原创 2020-10-23 10:22:26 · 767 阅读 · 1 评论 -
深度学习之卷积神经网络
1、深度学习网络深度学习网络与更常见的单一隐藏层神经网络的区别在于深度,深度学习网络中,每一个节点层在前一层输出的基础上学习识别一组特定的特征。随着神经网络深度增加,节点所能识别的特征也就越来越复杂。1.1 卷积神经网络与简单的全连接神经网络的比较全连接神经网络的缺点参数太多,在cifar-10的数据集中,只有32 x 32 x 3,就会有这么多权重,如果说更大的图片,比如200 x 200 x 3就需要120000多个,这完全是浪费没有利用像素之间位置信息,对于图像识别任务来说,每个像素原创 2020-10-23 08:32:58 · 607 阅读 · 3 评论 -
机器学习之简单神经网络手写数字识别
def full_connected(): # 获取真实的数据 mnist = input_data.read_data_sets("./data/mnist/input_data/", one_hot=True) # 1、建立数据的占位符 x [None, 784] y_true [None, 10] with tf.variable_scope("data"): x = tf.placeholder(tf.float32, [None, 78..原创 2020-10-05 20:53:22 · 626 阅读 · 0 评论 -
深度学习之神经网络基础(一)
1 感知机1.1 感知机模型1.2 感知器的基本概念定义:有n个输入数据,通过权重与个数据之间的计算和,比较激活函数结果得到输出。其中threshold为激活函数,阈(yu)值:引申为界限或范围,下面为1.5,当结果大于1.5时输出为1,小于1.5时输出为0。2 神经网络结构2.1 神经网络的发展2.2神经网络的特点2.3 神经网络的结构笼统的讲,神经网络是由多个神经元(感知机)组成。2.4 神经网络在图片分类中的应用2.4.1 神经网络与其他算法的区别逻辑回归:sigmoi原创 2020-10-04 19:11:13 · 431 阅读 · 0 评论 -
机器学习之DBSCAN聚类算法
DBSCAN聚类算法的基本概念DBSCAN聚类算法代码的工作流程DBSCAN算法优势DBSCAN算法图解实例原创 2020-10-04 15:22:16 · 272 阅读 · 0 评论 -
机器学习之K-MEANS算法
K-NEANS算法基本概念K-NEANS算法基本工作流程1.指定k值2.指定添加K个中心点K-NEANS的迭代可视化展示原创 2020-10-04 15:38:40 · 195 阅读 · 0 评论 -
机器学习之决策树、随机森林
1. 认识决策树决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-then结构,最早的决策树就是利用这类结构分割数据的一种分类学习方法 。1.2 信息的度量和作用原创 2020-10-18 17:06:22 · 4881 阅读 · 0 评论 -
机器学习之线性回归、逻辑回归、岭回归和聚类算法
1. 回归算法–线性回归分析1.1 线性关系模型试图学得一个通过属性的线性组合来进行预测的函数:????(????)=????_1 ????_1+????_2 ????_2+…+????_???? ????_????+????w为权重,b称为偏置项,可以理解为:????_0×1---------------------------------------------------理解--------------------------------------------------原创 2020-10-13 17:24:30 · 1159 阅读 · 1 评论 -
机器学习之模型的选择与调优
1.交叉验证相关概念交叉验证:将拿到的数据,分为训练和验证集。以下图为例:将数据分成4份,其中一份作为验证集。然后经过4次(组)的测试,每次都更换不同的验证集。即得到4组模型的结果,取平均值作为最终结果。又称4折交叉验证。2.超参数搜索-网格搜索通常情况下,有很多参数是需要手动指定的 (如k-近邻算法中的K值),这种叫超参数。但是手动过程繁杂,所以需要对模型预设几种超参数组合。每组超参数都采用交叉验证来进行评估。最后选出最优参数组合建立模型。2.1 超参数搜索-网格搜索API2.2 交叉验证原创 2020-10-06 19:04:23 · 307 阅读 · 0 评论 -
机器学习之朴素贝叶斯算法
1. 机器学习算法分类1.1 知识储备【朴素贝叶斯算法】1.1.1 条件概率和联合概率1.1.2朴素贝叶斯-贝叶斯公式1.1.3 贝叶斯公式举例拉普拉斯平滑1.2 朴素贝叶斯算法案例1.2.1 sklearn朴素贝叶斯实现APIsklearn.naive_bayes.MultinomialNB(alpha = 1.0)朴素贝叶斯分类alpha:拉普拉斯平滑系数 默认为1.01.2.2 算法案例和流程sklearn 20类新闻分类20个新闻组数原创 2020-10-06 17:35:17 · 672 阅读 · 1 评论 -
机器学习之K-近邻算法(KNN)
1. 机器学习算法分类1.1 K-近邻算法定义定义:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。分类算法主要解决离散型数据。相似的样本,特征之间的值应该都是相近的。注意: K-近邻算法需要做标准化,防止某个特征的值过大影响预测,eg.预测电影属于的类型(假设k=3)因为与之最近的3个样本都是爱情片,故推测该电影属于爱情片1.2 计算距离公式(欧式距离)1.3 算法案例(预测酒店入住位置)1.3.1 算法案例说明原创 2020-10-06 16:02:53 · 926 阅读 · 0 评论 -
机器学习之PCA主成分分析
降维时选取特征值最大的特征向量,将该原创 2020-10-04 15:53:09 · 125 阅读 · 0 评论 -
机器学习算法分类及数据集划分
1. 需要明确的几个问题2. 数据类型和算法分类2.1 数据类型2.2 机器学习算法分类监督学习:既有特征值又有目标值。无监督学习:只有特征值,无目标值。2.3 监督学习2.3.1 分类 (离散型)1. K-近邻算法:2. 贝叶斯分类:3.决策树与随机森林:4.逻辑回归:5.神经网络:深度学习之神经网络基础(一)2.3.2 回归(连续型)聚类K-Means算法:机器学习之K-Means算法DBSCAN算法:机器学习之DBSCAN聚类算法3.机器原创 2020-10-06 11:08:37 · 4214 阅读 · 1 评论 -
机器学习基本知识概述
1. 什么是机器学习1.1 数据集的构成pandas:一个数据读取非常方便以及基本的处理格式的⼯具 真正的多线程 4个线程。 ==*numpy:释放了GIL*==sklearn:对于特征的处理提供了强大的接口。机器学习的数据:csv文件MySQL:1、性能瓶颈,读取速度2、格式不太符合机器学习要求数据的格式1.1.1 数据类型1.1.2 可用数据集kaggle地址 | UCI数据集网址|scikit_learn网址1.1.3 常用数据集数据的结构组成注意:有些原创 2020-10-05 11:03:49 · 308 阅读 · 0 评论