机器学习
文章平均质量分 86
风轻云淡_Cauchy
这个作者很懒,什么都没留下…
展开
-
1.4 机器学习方法之回归问题
回归分析用于预测输入变量和输出变量之间的关系,特别是当输入变量的值发生变化时,输出变量值也随之发生变化。原创 2022-06-25 11:19:58 · 518 阅读 · 0 评论 -
1.3 机器学习方法之分类问题--决策树、贝叶斯、SVM支持向量机、逻辑回归
分类问题是监督学习的一个核心问题,它从数据中心学习一个分类决策函数或分类模型,对新的输入进行输出预测,输出变量取有限个离散值。决策树、贝叶斯、SVM支持向量机、逻辑回归、集成学习。......原创 2022-06-03 22:30:50 · 1265 阅读 · 0 评论 -
1.2 机器学习准备
机器学习的一般过程:① 数据预处理:数据清洗、数据采样、数据集拆分② 特征工程:特征选择、特征降维、特征编码、规范化。③ 模型选择④ 模型训练和测试⑤ 模型性能评估和优化1) 数据清洗对各种脏数据进行对应方式的处理,得到标准、干净、连续的数据,提供给数据统计、数据挖掘等使用。数据的完整性、数据的合法性、数据的唯一性、数据的权威性以及数据的一致性等。2) 数据采样要避免数据的不平衡(数据集的类别分布不均)3) 数据集拆分训练数据集、验证数据集、测试数据集。K-折交叉验证法:把训练样例分成k原创 2022-06-03 21:27:47 · 309 阅读 · 0 评论 -
机器学习之预备知识
表示随机变量的不确定性,熵越大不确定性越大。在决策树算法中,熵是一个非常非常重要的概念。一件事发生的概率越小,我们说它所蕴含的信息量越大。比如:我们听女人能怀孕不奇怪,如果某天听到哪个男人怀孕了,那这个信息量就很大了…。所以我们这样衡量信息量:信息熵就是所有可能发生的事件的信息量的期望:已知随机变量 X的条件下随机变量 Y的不确定性相对熵也称为KL散度(Kullback-Leibler divergence),表示同一个随机变量的两个不同分布间的距离。设 p(x),q(x) 分别是 离散随机变量原创 2022-06-03 21:10:46 · 197 阅读 · 0 评论 -
Tensorflow之逻辑回归二分类以及交叉熵
1. 交叉熵其中是Sigmoid 函数2. Tensorflow 逻辑回归二分类示例import osimport tensorflow as tffrom numpy.random import RandomStateimport matplotlib.pyplot as pltimport numpy as np# 忽略不想提示警告错误的信息# 1是提示,2是警告,3是错误os.environ['TF_CPP_MIN_LOG_LEVEL']='2'batch_size =原创 2020-09-07 20:50:43 · 595 阅读 · 0 评论 -
VS Code更改默认的python环境
因为我电脑的python环境都在Anaconda里,而且base env下的python版本无法安装tensorflow。所以VS Code中的python代码(特别是Tensorflow相关)利用 VS Code的Python插件,运行出错,用的python环境是Anaconda的base env下的python。因此,需要更改下VS Code的python环境。具体操作如下:在VS Code的File工具栏找到Preferences。选择Preferences的Settings选项。在输入栏输原创 2020-08-21 16:22:06 · 22856 阅读 · 0 评论 -
Anaconda安装tensorflow遇到的一个问题
相信很多同仁们在Anaconda中安装tensorflow,会遇到这样那样的问题,导致安装失败。现在就我在安装中遇到的问题,和大家分享一下。有不正确的地方,望各位指正。1. 遇到的问题因为我安装的最新Anaconda带的python默认版本为3.8.5。所以我要在默认的3.8.5python版本环境下,安装tensorflow,但是始终安装失败。提示信息:tensorflow目前支持到3.5、3.6、3.7。没有python3.8。2. 更换python环境3.5,并安装tensorflow2.1原创 2020-08-21 09:59:37 · 235 阅读 · 0 评论 -
Anaconda 更换默认python环境
Anaconda 更换默认python环境备注:此方案只针对Windows环境。在\Anaconda\Scripts\的脚本activate.bat的“@CALL “%~dp0…\condabin\conda.bat” activate %” 行中,将“%“”改为你创建的所需python环境env。比如“python35”@REM Copyright (C) 2012 Anaconda, Inc@REM SPDX-License-Identifier: BSD-3-Clause@REM Test原创 2020-08-21 09:36:23 · 1980 阅读 · 0 评论 -
Tensorflow之简单的线性和非线性拟合
1. 线性拟合import tensorflow as tfimport numpy as npimport matplotlib.pyplot as pltdef get_data(number): list_x = np.random.rand(number) list_label = 2 * list_x + 2 return list_x, list_labelw = tf.Variable(0.0)b = tf.Variable(0.0)X = tf.p原创 2020-08-12 08:39:30 · 375 阅读 · 0 评论 -
Tensorflow之L1和L2正则化
1. 数学中的L1和L2正则化在数学中,L1正则化是向量各个元素绝对值之和;L2正则化是向量各个元素平方后,再求和。2. Tensorflow中L1和L2在Tensorflow中,对数学中的L1和L2,加入了惩罚系数scale;且,这个惩罚系数暴露给开发者,根据实际,实时调节惩罚系数。数学公式即为:L1:scale*(|x1|+|x2|+…+|xn|)L2:scale*(|x1|**2 + |x2|**2 + … + |xn|**2)/22.1 L1的接口…\Lib\site-packag原创 2020-08-11 10:55:54 · 2008 阅读 · 0 评论 -
机器学习之线性回归最小二乘法
1. 线性回归线性回归算法假设特征和结果满足线性关系。这就意味着可以将输入项分别乘以一些常量,再将结果加起来得到输出。2. 最小二乘法线性拟合。将拟合函数取 线性函数或多项 式函数是一种简 单的数据拟合方法。确定线性拟合函数 φ(x)=a+bx, 称为对数据的线性拟合。对于线性拟合问题,需要求函数的最小值点。由函数对两个变量求导数,得令其等于零,得正规方程组转换成矩阵方式求出a和b。类似上面推导,数据的多项式拟合问题中,为了确定拟合函数的系数,需要求解正规方程组2.1 pyth原创 2020-07-21 10:15:50 · 609 阅读 · 0 评论 -
1.5机器学习方法之聚类问题
K均值聚类:首先随机确定K个中心点作为聚类中心,然后将每个数据点分配给最邻近的中心点,分配完成后形成K个聚类,计算各个聚类的平均中心点,将其作为该聚类新的类中心点,然后重复迭代以上步骤直到分配过程不再产生变化。1. K-均值算法流程① 在样本中随机选择K个点(聚类中心)。② 对数据集中的每个数据点,按照距离K个中心点的距离大小原则,将其与距离最近的中心点关联,与同一中心点关联的所有点聚成一类。③ 计算每一组的均值,生成新的聚类中心点。④ 重复执行2-3步,直至中心点不再发生变化。2. 伪代码流程原创 2020-07-16 18:57:11 · 541 阅读 · 0 评论 -
机器学习之贝叶斯样本分类
10个训练样本,二分类0/1。1、模块导入import csvimport numpy as npfrom sklearn.naive_bayes import GaussianNBimport matplotlib.pyplot as plt2、文本数据加载def load_data(): ''' load file data ''' with open('F:/study/AI/src/ml/sklearn/bayes.csv') as csv_file转载 2020-07-16 19:35:15 · 696 阅读 · 0 评论