![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 89
还是那个同伟伟
百万代码中取bug首级
展开
-
2. 回归树
C1,C2就是公式中的Cm, 指的不是类别,是一个数,这个数和 Y的含义是一样的,即租金是多少也即是说当C1和C2这些叶子结点所代表的一些值确定的时候,当再来一个未知的样本的时候,比如说,给出房屋面积100平方,那这个房屋面积为100的样本输入进来之后,这颗树的一些路径,最后判断从那个叶子结点输出, 比如上图,102平方的房屋最后判断的是C2这个叶子结点的输出,那C2这个值就可能是5000,4500等,即就是最终预测的值。计算的总体的损失小于给定的精度的时候,不再划分。括号中的是,x属于那个结点。原创 2023-12-27 10:40:34 · 980 阅读 · 2 评论 -
1.决策树
决策树分类的思想类似于找对象。想象一个女孩的母亲要给这个女孩介绍男朋友,于是有了下面的对话:女孩决定是否见男孩的一个过程,就像一个树形结构,只不过是反正的树, 数学上或者机器学习里的树,根在最上方最上方的为树的根节点下面的都是子节点像下图的橙色的部分,下面在没有往下的结点的叫叶子节点如果一颗树每个节点下面最多只有两个节点就属于二叉树下图的就是一个非二叉树( 到收入下面有三个节点)上图完整表达了这个女孩决定是否见一个约会对象的策略,其中绿色节点表示判断条件橙色节点表示决策结果。原创 2023-12-25 15:31:14 · 1322 阅读 · 0 评论 -
机器学习(K-means聚类原理以及用法)
k-means属于非监督学习(unsupervised learning)聚类:把数据分成多少个类别1.聚类的过程 例如: k等于几就相当于分几类1、随机设置K个特征空间内的点作为初始的聚类中心2、对于其他每个点计算到K个中心的距离,未知的点选择最近的一个聚类中心点作为标记类别3、接着对着标记的聚类中心之后,重新计算出每个聚类的新中心点(平均值)...原创 2019-06-11 16:09:37 · 589 阅读 · 0 评论 -
机器学习(5.sklearn归一化以及标准化)
归一化特点:通过对原始数据进行变换把数据映射到(默认为[0,1])之间注:作用于每一列,max为一列的最大值,min为一列的最小值,那么X’’ 为最终结果,mx,mi分别为指定区间值默认mx为1,mi为0sklearn归一化APIsklearn归一化API: sklearn.preprocessing.MinMaxScaler归一化提供的数据应该是类似...原创 2019-06-10 11:28:18 · 19005 阅读 · 0 评论 -
机器学习(4.文本数据的特征抽取(第二种TfidfVectorizer(TF-IDF)))
TF-IDFTF-IDF的主要思想是:如果某个词或短语在一篇文章中出现的概率高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。TF-IDF作用:用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。类:sklearn.feature_extraction.text.TfidfVectorizer1.TfidfVectorize...原创 2019-06-10 09:12:01 · 2291 阅读 · 0 评论 -
机器学习(3.文本数据的特征抽取(第一种))
文本特征抽取作用:对文本数据进行特征值化类:sklearn.feature_extraction.text.CountVectorizer1.CountVectorizer语法 •CountVectorizer(max_df=1.0,min_df=1,…) •返回词频矩阵 •CountVectorizer.fit_transfo...原创 2019-06-10 07:28:25 · 1277 阅读 · 0 评论 -
机器学习(2.sklearn(Scikit-learn)库、字典数据的特征抽取)
sklearn(全称Scikit-learn库介绍) •Python语言的机器学习工具 •Scikit-learn包括许多知名的机器学习算法的实现 •Scikit-learn文档完善,容易上手,丰富的API,使其在学术界颇受欢迎。安装:windows下 pip install Scikit-learn 注:安装scikit-lear...原创 2019-06-08 09:19:24 · 1175 阅读 · 0 评论 -
机器学习(1.机器学习概述、数据集的组成以及机器学习的特征工程)
什么是机器学习? 机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测为什么需要机器学习 解放生产力、解决专业问题、提供社会便利机器学习应用场景自然语言处理、无人驾驶、计算机视觉、推荐系统、、、机器学习在各领域带来的价值 领域:医疗、航空、教育、物流、电商。。。。 目的:让机器学习程序替换手动的步骤,减少企业的成本也提高...原创 2019-06-07 16:05:16 · 1044 阅读 · 0 评论 -
深度学习-机器学习(神经网络的应用 下)
********************************先看代码后面解释********************************#神经网络算法(Neural Network)import numpy as npdef tanh(x): #双曲函数 return np.tanh(x)def tanh_deriv(x): #双曲函数的导数 return 1...原创 2018-06-25 21:07:13 · 342 阅读 · 0 评论 -
深度学习—机器学习(神经网络2)
1. 关于非线性转化方程(non-linear transformation function) sigmoid 函数(S 曲线)用来作为activation function: **在0和一之间渐变的一个曲线** 1.1 双曲函数(tanh) tanhx为下方...原创 2018-06-25 20:22:25 · 225 阅读 · 0 评论 -
深度学习框架TensorFlow(1.安装和简介)
1.Tensorflow的安装 管理员方式打开命令提示符:pip install tensorFlow2.更新TensorFlow: pip uninstall tensorflow pip install tensorflow3.安装完之后,在命令提示符里输入:pip list看一下里面有没有tensorFlow4.Tensorflow基本概念 使用图(graphs)来表示计算任...原创 2018-05-31 18:03:12 · 286 阅读 · 0 评论 -
深度学习-机器学习(5.3支持向量机Python的应用)
1.从本篇后展示不更新支持向量机了,就下来会更新TensorFlow基础开始的博客,以后会把支持向量机更新完的。2.第二个SVM上Python的实例3.直接看代码: import numpy as npimport pylab as pl #提供Python的画图功能from sklearn import svm#创建四十个点a = np.random.seed(0)#se...原创 2018-05-31 15:27:02 · 323 阅读 · 0 评论 -
深度学习-机器学习(5.2支持向量机SVM上的Python应用)
1.简单的应用,(用前两节的例子) 直接上代码:原创 2018-05-30 18:27:00 · 421 阅读 · 0 评论 -
深度学习-机器学习(5.2支持向量机SVM)
1.SVM如何找出最大边际的超平面呢(MMH)? 利用一些数学推到,以上一节的公式可变为有限的凸优化问题(convex quadratic optimization) 利用Karush-Kuhn-Tucker)(KKT)条件和拉格朗日公式,可以推出MMH可以被表示为以下“决定边界(decision boundary)” 可以表示的公式: ...原创 2018-05-30 17:01:24 · 1801 阅读 · 0 评论 -
深度学习-机器学习(神经网络 1)
1.多层向前神经网络由以下部分组成: 输入层(input layer ),隐藏层(hidden layers ), 输入层(output layers) (1)输入层:数据集传入到里面开始计算,训练集的实例向量来传入的。(2)经过连接结点的权重(weight)传入下一层,一层的输出是下一层的输入(3)隐藏层的个数可以是任意的,输入层有一层,输出层有一层(4)一层中加权的求和,然后根据非...原创 2018-06-20 18:12:26 · 380 阅读 · 1 评论 -
深度学习框架TensorFlow(4.Fetch and Feed)
1.Fetch :可以在会话里可以同时执行多个op,然后得到运行结果 fetch:例子(直接看代码)import tensorflow as tf#定义三个常量input1 = tf.constant(3.0)input2 = tf.constant(2.0)input3 = tf.constant(5.0)#加法的操作add = tf.add(input2,input3)#乘法...原创 2018-06-05 20:57:28 · 185 阅读 · 0 评论 -
深度学习-机器学习(5.1支持向量机)
1.支持向量机(Support Vector Machine)(英文简写SVM)属于监督学习(Supervised Learning):分类(Classifcation)2.机器学习的一般框架: 训练集->提取特征向量->结合一定的算法(分类器:比如决策树,KNN)->得到结果3.介绍: 3.1例子 在这个例子中加入提取...原创 2018-05-29 21:55:05 · 2045 阅读 · 0 评论 -
深度学习框架TensorFlow(3.变量)
1.先看代码:import tensorflow as tf#定义变量x = tf.Variable([1,2])#定义常量a = tf.constant([3,3])#增加一个减法的opsub = tf.subtract(x,a)#增加一个减法opadd = tf.add(x,sub)#初始化所有的变量init = tf.global_variables_initialize...原创 2018-06-03 18:14:50 · 150 阅读 · 0 评论