DM
qiu_zhi_liao
这个作者很懒,什么都没留下…
展开
-
决策树数学原理(ID3,c4.5,cart算法)
上面这个图就是一棵典型的决策树。我们在做决策树的时候,会经历两个阶段:构造和剪枝。构造简单来说,构造的过程就是选择什么属性作为节点的过程,那么在构造过程中,会存在三种节点:根节点:就是树的最顶端,最开始的那个节点。在上图中,“天气”就是一个根节点;选择哪个属性作为更节点!内部节点:就是树中间的那些节点,比如说“温度”、“湿度”、“刮风”;选择哪些属性作为子节点!叶节点...原创 2019-05-02 16:44:14 · 1540 阅读 · 1 评论 -
朴素贝叶斯分类:原理
贝叶斯原理是英国数学家托马斯·贝叶斯提出的。贝叶斯是个很神奇的人,他的经历类似梵高。生前没有得到重视,死后,他写的一篇关于归纳推理的论文被朋友翻了出来,并发表了。这一发表不要紧,结果这篇论文的思想直接影响了接下来两个多世纪的统计学,是科学史上著名的论文之一。贝叶斯原理贝叶斯为了解决一个叫“逆向概率”问题写了一篇文章,尝试解答在没有太多可靠证据的情况下,怎样做出更符合数学逻辑的推测。什么是“逆...原创 2019-05-29 15:29:54 · 90746 阅读 · 32 评论 -
朴素贝叶斯分类实战:对文档进行分类
朴素贝叶斯分类最适合的场景就是文本分类、情感分析和垃圾邮件识别。其中情感分析和垃圾邮件识别都是通过文本来进行判断。所以朴素贝叶斯也常用于自然语言处理 NLP 的工具。sklearn 机器学习包sklearn 的全称叫 Scikit-learn,它给我们提供了 3 个朴素贝叶斯分类算法,分别是高斯朴素贝叶斯(GaussianNB)、多项式朴素贝叶斯MultinomialNB)和伯努利朴素贝叶斯(...原创 2019-05-31 19:08:58 · 1409 阅读 · 0 评论 -
实战:关联规则挖掘
如何使用 Apriori 工具包Apriori 虽然是十大算法之一,不过在 sklearn 工具包中并没有它,也没有 FP-Growth 算法。。这里教你个方法,来选择 Python 中可以使用的工具包,搜索工具包。efficient-apriori 1.0.0找到这个工具包,然后在终端(windows 中叫anaconda prompt)输入:pip install effici...原创 2019-05-22 19:05:32 · 2054 阅读 · 1 评论 -
SVM实战:如何进行乳腺癌检测
如何在 sklearn 中使用 SVMSVM 既可以做回归,也可以做分类器。当用 SVM 做回归的时候,我们可以使用 SVR 或 LinearSVR,即support vector regressionLinearSVR用来处理线性可分的数据,也就是说,使用的线性核函数如果是针对非线性的数据,需要用到 SVC。在 SVC 中,我们既可以使用到线性核函数(进行线性划分),也可以使用高纬...原创 2019-05-18 17:45:05 · 4020 阅读 · 0 评论 -
关联规则挖掘
关联规则挖掘可以让我们从数据集中发现项与项(item 与 item)之间的关系,它在我们的生活中有很多应用场景,“购物篮分析”就是一个常见的场景,这个场景可以从消费者交易记录中发掘商品与商品之间的关联关系,进而通过商品捆绑销售或者相关推荐的方式带来更多的销售量。所以说,关联规则挖掘是个非常有用的技术。搞懂关联规则中的几个概念我举一个超市购物的例子,下面是几名客户购买的商品列表:支持度支持...原创 2019-05-22 11:48:39 · 9508 阅读 · 2 评论 -
knn实战:如何对手写数字进行识别?
在 Python 的 sklearn 工具包中有 KNN 算法。KNN 既可以做分类器,也可以做回归。如果是做分类,你需要引用:from sklearn.neighbors import KNeighborsClassifier如果是做回归,你需要引用:from sklearn.neighbors import KNeighborsRegressor如何在...原创 2019-05-19 18:48:06 · 694 阅读 · 1 评论 -
KNN算法原理
k-NearestNeighbor,翻译为K最近邻算法,是数据挖掘算法中最简单的一种算法。我们先用一个例子体会下。我们很容易知道,这些电影的类型,那么当有一部新电影出现的时候, 可不可以对其进行自动分类了?我们可以把打斗次数看成 X 轴,接吻次数看成 Y 轴,然后在二维的坐标轴上,对这几部电影进行标记,如下图所示。对于未知的电影 A,坐标为 (x,y),我们需要看下离电影 A 最近的...原创 2019-05-19 11:46:59 · 5700 阅读 · 0 评论 -
支持向量机SVM算法原理
SVM 的英文叫 Support Vector Machine,中文名为支持向量机。它是常见的一种分类方法,在机器学习中,SVM 是有监督的学习模型。什么是有监督的学习模型呢?它指的是我们需要事先对数据打上分类标签,这样机器就知道这个数据属于哪个分类。同样无监督学习,就是数据没有被打上分类标签,这可能是因为我们不具备先验的知识,或者打标签的成本很高。所以我们需要机器代我们部分完成这个工作,比...原创 2019-05-08 17:26:09 · 1527 阅读 · 0 评论 -
决策树算法实现
ID3,c4.5只用于做分类,得到的结果是连续值;cart既可以做分类,也可以做回归,得到的结果是连续值。CART 分类树在 Python 的 sklearn 中默认采用的是 CART 分类树。下面,我们来用 CART 分类树,给 iris 数据集构造一棵分类决策树。在 Python 的 sklearn 中,如果我们想要创建 CART 分类树,可以直接使用 DecisionTreeCla...原创 2019-05-02 16:43:39 · 287 阅读 · 0 评论 -
python数据结构练习
array与DataFramey_train=np.array([-1,-1,1,1,-1,-1,-1,1,1,1,1,1,1,1,-1])print(y_train[0])y=pd.DataFrame(y_train)print(y[0])输出-10 -11 -12 13 14 -15 -16 -17 18 ...原创 2019-06-30 00:49:38 · 302 阅读 · 0 评论