机器学习
JayKing_csdn
这个作者很懒,什么都没留下…
展开
-
机器学习常见的算法
最近在学习机器学习,网上总结的非常好,于是在这里抛砖引玉一下:1、决策树根据一些 feature 进行分类,每个节点提一个问题,通过判断,将数据分为两类,再继续提问。这些问题是根据已有数据学习出来的,再投入新数据的时候,就可以根据这棵树上的问题,将数据划分到合适的叶子上。2、随机森林算法视视频讲解在源数据中随机选取数据,组成几个子集S 矩阵是源数据,有 1-N 条数据,A B C 是feature...原创 2018-04-20 20:49:57 · 292 阅读 · 0 评论 -
数据预处理基础(—)
数据预处理一、定义 背景:现实世界中数据大体上都是不完整,不一致的脏数据,无法直接进行数据挖掘,或挖掘结果差强人意。为了提高数据挖掘的质量产生了数据预处理技术。 数据预处理:数据预处理(data preprocessing)是指在主要的处理以前对数据进行的一些处理,以利于计算机的运算。 数据预处理方法:数据清理,数据集成,数据变换,数据归约...原创 2018-05-17 16:45:27 · 2060 阅读 · 1 评论 -
人脸识别
工具:Python 3.6 OpenCV 3.3.0代码:import cv2import numpy as npcv2.namedWindow("Face")cap=cv2.VideoCapture(0)success= cap.read()color = (60,20,255)classfier=cv2.CascadeClassifier("haarcascade...原创 2018-05-19 17:07:21 · 321 阅读 · 0 评论 -
聚类的四种算法
最近看了一篇论文,涉及到数据挖掘的聚类算法,这里总结一下一、聚类算法的简介 聚类算法是一种典型的无监督学习算法,主要用于将相似的样本自动归到一个类别中。聚类算法与分类算法最大的区别是:聚类算法是无监督的学习算法,而分类算法属于监督的学习算法。在聚类算法中根据样本之间的相似性,将样本划分到不同的类别中,对于不同的相似度计算方法,会得到不同的聚类结果,常用的相似度计算方法有欧式距离法。1、K-Mean...原创 2018-06-11 17:12:46 · 24031 阅读 · 2 评论 -
Python数据集模块
Scikit-Learn模块学习笔记——数据集模块datasetsscikit-learn 的 datasets 模块包含测试数据相关函数,主要包括三类:datasets.load_*():获取小规模数据集。数据包含在 datasets 里datasets.fetch_*():获取大规模数据集。需要从网络上下载,函数的第一个参数是 data_home,表示数据集下载的目录,默认是 ~/scikit...原创 2018-06-12 11:01:47 · 6421 阅读 · 0 评论