Sklearn机器学习
文章平均质量分 67
小松悦读会 | kevinelstri
小松悦读会,用心阅读,执着专注!
展开
-
【scikit-learn】05:交叉验证 Cross-validation
【scikit-learn】06:交叉验证 Cross-validationAuthor:kevinelstri DateTime:2017/3/17 交叉验证(Cross Validation) 交叉验证也称为CV。CV是用来验证分类器的性能一种统计分析方法,基本思想就是对原始数据(dataset)进行分组,一部分做为训练集(train set),另一部分做为验证集(validatio原创 2017-03-17 16:10:40 · 2958 阅读 · 0 评论 -
【scikit-learn】07:数据加载,数据归一,特征选择,逻辑回归,贝叶斯,k近邻,决策树,SVM
引言对于一些开始搞机器学习算法有害怕下手的小朋友,该如何快速入门,这让人挺挣扎的。 在从事数据科学的人中,最常用的工具就是R和Python了,每个工具都有其利弊,但是Python3.x在各方面都相对胜出一些,这是因为scikit-learn库实现了很多机器学习算法。加载数据(Data Loading)我们假设输入时一个特征矩阵或者csv文件。原创 2016-09-23 11:51:15 · 5819 阅读 · 1 评论 -
【scikit-learn】06:make_blobs聚类数据生成器
make_blobs聚类数据生成器简介scikit中的make_blobs方法常被用来生成聚类算法的测试数据,直观地说,make_blobs会根据用户指定的特征数量、中心点数量、范围等来生成几类数据,这些数据可用于测试聚类算法的效果。make_blobs方法:sklearn.datasets.make_blobs(n_samples=100, n_features=2,centers=3, clu原创 2016-09-22 14:49:04 · 38946 阅读 · 5 评论 -
【scikit-learn】05:sklearn文本分类及评价指标
今天看到一句话: 你能留给岁月的,岁月能留给你的,除了一个更好的自己,别无其他。还能什么比这更能激励自己学习呢?在windows下安装sklearn,直接下载winpython安装就行了。自行选择32或64位。 http://sourceforge.net/projects/winpython/后面本文都把sklearn简称sk。sk已经自带了一些数据集,先看iris和digits:fro原创 2016-09-23 14:44:00 · 7923 阅读 · 1 评论 -
【scikit-learn】01:使用案例对sklearn库进行简单介绍
sklearn学习笔记:Quick Start 源地址:http://scikit-learn.org/stable/tutorial/basic/tutorial.html# -*-coding:utf-8-*-''' Author:kevinelstri Datetime:2017.2.16'''# -----------------------# An introdu原创 2017-02-16 18:59:47 · 10661 阅读 · 1 评论 -
【scikit-learn】02:使用sklearn库进行统计学习
# -*-coding:utf-8-*-# ----------------------# Author:kevinelstri# Datetime:2017.2.17# ----------------------# -----------------------# A tutorial on statistical-learning for scientific data p原创 2017-02-17 19:43:20 · 3826 阅读 · 0 评论 -
【scikit-learn】03:将sklearn库用于非监督性学习 聚类
# -*-coding:utf-8-*-# ----------------------# Author:kevinelstri# Datetime:2017.2.16# ----------------------# -----------------------# Unsupervised learning: seeking representations of the data原创 2017-02-17 22:00:52 · 7728 阅读 · 0 评论 -
【scikit-learn】04:sklearn库下进行文本数据分析
# -*-coding:utf-8-*-# ----------------------# Author:kevinelstri# Datetime:2017.2.21# ----------------------# -----------------------# Working With Text Data 文本数据处理# http://scikit-learn.o原创 2017-02-21 15:15:48 · 4479 阅读 · 0 评论 -
基于python的机器学习库Sklearn
scikit-learn,也称为sklearn,是基于python的机器学习库,可以方便进行机器学习算法的实施,包括:分类、回归、聚类、降维、模型选择和预处理等数据挖掘的相关算法。下面是对官方文档进行学习的收获,以代码的形式将官方文档的内容翻译记录在代码中,方便算法的学习。scikit-learn1:使用案例对sklearn库进行简单介绍scikit-learn2:使用sklearn库进行统计学原创 2017-03-09 15:01:38 · 7348 阅读 · 1 评论 -
聚类的评价指标(无监督学习)
详细理论说明,可以查看其他博客:# coding:utf-8from sklearn import metrics""" 聚类性能评估"""""" 1、Adjusted Rand index (ARI) 优点: 1.1 对任意数量的聚类中心和样本数,随机聚类的ARI都非常接近于0; 1.2 取值在[-1,1]之间,负数代表结果不好,越接近于1越好;原创 2017-05-08 15:02:24 · 14064 阅读 · 1 评论