Sklearn
文章平均质量分 67
sklearn官方文档--专注、执着
小松悦读会 | kevinelstri
小松悦读会,用心阅读,执着专注!
展开
-
基于python的机器学习库Sklearn
scikit-learn,也称为sklearn,是基于python的机器学习库,可以方便进行机器学习算法的实施,包括:分类、回归、聚类、降维、模型选择和预处理等数据挖掘的相关算法。下面是对官方文档进行学习的收获,以代码的形式将官方文档的内容翻译记录在代码中,方便算法的学习。scikit-learn1:使用案例对sklearn库进行简单介绍scikit-learn2:使用sklearn库进行统计学原创 2017-03-09 15:01:38 · 7328 阅读 · 1 评论 -
【scikit-learn】01:使用案例对sklearn库进行简单介绍
sklearn学习笔记:Quick Start 源地址:http://scikit-learn.org/stable/tutorial/basic/tutorial.html# -*-coding:utf-8-*-''' Author:kevinelstri Datetime:2017.2.16'''# -----------------------# An introdu原创 2017-02-16 18:59:47 · 10636 阅读 · 1 评论 -
【scikit-learn】02:使用sklearn库进行统计学习
# -*-coding:utf-8-*-# ----------------------# Author:kevinelstri# Datetime:2017.2.17# ----------------------# -----------------------# A tutorial on statistical-learning for scientific data p原创 2017-02-17 19:43:20 · 3772 阅读 · 0 评论 -
【scikit-learn】03:将sklearn库用于非监督性学习 聚类
# -*-coding:utf-8-*-# ----------------------# Author:kevinelstri# Datetime:2017.2.16# ----------------------# -----------------------# Unsupervised learning: seeking representations of the data原创 2017-02-17 22:00:52 · 7709 阅读 · 0 评论 -
【scikit-learn】04:sklearn库下进行文本数据分析
# -*-coding:utf-8-*-# ----------------------# Author:kevinelstri# Datetime:2017.2.21# ----------------------# -----------------------# Working With Text Data 文本数据处理# http://scikit-learn.o原创 2017-02-21 15:15:48 · 4429 阅读 · 0 评论 -
【scikit-learn】05:sklearn文本分类及评价指标
今天看到一句话: 你能留给岁月的,岁月能留给你的,除了一个更好的自己,别无其他。还能什么比这更能激励自己学习呢?在windows下安装sklearn,直接下载winpython安装就行了。自行选择32或64位。 http://sourceforge.net/projects/winpython/后面本文都把sklearn简称sk。sk已经自带了一些数据集,先看iris和digits:fro原创 2016-09-23 14:44:00 · 7878 阅读 · 1 评论 -
【scikit-learn】06:make_blobs聚类数据生成器
make_blobs聚类数据生成器简介scikit中的make_blobs方法常被用来生成聚类算法的测试数据,直观地说,make_blobs会根据用户指定的特征数量、中心点数量、范围等来生成几类数据,这些数据可用于测试聚类算法的效果。make_blobs方法:sklearn.datasets.make_blobs(n_samples=100, n_features=2,centers=3, clu原创 2016-09-22 14:49:04 · 38652 阅读 · 5 评论 -
【scikit-learn】07:数据加载,数据归一,特征选择,逻辑回归,贝叶斯,k近邻,决策树,SVM
引言对于一些开始搞机器学习算法有害怕下手的小朋友,该如何快速入门,这让人挺挣扎的。 在从事数据科学的人中,最常用的工具就是R和Python了,每个工具都有其利弊,但是Python3.x在各方面都相对胜出一些,这是因为scikit-learn库实现了很多机器学习算法。加载数据(Data Loading)我们假设输入时一个特征矩阵或者csv文件。原创 2016-09-23 11:51:15 · 5786 阅读 · 1 评论