机器学习库
文章平均质量分 68
初夏11
机器学习小白
展开
-
第一章 sklearn 介绍
机器学习问题分为监督学习和非监督学习,监督学习分为分类和回归。非监督学习包含一些聚类问题。scikit-learn 包含一些标准数据集,如 iris and digits datasets 用于classification , bostonhouse prices dataset 用于回归。1.2 加载数据集>>> from sklearn impo翻译 2016-04-08 10:57:37 · 561 阅读 · 0 评论 -
基于scikit-learn(sklearn)做分类--3.优化--保存模型
上一章主要是讲了分类的过程,这一章主要是讲一些优化问题主要是对于训练的模型,要保存下结果,而不用重复的训练.import split_jieba2from sklearn.externals import joblibdef train(): tfidf_train_2 = tv.fit_transform(train_data);原创 2016-04-27 17:25:15 · 3865 阅读 · 0 评论