![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
sklearn
普通网友
这个作者很懒,什么都没留下…
展开
-
sklearn中svr(支持向量机回归)
支持向量机也可以用来回归from sklearn.svm import SVRimport numpy as npn_samples, n_features = 10, 5np.random.seed(0)y = np.random.randn(n_samples)X = np.random.randn(n_samples, n_features)clf = SVR(C=1.0, eps转载 2017-09-20 16:34:26 · 9626 阅读 · 0 评论 -
sklearn分类算法汇总
import osimport numpy as npimport pandas as pdfrom sklearn import datasetsfrom sklearn import preprocessingfrom sklearn import neighborsfrom sklearn.discriminant_analysis import LinearDiscriminan转载 2017-05-23 17:04:31 · 1820 阅读 · 0 评论 -
sklearn中数据预处理(preprocessing)
Standardization即标准化,尽量将数据转化为均值为零,方差为一的数据,形如标准正态分布(高斯分布)。实际中我们会忽略数据的分布情况,仅仅是通过改变均值来集中数据,然后将非连续特征除以他们的标准差。sklearn中 scale函数提供了简单快速的singlearray-like数据集操作。一、标准化,均值去除和按方差比例缩放(Standardization, or mean removal翻译 2017-05-23 16:18:01 · 552 阅读 · 0 评论 -
sklearn之svm学习
1.获取分类数据,分类数据中iris中文指鸢尾植物,这里存储了其萼片和花瓣的长宽,一共4个属性,鸢尾植物又分三类。与之相对,iris里有两个属性iris.data,iris.target,data里是一个矩阵,每一列代表了萼片或花瓣的长宽,一共4列,每一列代表某个被测量的鸢尾植物,一共采样了150条记录from sklearn import datasetsdef getData_1():原创 2017-05-23 14:44:03 · 560 阅读 · 0 评论 -
python3.4之决策树
#!/usr/bin/env python# coding=utf-8import numpy as npfrom sklearn import treefrom sklearn.metrics import precision_recall_curvefrom sklearn.metrics import classification_reportfrom sklearn.cross_v原创 2016-12-22 09:14:16 · 1256 阅读 · 0 评论 -
sklearn可以使用GridSearchCV进行自动化调参
GridSearchCV学习链接如下:官网链接学习博客转载 2018-06-15 10:29:25 · 737 阅读 · 0 评论 -
决策树实现文本分类
如何使用决策树实现文本分类:1.分词模块: a.人工整理词库。 b.使用自己编写的词库和分词代码(添加词库的同时,删除影响词库的词)进行分词。2.进行one-hot编码: 在进行one-hot编码的同时,使用同义词对one-hot进行合并,同义词使用相同的id.3.使用sklearn里面的决策树进行计算,并且使用sklearn里面的自动化调参进行调参。代码如下:#!/usr/bin/en...原创 2018-06-25 09:25:39 · 9001 阅读 · 1 评论 -
sklearn使用TFIDF进行文本关键字提取
# encoding=utf-8from sklearn.feature_extraction.text import TfidfVectorizer, TfidfTransformercorpus = [ 'This This is the first document.', 'This This is the second second document.', ...原创 2018-06-25 17:43:21 · 7551 阅读 · 0 评论 -
Python+sklearn对模型进行评分
回归评价指标分类评价指标转载 2018-07-01 15:14:28 · 4508 阅读 · 0 评论 -
sklearn分类算法测试以及自动化调参
测试数据为鸢尾花数据0 5.1 3.5 1.4 0.20 4.9 3.0 1.4 0.20 4.7 3.2 1.3 0.20 4.6 3.1 1.5 0.20 5.0 3.6 1.4 0.20 5.4 3.9 1.7 0.40 4.6 3.4 1.4 0.30 5.0 3.4 1.5 0.20 4.4 2.9 1.4 0.20 4.9 3.1 1.5 0.10 5.4 3.7 1转载 2017-05-24 09:48:09 · 9281 阅读 · 2 评论 -
python_sklearn层次聚类学习
sklearn中层次聚类有两种方法,自顶向上法和自下向上法。并且有三种计算类之间距离的方法。 Maximum linkage complete linkage Average linkage 代码如下:"""=============================================================================Various Agglo转载 2017-06-09 17:40:55 · 4020 阅读 · 0 评论 -
sklearn中朴素贝叶斯
http://scikit-learn.org/stable/modules/naive_bayes.html转载 2017-09-18 18:08:48 · 503 阅读 · 0 评论 -
sklearn中高斯混合模型
http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.AdaBoostClassifier.html转载 2017-09-18 18:04:59 · 2569 阅读 · 0 评论 -
sklearn中ababoost分类
http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.AdaBoostClassifier.html转载 2017-09-18 18:02:24 · 706 阅读 · 0 评论 -
sklearn中逻辑回归参数调整
sklearn中逻辑回归的参数http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html参数解释:http://blog.csdn.net/sun_shengyun/article/details/53811483逻辑回归的参数主要有两个方面,一个是正则化的选择。 还有是转载 2017-09-14 20:15:16 · 19597 阅读 · 0 评论 -
GBDT(sklearn)进行回归
sklearn中可以使用GBDT进行分类和回归,下面是GBDT进行回归的文档http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.GradientBoostingRegressor.html#examples-using-sklearn-ensemble-gradientboostingregressor转载 2017-09-11 11:17:27 · 7228 阅读 · 0 评论 -
GBDT(sklearn)参数详解
GBDT中也有一部分是决策树的参数,下面是官网的说明文档http://scikit-learn.org/stable/modules/generated/sklearn.ensemble.GradientBoostingClassifier.html下面是网友的调参实例http://www.cnblogs.com/DjangoBlog/p/6201663.html转载 2017-09-11 10:02:29 · 4573 阅读 · 0 评论 -
RandForest(sklearn)参数详解
RandForest的参数很大一部分跟决策树的参数一致。下面是sklearn随机森林的官网http://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeClassifier.html下面是网友的总结http://blog.csdn.net/u012102306/article/details/52228516转载 2017-09-11 09:55:18 · 577 阅读 · 0 评论 -
sklearn中支持向量机的参数
官方文档http://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html参数说明http://m.blog.csdn.net/github_39261590/article/details/75009069转载 2017-09-09 16:54:23 · 991 阅读 · 0 评论 -
Python分类算法交叉验证
我们使用Sklearn-train_test_split随机划分训练集和测试集http://blog.csdn.net/cherdw/article/details/54881167实验代码:import gensimfrom sklearn.linear_model import LogisticRegressionimport pandas as pdfrom sklearn.model_原创 2017-09-07 13:45:22 · 2870 阅读 · 0 评论 -
Adaboost 算法的原理与推导
adaboost是集合很多弱的分类器,在进行第一次分类的时候,把分错的样本的权值增加,然后训练第二个分类器。http://blog.csdn.net/v_july_v/article/details/40718799转载 2017-09-20 13:35:47 · 206 阅读 · 0 评论