sklearn
文章平均质量分 86
飞翔的大马哈鱼
这个作者很懒,什么都没留下…
展开
-
scikit-learn计算tf-idf词语权重
使用scikit-learn来计算一个简单的词频CountVectorizerimport pandas as pdimport numpy as npfrom sklearn.feature_extraction.text import CountVectorizertexts=["dog cat fish","dog cat cat","fish bird","bird"]原创 2017-06-09 20:27:37 · 5500 阅读 · 0 评论 -
sklearn学习笔记
转自https://ynuwm.github.io/2017/05/27/sklearn学习笔记/#more官网:http://sklearn.lzjqsdd.com/1 scikit-learn基础介绍1.1 估计器(Estimator)估计器,很多时候可以直接理解成分类器,主要包含两个函数:●fit():训练算法,设置内部参数。接收训练集和类别两个参数。●predict(...转载 2017-06-10 10:40:12 · 1800 阅读 · 0 评论 -
Python scikit-learn机器学习工具包学习笔记:cross_validation模块
sklearn.cross_validation模块的作用顾名思义就是做cross validation的。 cross validation大概的意思是:对于原始数据我们要将其一部分分为train data,一部分分为test data。train data用于训练,test data用于测试准确率。在test data上测试的结果叫做validation error。将一个算法作用于一...转载 2017-06-21 22:47:18 · 454 阅读 · 0 评论 -
关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化
转自:https://www.cnblogs.com/chaosimple/p/4153167.html一,标准化(Z得分),或者去除均值和方差缩放公式为:(X-mean)/ std计算时对每个属性/每列分别进行。将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。实现时,有两种不同的方式:1. skle...转载 2018-08-21 11:24:08 · 306 阅读 · 0 评论 -
sklearn中常用数据预处理方法
转载自:http://2hwp.com/2016/02/03/data-preprocessing/常见的数据预处理方法,以下通过sklearn的preprocessing模块来介绍;1. 标准化(Standardization or Mean Removal and Variance Scaling)变换后各维特征有0均值,单位方差。也叫z-score规范化(零均值规范化)。计算方式...转载 2018-09-03 10:19:56 · 253 阅读 · 0 评论 -
sklearn中 F1-micro 与 F1-macro区别和计算原理
二分类使用Accuracy和F1-score,多分类使用宏F1和微F1。最近在使用sklearn做分类时候,用到metrics中的评价函数,其中有一个非常重要的评价函数是F1值,在sklearn中的计算F1的函数为 f1_score ,其中有一个参数average用来控制F1的计算方式,今天我们就说说当参数取micro和macro时候的区别1、查准率,查全率,F1值:对...原创 2018-12-05 10:25:40 · 37146 阅读 · 15 评论