sklearn
雪儿waii
https://m.gitee.com/wangxuewaii
展开
-
sklearn字典数据特征抽取
本人git仓库地址 :https://gitee.com/wangxuewaii/MachineLearningfrom sklearn.feature_extraction import DictVectorizerdef dictvec(): """ 字典数据抽取 :return: """ # 实例化 dict = DictV...原创 2019-03-02 13:43:41 · 619 阅读 · 0 评论 -
文本特征抽取及jieba处理中文问题
from sklearn.feature_extraction.text import CountVectorizerimport jiebadef countvec(): """ 对文本进行特征值化 :return: """ cv = CountVectorizer() data = cv.fit_transform(["life...原创 2019-03-02 15:58:46 · 1159 阅读 · 0 评论 -
归一化,标准化,缺失值处理
归一化标准化from sklearn.preprocessing import MinMaxScaler ,StandardScaler,Imputerimport numpy as npdef mm(): """ 归一化处理 :return: """ #mm = MinMaxScaler() 不指定范围,默认[0,1] mm =...原创 2019-03-03 19:46:19 · 1416 阅读 · 0 评论 -
sklearn中自带数据集的使用 ,估计器
原创 2019-03-09 16:16:38 · 463 阅读 · 0 评论 -
机器学习常用性能度量指标
https://blog.csdn.net/littlehaes/article/details/83278256https://blog.csdn.net/lrs1353281004/article/details/79411552准确率:判断正确的个数占所有正例的比例召回率(查全率):正确判断出的正例占所有正例的比例精确率(查准率):正确判断出的正例占所有判断为正例的比例真正例率:正...原创 2019-04-14 12:15:25 · 241 阅读 · 0 评论 -
gensim基础用法
from gensim.models import word2vecimport loggingfrom gensim import corpora,models,similarities# logging.basicConfig(format="%(asctime)s : %(levelname)s : %(message)s",level=logging.INFO)# raw_sen...原创 2019-05-04 17:15:54 · 859 阅读 · 0 评论