sklearn
文章平均质量分 62
记录自己使用sklearn中各个功能模块的小案例
chnhbhndchngn
这个作者很懒,什么都没留下…
展开
-
决策树的可视化
1. 首先安装 graphviz 并设置环境变量, 很多文章都写这个教程了, 这里就不写了2. 安装 python-graphvizconda install python-graph-viz3. 生成图片文件import graphvizfrom sklearn.tree import DecisionTreeClassifier,export_graphvizfrom sklearn.datasets import load_irisiris = load_iris()X原创 2022-05-17 18:25:03 · 611 阅读 · 0 评论 -
sklearn中的决策树中三个参数的含义
class sklearn.tree.DecisionTreeClassifier(*, criterion='gini', splitter='best', max_depth=None, min_samples_split=2, min_samples_leaf=1, min_weight_fraction_leaf=0.0, max_features=None, random_state=None, max_leaf_nodes=None, min_impurity_decrease=0.0, cla原创 2022-05-17 17:45:48 · 1544 阅读 · 0 评论 -
评估方法
from sklearn import metrics# 这些指标是scoring可选择的参数, # cross_val_score, GridSearchCV中的scoreing参数sorted(metrics.SCORERS.keys())结果:['accuracy', 'adjusted_mutual_info_score', 'adjusted_rand_score', 'average_precision', 'balanced_accuracy', 'comp...原创 2020-08-04 19:03:07 · 280 阅读 · 0 评论 -
通过tfidf求文本的关键字
通过tfidf 求文本的呃关键字原创 2020-07-13 00:59:54 · 510 阅读 · 0 评论 -
更新索引 和 离散特征值的处理 pd.get_dummies(X)
我们这里为了演示, 直接删除含有空值的行, 这是会会出现索引不连续的情况, 如图, 索引少了888, 这是我们需要更新索引这时我们看到所有数据从891条变成了712条, 但是原始的所以竟然变成了新的特征列, 这不是我们想要的, 只需添加一个参数即可改变这种情况这才是我们需要的. 但是这个方法返回更新索引的新数据, 原始数据并不会改变, 不信看看原始数据好了, 我们现在说说离散特征的处理, 虽然有from sklearn.preprocessing import One...原创 2020-07-01 11:19:04 · 747 阅读 · 0 评论 -
余弦相似度
使用sklearn内部的方法计算余弦相似度# 余弦相似度import numpy as npfrom sklearn.metrics.pairwise import cosine_similarityx1 = np.array([[2, 3], [1, 2]])x2 = np.array([[1, 2]])cosine_similarity(x1, x2) 结果是:需要注意的是 这里的输入的必须是二维的数据...原创 2020-06-23 21:25:44 · 226 阅读 · 0 评论 -
保存模型的 两种方法
from sklearn.linear_model import LogisticRegressionfrom sklearn import datasetsimport picklefrom sklearn.externals import joblibclf = LogisticRegression()iris = datasets.load_iris()X, y = iris.data, iris.targetclf.fit(X, y)print(clf.score(X, y)).原创 2020-06-22 16:24:52 · 3250 阅读 · 0 评论 -
根据词频 TfidfVectorizer 将单词, 句子, 文章变成向量
原创 2020-06-22 15:19:08 · 1149 阅读 · 0 评论 -
根据词频 CounterVectorizer 将单词, 句子, 文章变成向量
原创 2020-06-22 15:11:23 · 770 阅读 · 0 评论 -
类别标签的转换与反转换
原创 2020-06-22 13:48:19 · 354 阅读 · 0 评论