python画logistic拟合曲线_如何绘制Logistic回归学习曲线?

我正在运行一个逻辑回归,并想绘制这一学习曲线,以获得对数据的感觉。我该怎么做?这是我到目前为止的代码:from sklearn import metrics,preprocessing,cross_validation

from sklearn.feature_extraction.text import TfidfVectorizer

import sklearn.linear_model as lm

import pandas as p

loadData = lambda f: np.genfromtxt(open(f,'r'), delimiter=' ')

print "loading data.."

traindata = list(np.array(p.read_table('train.tsv'))[:,2])

testdata = list(np.array(p.read_table('test.tsv'))[:,2])

y = np.array(p.read_table('train.tsv'))[:,-1]

tfv = TfidfVectorizer(min_df=3, max_features=None, strip_accents='unicode',

analyzer='word',token_pattern=r'\w{1,}',ngram_range=(1, 2), use_idf=1,smooth_idf=1,sublinear_tf=1)

rd = lm.LogisticRegression(penalty='l2', dual=True, tol=0.0001,

C=1, fit_intercept=True, intercept_scaling=1.0,

class_weight=None, random_state=None)

X_all = traindata + testdata

lentrain = len(traindata)

print "fitting pipeline"

tfv.fit(X_all)

print "transforming data"

X_all = tfv.transform(X_all)

X = X_all[:lentrain]

X_test = X_all[lentrain:]

print "20 Fold CV Score: ", np.mean(cross_validation.cross_val_score(rd, X, y, cv=20, scoring='roc_auc'))

print "training on full data"

rd.fit(X,y)

pred = rd.predict_proba(X_test)[:,1]

testfile = p.read_csv('test.tsv', sep="\t", na_values=['?'], index_col=1)

pred_df = p.DataFrame(pred, index=testfile.index, columns=['label'])

pred_df.to_csv('benchmark.csv')

print "submission file created.."

我想创造的是这样的东西,这样我可以更好地了解正在发生的事情:

yNozp.png

有人能帮我做这个吗?

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值