Python
江南路漫
这个作者很懒,什么都没留下…
展开
-
交叉验证中n_jobs=-1并行运算
scikit_learn包中的cross_val_score()是支持并行运算,但这并不是说只要让n_jobs=-1就能让CPU使用率接近100%。这要取决于交叉验证的折数cv,假如折数cv是n,这意味着最多只能使用n个物理CPU。score1 = cross_val_score(clf, x_train, y_train, cv=5, scoring='accuracy', n_jobs=-1).mean()...原创 2021-12-25 02:23:01 · 3775 阅读 · 0 评论 -
机器学习读取特征矩阵
def getMatrix(dirname): pssmList = os.listdir(dirname) pssmList.sort(key=lambda x: eval(x[:])) m = len(pssmList) reMatrix = np.zeros((m, 20)) for i in range(m): matrix= readToMatrix(dirname + '/' + pssmList[i], 'pssm') m原创 2021-11-21 20:23:28 · 638 阅读 · 0 评论 -
GridSearchCV和RandomizedSearchCV(以SVM为例)
参考代码 CC = [] gammas = [] for i in range(-5, 16, 2): CC.append(2 ** i) for i in range(3, -16, -2): gammas.append(2 ** i) param_grid = {"C": CC, "gamma": gammas} gs = GridSearchCV(SVC(probability=True), param_grid, cv=原创 2021-11-21 18:55:30 · 1205 阅读 · 0 评论 -
DataFrame的多dtype创建方法
在创建DataFrame的时候,只有有一个dtype类型。若使用numpy数组的字典,就可以分别设置dtype类型了。import numpy as npimport pandas as pddata = {'Site':np.array(['Google', 'Runoob', 'Wiki'],dtype=str), 'Age':np.array([10, 12, 13], dtype=float), 'Year':np.array([2001, 2001, 20原创 2021-07-05 14:03:33 · 1567 阅读 · 0 评论