sklearn常用API介绍
文章平均质量分 85
fengzhizi76506
这个作者很懒,什么都没留下…
展开
-
sklearn.feature_extraction常用API介绍
特征提取:sklearn.feature_extraction.DictVectorizer(dtype=,separator='=',sparse=True,sort=True)将映射转化为向量。字典类型的对象转化为numpy.array或者scipy.sparse特征值为string类型时,向量表示为one-hot二元编码,出现的string为1,其余为0.特征值为int等原创 2018-03-22 20:09:27 · 4480 阅读 · 0 评论 -
sklearn.linear_model常用API介绍
sklearn.linear_model.LinearRegression(fit_intercept=True,normalize=False,copy_X=True,n_jobs=1)返回一个线性回归模型,损失函数形式为fit_intercept:boolean,可选,True(默认):是否计算截距,即f(x)=w.T*X或者f(x)=w.T*X+bnormalize:boolean,可选,F...原创 2018-03-23 22:08:50 · 5356 阅读 · 0 评论 -
sklearn.naive_bayes常用API介绍
高斯朴素贝叶斯sklearn.naive_bayes.GaussianNB(priors=None):priors:array-like,shape(n_classes,)类别的先验概率,如果指定则不会根据数据改变属性:class_prior_:array,shape(n_classes,)每一类的概率class_count_:array,shape(n_classes,)每一类的训练样本个数th...原创 2018-03-24 00:40:44 · 2474 阅读 · 0 评论 -
sklearn.neighbors常用API介绍
K近邻算法:对新的输入数据,在训练数据上找到与该实例最邻近的k个实例,k个实例的多数属于的类别作为输入数据的类别。用于分监督学习的k近邻算法:sklearn.neighbors.NearestNeighbors(n_neighbors=5,radius=1.0,algorithm='auto',leaf_size=30,metric='minkowski',p=2,metric_params=No...原创 2018-03-24 15:00:12 · 3914 阅读 · 0 评论 -
sklearn.neural_network常用API介绍
sklearn.nueral_network.MLPClassifier(hidden_layer_sizes=(100,),activation='relu',solver='adam',alpha=0.0001,batch_size='auto',learning_rate='constant',learning_rate_init=0.001,power_t=0.5,max_iter=200...原创 2018-03-24 21:37:00 · 6775 阅读 · 0 评论 -
sklearn.datasets常用API介绍
sklearn.datasets返回元组(X,y),X是n_samples*n_features的矩阵表示样本特征,y是n_samples*1的矩阵表示标签含有属性data为X,target是y含有属性DESCR包含feature_names和target_names,表示数据集的详细描述.load_boston([return_X_y]) 返回波士顿房价数据集,回归问题return_X_y:默认...原创 2018-03-21 14:35:39 · 1088 阅读 · 0 评论 -
sklearn.cluster常用API介绍(KMeans,MiniBatchKMeans)
问题:对于给定的数据集{x1,x2...xn},如何根据样本点自身的数据特性实现分类,也就是在没有标签的情况下将距离较近的数据点划分到同一类,假设这个类别就是他们的标签。也就是解决如下问题:通过计算机来将人类可以迅速分类的点群划分出来。这里介绍几个常用的求点到中心距离公式:1)Minkowski Distance 公式 —— λ 可以随意取值,可以是负数,也可以是正数,或是无穷大。2)Euclid...原创 2018-03-21 16:15:18 · 10428 阅读 · 0 评论