机器学习
云中鲸
这个作者很懒,什么都没留下…
展开
-
scikit-learn中如何保存模型?
Scikit-learn 官网上建议的两种方式:1.pickle>>> from sklearn import svm>>> from sklearn import datasets>>> clf = svm.SVC()>>> iris = datasets.load_iris()>>>原创 2018-05-31 14:11:44 · 3989 阅读 · 0 评论 -
K-means算法简介
K-means算法简介K-means是机器学习中一个比较常用的算法,属于无监督学习算法,其常被用于数据的聚类,只需为它指定簇的数量即可自动将数据聚合到多类中,相同簇中的数据相似度较高,不同簇中数据相似度较低。K-menas的优缺点:优点:原理简单速度快对大数据集有比较好的伸缩性缺点:需要指定聚类 数量K对异常值敏感对初始值敏感K-means的聚类...转载 2018-06-01 16:53:32 · 3860 阅读 · 0 评论 -
机器学习常用距离公式
在机器学习领域中有非常多的问题需要求距离,常见的是向量距离的计算。比如判断A、B、C三种商品之间的相似性,可以先按照商品特征构建A、B、C的各自的向量,然后求向量间的距离,距离近就表示彼此相似度高。今天讲下常见的几种距离计算方法。A 欧式距离EuclideanDistance欧式距离:两点之间的直线距离。(1)二维平面上两点a(x1,y1),b(x2,y2)之间的欧式距离公式:...原创 2018-07-26 16:14:28 · 761 阅读 · 0 评论 -
ValueError: Expected 2D array, got 1D array instead:
今天在学习大佬的《机器学习系列(3)_逻辑回归应用之Kaggle泰坦尼克之灾》的时候,遇到了问题,执行第七步:数据的简单预处理的时候报错了,报错信息如下:---------------------------------------------------------------------------ValueError Tra...原创 2018-08-24 15:55:12 · 1737 阅读 · 0 评论