![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据建模
文章平均质量分 54
斑点鱼 SpotFish
这个作者很懒,什么都没留下…
展开
-
【python数据分析】数据建模之Kmeans聚类
K-means聚类:最常用的机器学习聚类算法,且为典型的基于距离的聚类算法。 K均值:基于原型的、划分的距离技术,它试图发现用户指定个数(K)的簇以欧式距离作为相似度测度 Kmeans聚类案例分析:make_blobs聚类数据生成器# 导入模块fromsklearn.clusterimportKMeansfrom sklearn.datasets import make_blobs# 创建数据x,y_true=make_blobs(n_samples=300,...原创 2022-05-06 15:39:06 · 1109 阅读 · 0 评论 -
【python数据分析】数据建模之 PCA主成分分析
PCA主成分分析:最广泛无监督算法 + 基础的降维算法。 通过线性变换将原始数据变换为一组各维度线性无关的表示,用于提取数据的主要特征分量 → 高维数据的降维 PCA主成分分析:二维数据降维 / 多维数据降维 /主成分筛选二维数据降维# 加载主成分分析模块PCAfrom sklearn.decomposition import PCA# 数据创建rng = np.random.RandomState(8)data = np.dot(rng.rand(2,2),原创 2022-05-06 15:31:29 · 3225 阅读 · 0 评论 -
【python数据分析】数据建模之KNN分类
最近邻分类:在距离空间里,如果一个样本的最接近的k个邻居里,绝大多数属于某个类别,则该样本也属于这个类别。KNN分类案例分析:电影分类from sklearn import neighbors # 导入KNN分类模块data = pd.DataFrame({'name':['北京遇上西雅图','喜欢你','疯狂动物城','战狼2','力王','敢死队'], 'fight':[3,2,1,101,99,98],原创 2022-05-06 13:50:31 · 626 阅读 · 0 评论 -
【python数据分析】:数据建模之线性回归
线性回归通常是人们在学习预测模型时首选的技术之一。在这种技术中,因变量是连续的,自变量可以是连续的也可以是离散的,回归线的性质是线性的。线性回归使用最佳的拟合直线(也就是回归线)在因变量(Y)和一个或多个自变量(X)之间建立一种关系。线性回归:简单线性回归 / 多元线性回归 /模型评估简单线性回归(一元线性回归)# 导入线性回归模块from sklearn.linear_model import LinearRegression# np.random.Rando原创 2022-05-06 13:37:41 · 1135 阅读 · 0 评论