数据挖掘
飞跃小龙猫
这个作者很懒,什么都没留下…
展开
-
缺失值处理 回归填充
通过线性回归模型预测并填充未知数据原创 2021-12-31 14:29:21 · 1428 阅读 · 0 评论 -
缺失值处理 KNN填充
通过KNN模型预测并填充未知数据原创 2021-12-31 14:28:03 · 1714 阅读 · 0 评论 -
缺失值处理 fillna
通过fillna函数对缺失数据进行统计(均值、中位数、众数)填充原创 2021-12-31 14:25:10 · 612 阅读 · 0 评论 -
缺失值处理 SimpleInputer
通过SimpleInputer对缺失数据进行统计(均值、中位数、众数)填充原创 2021-12-31 14:22:00 · 936 阅读 · 0 评论 -
缺失值处理 DropNa
通过dropna函数删除带有缺失数据的行或列原创 2021-12-31 14:19:00 · 1166 阅读 · 0 评论 -
有监督学习之KNN回归问题
import numpy as npfrom sklearn.neighbors import KNeighborsRegressor # 回归import matplotlib.pyplot as pltx = [1, 2, 3, 4, 5]x = np.array(x).reshape(-1,1)y = [9, 12, 1, 6, 7]plt.scatter(x, y)plt.show()model = KNeighborsRegressor(n_neighbors=3)mo.原创 2021-12-05 16:56:01 · 281 阅读 · 0 评论 -
有监督学习之KNN分类问题
from sklearn.neighbors import KNeighborsClassifier # 分类import numpy as npimport matplotlib.pyplot as pltx = np.array( [[1, 1], [1, 1.5], [2, 2.5], [2.5, 3], [1.5, 1], [3, 2.5]])y = ['A','A','B','B','A','B']'''n_nei.原创 2021-12-05 16:55:00 · 135 阅读 · 0 评论 -
基于LDA实现降维
import pandas as pdimport numpy as npfrom sklearn.datasets import load_wineimport matplotlib.pyplot as pltwine = load_wine()df_wine = pd.DataFrame(data=wine["data"],columns=wine["feature_names"])# print(df_wine)df_wine["target"] = wine["target"].原创 2021-12-05 16:51:55 · 3392 阅读 · 2 评论 -
基于PCA实现降维
import numpy as npx=np.array([2.5,0.5,2.2,1.9,3.1,2.3,2,1,1.5,1.1])y=np.array([2.4,0.7,2.9,2.2,3.0,2.7,1.6,1.1,1.6,0.9])# 将两行数据拼接,然后再进行转置处理O = np.vstack((x,y)).Tprint(O)x = x.reshape(-1,1)y = y.reshape(-1,1)# 中心化处理X = np.hstack((x - np.mean(.原创 2021-12-05 16:47:12 · 1170 阅读 · 0 评论