![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 76
最低调的奢华
忽有故人心上过,回首山河已是秋。
恍惚半生烂若泥,连哭都怕失了礼。
展开
-
时间序列的创建,差分,转换为timestamp ,从表格提取固定时间数据,以及ARIMA模型的构建和预测
选取ARIMA模型p,d,q参数,将表格中时间列转换为时间序列数据,创建ARIMA模型进行差分预测原创 2022-11-14 11:04:59 · 1231 阅读 · 1 评论 -
标准化,归一化,二值化,One-Hot,卡方检验选取重要特征,主成分分析,缺失值和异常值处理
python特征处理和选择 缺失值异常值重复值处理,卡方检验,归一化标准,二值化,One-Hot编码等处理原创 2022-10-17 18:12:28 · 3011 阅读 · 7 评论 -
最小二乘法,梯度下降法,sklearn中API来实现线性回归
导入模块import numpy as npimport pandas as pdfrom matplotlib import pyplot as plt1.导入训练集数据x = np.array([0.86, 0.96, 1.12, 1.35, 1.55, 1.63, 1.71, 1.78])y = np.array([12, 15, 20, 35, 48, 51, 59, 66])def fit(x,y): if len(x) != len(y): retu.原创 2022-01-24 19:39:30 · 1337 阅读 · 0 评论 -
机器学习之特征的抽取,特征预处理,以及特征的选择,归一化标准化主成分分析来进行特征处理
1.特征抽取1.字典数据的抽取首先导入APIfrom sklearn.feature_extraction import DictVectorizerdef dictvec(): """ 字典数据抽取 :return: """ # 实例化 dict1 = DictVectorizer() # 调用fit_transform data = dict1.fit_transform( [{'city': '北京', 't原创 2022-01-16 16:46:49 · 809 阅读 · 0 评论 -
机器学习之——多项式回归与degree参数调节
多项式回归模型构建以及预测,和参数选择原创 2021-11-04 20:58:19 · 1523 阅读 · 0 评论 -
简单的理解K近邻算法的实现
K近邻算法介绍近朱者赤,近墨者黑如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一类别,则该样本也属于该类别总结knn工作流程计算待分类物体与其他物体之间的距离统计距离最近的k个邻居对于k个邻居,他们属于哪种分类多,待分类物体就属于哪一类1.手动实现KNN算法五个步骤1.读取数据2.数据的基本处理3.特征工程4.数据可视化训练数据 特征:打斗和亲吻次数 类别:电影类型预测数据5.算法实现在算法运用的过程中我们可以使用欧式距离来进行运原创 2021-10-18 20:58:14 · 410 阅读 · 1 评论