机器学习
文章平均质量分 65
謝堆堆DDD
这个作者很懒,什么都没留下…
展开
-
机器学习01
这里写目录标题机器学习特征工程特征提取特征预处理特征降维机器学习算法分类监督学习定义:非监督学习定义:有监督,无监督算法对比:半监督学习定义:强化学习模型评估分类模型评估回归模型评估欠拟合过拟合Matplotlib、Numpy、PandasMatplotlibNumpyPandas 机器学习 机器学习是从数据中自动分析获得模型,并利用模型对未知数据进行预测。 特征工程 特征提取 将任意数据(如文本或图像)转换为可用于机器学习的数字特征 特征预处理 通过一些转换函数将特征数据转换成更加适合算法模型的特征数原创 2021-07-29 20:49:30 · 994 阅读 · 0 评论 -
机器学习day02
分类算法 1. sklearn转换器和预估器 转换器 特征工程的步骤: 1、实例化 (实例化的是一个转换器类(Transformer)) 2、调用fit_transform(对于文档建立分类词频矩阵,不能同时调用) 我们把特征工程的接口称之为转换器,其中转换器调用有这么几种形式 fit_transform fit() 计算每一列的平均值、标准差 transform() (x-mean)/std的最终计算(标准化) 估计器 估计器(estimator) 1原创 2021-03-26 16:46:10 · 161 阅读 · 0 评论 -
机器学习day03
回归与聚类 1.线性回归 回归问题:目标值是连续型的数值 线性关系一定是线性模型,线性模型不一定是线性关系 线性回归的损失和优化原理: 损失函数 优化方法:正规方程----直接求到最好的结果 梯度下降----试错、改进 线性回归API sklearn.linear_model.LinearRegression(fit_intercept=True) sklearn.linear_model.SGDRegressor(loss="squared_loss", fit_intercept=Tru原创 2021-03-29 20:01:27 · 158 阅读 · 0 评论 -
机器学习day01
数据集 可用数据集 Kaggle网址:https://www.kaggle.com/datasets UCI数据集网址: http://archive.ics.uci.edu/ml/ scikit-learn网址:http://scikit-learn.org/stable/datasets/index.html#datasets原创 2021-03-22 18:45:03 · 156 阅读 · 0 评论 -
机器学习概述
机器学习算法分类 监督学习 目标值:类别—分类问题(猫还是狗?) 算法:k-近邻法、贝叶斯分类、决策树与随机森林、逻辑回归 目标值:连续型的数据----回归问题(房屋价格预测) 算法:线性回归、岭回归 无监督学习 目标值:无—无监督学习(没有目标值) 聚类k-means 机器学习开发流程 任务: 分析很多的数据 分析具体的业务 应用常见的算法 特征工程、调参数、优化 ...原创 2021-03-22 16:01:54 · 80 阅读 · 0 评论