![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
北山璎珞
私はこのjianghuが好き
展开
-
分类算法-朴素贝叶斯算法
一 朴素贝叶斯分类方法二 概率基础2.1 概率(Probability)定义概率定义为一件事情发生的可能性扔出一个硬币,结果头像朝上某天是晴天P(X) : 取值在[0, 1]2.2 女神是否喜欢计算案例2.3 条件概率与联合概率联合概率:包含多个条件,且所有条件同时成立的概率记作:P(A,B)特性:P(A, B) = P(A)P(B)条件概率:就是事件A在另外...原创 2020-03-14 21:21:32 · 288 阅读 · 0 评论 -
分类算法-模型选择与调优
一 交叉验证目的为了让被评估的模型更加准确可信二 交叉验证(cross validation)交叉验证:将拿到的训练数据,分为训练和验证集。以下图为例:将数据分成5份,其中一份作为验证集。然后经过5次(组)的测试,每次都更换不同的验证集。即得到5组模型的结果,取平均值作为最终结果。又称5折交叉验证。2.1 分析三 超参数搜索-网格搜索(Grid Search)通常情况下,有很多参数是...原创 2020-03-14 20:13:08 · 1453 阅读 · 0 评论 -
分类算法 - K-近邻算法(附案例及测试数据)
一 定义如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。1.1 距离公式两个样本的距离可以通过如下公式计算,又叫欧式距离二 电影类型分析三 K-近邻算法APIsklearn.neighbors.KNeighborsClassifier(n_neighbors=5,algorithm=‘auto’)n_neigh...原创 2020-03-14 16:06:20 · 2120 阅读 · 0 评论 -
机器学习 - 分类算法
一 数据集1.1 数据集的划分机器学习一般的数据集会划分为两个部分:训练数据:用于训练,构建模型测试数据:在模型检验时使用,用于评估模型是否有效划分比例:训练集:70% 80% 75%测试集:30% 20% 30%APIsklearn.model_selection.train_test_split(arrays, *options)x 数据集的特征值y 数据集的...原创 2020-03-12 21:16:24 · 415 阅读 · 0 评论 -
机器学习-算法入门
一 机器学习算法类别1.1 按照学习方式分类监督学习(supervised learning)(预测)①定义:输入数据是由输入特征值和目标值所组成。函数的输出可以是一个连续的值(称为回归),或是输出是有限个离散值(称作分类)。②分类 k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络③回归 线性回归、岭回归④ 标注 隐马尔可夫模型 (不做要求)无监督学习(unsuper...原创 2020-03-08 20:52:54 · 232 阅读 · 0 评论 -
机器学习 - 特征选择及降维
一 特征选择1.1 定义数据中包含冗余或无关变量(或称特征、属性、指标等),旨在从原有特征中找出主要特征1.2 特征选择的方法1)Filter(过滤式)主要探究特征本身特点、特征与特征和目标值之间关联方差选择法:低方差特征过滤相关系数2) Embedded (嵌入式)算法自动选择特征(特征与目标值之间的关联)决策树:信息熵、信息增益正则化:L1、L2深度学习:卷积等1...原创 2020-03-08 20:52:45 · 974 阅读 · 1 评论 -
机器学习-特征工程
1、什么是特征工程1.1 特征工程是使用专业背景知识和技巧处理数据,使得特征能在机器学习算法上发挥更好的作用的过程。意义:会直接影响机器学习的效果数据集构成:特征值+目标值1.2 特征工程包含内容特征抽取特征预处理特征降维1.3 特征工程所需工具1) Scikit-learn对于 特征的处理 提供了强大的接口① Python语言的机器学习工具② Scikit-learn包...原创 2020-03-08 20:52:35 · 407 阅读 · 0 评论 -
Python机器学习入门
一 定义机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测二 为什么需要机器学习解放生产力:智能客服:不知疲倦24小时小时作业量化投资:避免更多的编写策略、交易人员医疗:帮助医生辅助医疗解决专业问题:ET医疗提供社会便利:杭州的城市大脑三 机器学习应用场景3.1 用在挖掘、预测领域:应用场景:店铺销量预测、量化投资、广告推荐、企业客户分类、SQL语句...原创 2020-03-08 20:52:25 · 226 阅读 · 1 评论