自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 机器学习 05 SVM

学习内容 SVM 硬间隔原理 SVM 软间隔 序列最小优化算法(SMO) 求解SVM 代码设计 算法简介:支持向量机(support vector machines,SVM)是一种二类分类模型,它的基本模型是定义在特征空间上的间隔最大的线性分类汽车,间隔最大使它有别于感知机。支持向量机还包括核技巧,这使它成为实质上的非线性分类器,支持向量机的学习策略就是...

2020-05-01 23:38:49 276

原创 机器学习 04 条件随机场

理论部分前提:相关概念 马尔可夫过程 隐马尔科夫算法 条件随机场 转移特征和状态特征 矩阵形式 条件随机场三问题 计算问题 学习问题 预测问题 练习部分利用高维特比算法计算给定输入序列对应的最优输出序列...

2020-04-27 09:21:10 243

原创 机器学习 03 EM算法

EM算法是机器学习十大算法之一,它可分两步求解问题:E步:求期望(expectation) M步:求极大(maximization)一、EM算法的引入 概率模型有时候既含有观测变量,又含有隐变量或潜在变量,如果概率模型的变量都是观测变量,那么给定数据,可以直接用极大似然估计法,或贝叶斯估计方法估计模型参数,但是当模型含有隐变量时,就不能简单的使用这些方法,EM算法就是含有隐...

2020-04-26 23:57:51 317

原创 机器学习:02 朴素贝叶斯

理论部分相关概念 生成模型 判别模型 朴素贝叶斯基本原理 条件概率公式 乘法公式 全概率公式 贝叶斯定理 特征条件独立假设 后验概率最大化 拉普拉斯平滑 朴素贝叶斯的三种形式 高斯型 多项式型 伯努利型 极值问题情况下的每个类的分类概率 下溢问题如何解决 零概率问题如何解决 sklearn参数详解一、理论部分1、相关概念...

2020-04-23 23:56:42 196

原创 机器学习:01 线性回归

基础总结线性回归一、线性回归的基本要素模型特征 和 结果 都满足线性。即不大于一次方。收集的数据中,每一个分量,就可以看做一个特征数据。每个特征至少对应一个未知的参数。这样就形成了一个线性模型函数。例如,假设价格只取决于房屋状况的两个因素,即面积(平方米)和房龄(年)。假设价格与这2个因素之间是线性关系:数据集通常收集一系列的真实数据,例如多栋房屋的真实售出价格和它们对...

2020-04-21 23:56:25 169

原创 数据挖掘入门 Task 5 模型融合

模型融合的目标:对于多种调参完成的模型进行模型融合。大体来说有如下的类型方式。简单加权融合: 回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean); 分类:投票(Voting) 综合:排序融合(Rank averaging),log融合 stacking/blending: 构建多层模型,并利用预测结果再拟合预测。...

2020-04-04 22:09:13 91

原创 零基础入门数据挖掘-Task4 建模调参

一、介绍1、线性回归模型:线性回归对于特征的要求处理长尾分布理解线性回归模型2、模型性能验证:评价函数与目标函数交叉验证方法针对事件序列问题的验证绘制学习率曲线绘制验证曲线3、嵌入式特征选择:Lasso回归Ridge回归决策树4、模型对比常用线性模型常用非线性模型5、模型调参贪心调参方法网络调参方法贝叶斯调参方法...

2020-04-01 21:51:33 126

原创 零基础入门数据挖掘 task3-特征工程

关于特征工程学习材料和直播的总结和理解。一、特征构造的目的(为什么要使用特征工程)可以增强数据表达、添加先验知识。特征工程一般常常与EDA数据分析结合。数据分析和特征工程有交集,可互为补充。二、特征构造的类别异常处理: 通过箱线图(或 3-Sigma)分析删除异常值; BOX-COX 转换(处理有偏分布); 长尾截断; 特征归一化/标准化: 标准化(转换为标准正态分布...

2020-03-28 21:53:50 149

原创 数据挖掘学习 task 2 数据分析

2020年3月20-4月3日,DateWhale零基础入门数据挖掘,task2 数据分析 学习笔记。题目:二手车交易价格的预测(https://tianchi.aliyun.com/competition/entrance/231784/information)学习了3月23日直播的讲解,结合题目对于EDA数据探索性分析,进行了总结。从baseline角度,EDA数据分析可大致分为7个步骤...

2020-03-24 21:20:01 956

原创 数据挖掘学习 task 1

2020年3月20-4月3日,DateWhale零基础入门数据挖掘,希望能够在此次组队学习中完成学习目标,加油!开源学习指引https://github.com/datawhalechina/team-learning:...

2020-03-21 21:59:25 118

转载 Sublime Text 3 Python配置

windows环境下:搭建Python的IDE一、打开Sublime Text 3安装package control 方法1:简单的安装方法1、使用Crtl+`快捷键或者通过View->Show Console菜单打开控制台,粘贴如下Python安装代码并回车:import urllib.request,os; pf = 'Package Control.sublime-p

2017-12-02 17:00:03 201

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除