自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

机器学习初学者必看,关注我,一起了解机器学习

过一个平凡无趣的人生实在太容易了,你可以不读书,不冒险,不运动,不写作,不外出,不折腾……但是,人生最后悔的事情就是:我本可以。

  • 博客(20)
  • 资源 (3)
  • 收藏
  • 关注

原创 【自然语言处理基础技能(NLP)】语言模型基础

文章目录一瞥1. 引言:朴素贝叶斯的局限性2. N-gram语言模型是啥?2.1从假设性独立到联合概率链规则2.2 从联合概率链规则到n-gram语言模型2.3 怎样选择依赖词的个数"n"?3. N-gram实际应用举例3.1 词性标注3.2 垃圾邮件识别3.3 中文分词3.4机器翻译与语音识别4. 平滑技术4.1 拉普拉斯平滑4.2 古德图灵(Good Turing)平滑4.3 组合估计平滑5....

2020-02-25 17:13:42 410

原创 python string.ascii_lowercase和string.lowercase区别

首先问题来源于:希望创建一个随机的25位的小写字母和数字的组合字符串import randomimport string''.join(random.sample(string.ascii_lowercase + string.digits, 25))用ipython 自动补全发现还有一个string.lowercase 很是好奇有什么不同。机智呀,原来一样的还很多。官方文档和...

2020-02-24 15:20:52 5347

原创 【模式识别与智能计算】第9章 聚类分析

本章要点:聚类的设计基于试探的未知类别聚类算法层次聚类算法动态聚类算法模拟退火聚类算法9.1聚类的设计聚类分析是指事先不了解-批样品中的每一个样品的类别或者其他的先验知识,而唯一的分类根据是样品的特征,利用某种相似性度量的方法,把特征相同或相近的归为一类,实现聚类划分。例如,对于- -幅手写数字图像,如图9- 1所示,将相同的手写数字划分为一类,即聚类分析要解决的问题。本书从...

2020-02-23 09:11:02 1809

原创 决策树应用实例④——淘宝&京东白条金额(回归&均方差&随机森林)

之前在京东购物,发现了一个新的支付方式,叫打白条,买东西可以先付钱,后面再分期付,这个跟买房按揭还不太一样,前者还必须缴纳30%以上的首付,而白条可以完全不用交钱。淘宝上也有类似的功能,叫花呗分期。当然也不是所有商品都能白条,白条金额也是有一个上限的。电商平台是根据什么决定用户的白条金额呢?太少了,无法达到刺激用户消费的作用,还显得平台小家子气;太多了,又无法承担用户薅羊毛一次就跑的风险。我猜...

2020-02-22 11:34:13 965

原创 决策树③——决策树参数介绍(分类和回归)

前面总结了信息熵,信息增益和基尼信息的定义,以及决策树三大算法的原理及迭代过程,今天介绍下Python中机器学习Sklearn库中决策树的使用参数决策树既可以做分类,也可以做回归,两者参数大体相近,下面会先介绍分类,再对回归不一样的参数做单独说明一、分类参数1、 criterion: 特征选取方法,可以是gini(基尼系数),entropy(信息增益),通常选择gini,即CART算法,如果...

2020-02-22 11:20:50 5326

原创 决策树②——决策树算法原理(ID3,C4.5,CART)

文章目录一瞥一、ID3算法1、算法原理2、算法过程二、C4.5算法1、算法原理2、算法过程三、CART算法1、原理2、算法过程四、决策树应用场景决策树是一种运用统计概率分析的机器学习方法。它表示对象属性和对象值之间的一种映射,树中的每一个节点表示对象属性的判断条件,其分支表示符合节点条件的对象。树的叶子节点表示对象所属的预测结果,主要有ID3,C4.5和CART三种基础决策树一、ID3算法1...

2020-02-22 11:14:05 900

原创 21分钟 MySQL 入门教程

21分钟 MySQL 入门教程一、MySQL的相关概念介绍MySQL 为关系型数据库(Relational Database Management System), 这种所谓的"关系型"可以理解为"表格"的概念, 一个关系型数据库由一个或数个表格组成, 如图所示的一个表格:表头(header): 每一列的名称;列(row): 具有相同数据类型的数据的集合;行(col): 每一行用来描述某...

2020-02-22 11:11:14 232

原创 【模式识别与机器学习】第4章 基于概率统计的贝叶斯分类器设计

本章要点:贝叶斯决 策的基本概念基于最小错 误率的贝叶斯决策基于最小风险的贝叶斯决策贝叶斯决策比较基于二值数据的贝叶斯分类实现基于最小错误 率的贝叶斯分类实现基于最小风险的贝叶斯分类实现...

2020-02-21 09:54:35 349

原创 【模式识别与机器学习】第2章 特征的选择与优化

本章要点:特征空间优化设计问题样本特征库初步分析样品筛选处理特征筛选处理,特征评估基于主成分分析的特征提取特征空间描述与分析手写数字特征提取与分析在实际的应用中,信息采集的对象多数是多特征、高噪声、非线性的数据集。人们只能尽量多列一些可能有影响的因素,在样本数不是很多的情况下,用很多特征进行分类器设计,无论从计算的复杂程度还是就分类器性能来看都是不适宜的。因此,研究如何把高...

2020-02-19 12:12:53 4986

原创 猫脸关键点检测Baseline【阿水】

关键点检测是许多计算机视觉任务的基础,例如表情分析、异常行为检测。大家接触最多的可能是人脸关键点检测,广泛应用于人脸识别、美颜、换妆等。本次AI研习社举办猫脸关键点检测,训练集有10468张,测试集9526张,目标是检测猫脸的9个关键点。其实我在读书期间就看到过这个猫脸数据,来自CUHK。猫脸关键点检测也是比较新的一个方向,例子比较直接,也非常方便用于例子讲解。猫脸关键点和人脸关键点类似,每...

2020-02-18 14:33:04 1940 2

原创 【数据挖掘,机器学习工程师】面试经验汇总贴

作者:牛客网链接:https://zhuanlan.zhihu.com/p/31474985来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。1、360安全研究院数据挖掘工程师(一面视频面 70分钟 gg)自我介绍 项目介绍(数据预处理,特征选择方法,xgboost与GBDT区别(算法到内存),评价指标有哪些,项目上没上线) 朴素贝叶斯推导,优缺点 决策...

2020-02-18 10:31:31 690

原创 算法工程师、软件工程师、大数据工程师,傻傻分不清楚

算法工程师的范围是小于数据挖掘工程师的数据挖掘工程师需要了解整套数据流入的过程,包括数据的接入、预处理,然后需要知道怎么用数据解决实际的业务问题,说白就是想办法让数据产生价值。他需要知道一整个数据到业务输出的机制或者说是系统,可能涉及到复杂的算法转化,也可能只是简单的规则转化,或者多个模型的转化组合输出等等,他是一个比较全面而概括性定位。算法工程师则不一样,他们的职责我认为更纯粹,他们需要知...

2020-02-18 09:52:03 3604 1

原创 matlab中@的用法

@是用于定义函数句柄的操作符。函数句柄既是一种变量,可以用于传参和赋值;也是可以当做函数名一样使用。举例:sin是matlab中的一个函数,但sin只是函数名,还不是函数句柄,不可以用于传参。f = @sin;这行代码定义了一个函数句柄,变量名是f。这样就可以当做参数传递了(这就是上面代码中的意义所在),而且还可以跟sin函数按相同的语法规则使用:g = f; % g也是函数句柄,其“值...

2020-02-18 09:16:14 4585

原创 【Python语法】中如何使用lambda表达式?匿名函数

lambda表达式,通常是在需要一个函数,但是又不想费神去命名一个函数的场合下使用,也就是指匿名函数,多数用来表示一些相对简单的函数。而且lambda本来就是用来定义匿名函数的,所以本身也不需要绑定名字。Lambda表达式的格式为:f = lambda x, y : x+yf(1,1) map,filter,reduce函数map函数就如我们标题里定义的问题,我需要定义一个lam...

2020-02-17 15:26:33 373

原创 Markdown文档常用字体及颜色设置

1、字体、字号、颜色设置<font face="微软雅黑" >微软雅黑字体</font><font face="黑体" >黑体</font><font size=3 >3号字</font><font size=4 >4号字</font><font color=#FF0000 >红色...

2020-02-17 10:10:24 629

原创 XGBoost——机器学习(理论+图解+安装方法+python代码)

文章目录一瞥一、集成算法思想二、XGBoost基本思想三、MacOS安装XGBoost四、用python实现XGBoost算法在竞赛题中经常会用到XGBoost算法,用这个算法通常会使我们模型的准确率有一个较大的提升。既然它效果这么好,那么它从头到尾做了一件什么事呢?以及它是怎么样去做的呢?我们先来直观的理解一下什么是XGBoost。XGBoost算法是和决策树算法联系到一起的。决策树算法在我...

2020-02-17 09:56:44 25241 1

原创 【leetcode】136. 只出现一次的数字+【C++ vector& nums 用法】

给定一个非空整数数组,除了某个元素只出现一次以外,其余每个元素均出现两次。找出那个只出现了一次的元素。说明:你的算法应该具有线性时间复杂度。 你可以不使用额外空间来实现吗?示例 1:输入: [2,2,1]输出: 1示例 2:输入: [4,1,2,1,2]输出: 4class Solution {public: int singleNumber(vector<int&g...

2020-02-15 12:35:57 1001

原创 词袋模型(BOW,bag of words)和词向量模型(Word Embedding)概念介绍

词袋模型(BOW,bag of words)和词向量模型(Word Embedding)概念介绍例句:Jane wants to go to Shenzhen.Bob wants to go to Shanghai.一、词袋模型 BOW,bag of words将所有词语装进一个袋子里,不考虑其词法和语序的问题,即每个词语都是独立的。例如上面2个例句,就可以构成一个词袋,袋子里包括Ja...

2020-02-14 12:24:29 589

原创 Matlab第六课:图形界面(GUI)程序设计

目标:Graphical User Interface一、MATLAB GUI Programs开始完成一个GUI程序:1.建立一个文件夹,存储程序2.使用 guide 命令在命令行创建一个matlab GUI 界面3.可以拖动组件,创建GUI...

2020-02-12 16:25:50 511

原创 机器学习算法岗面试题目解析-001

LSTM主题模型是什么,狄利克雷分布是什么,共轭是什么,HDP模型的原理。KMP算法的原理,B+树的原理(2)堆排序的原理,SVM的原理,SVM和LR,SVM原问题和对偶问题关系?决策树的原理。LR为什么用sigmoid函数。这个函数有什么优点和缺点?为什么不用其他函数?KKT条件用哪些,完整描述L1正则为什么可以把系数压缩成0,坐标下降法的具体实现细节https和连接建立过程...

2020-02-10 10:23:39 598

matlab程序非负矩阵分解NMF

非负矩阵分解(NMF,Nonnegtive Matrix Factorization),NMF,非负矩阵分解,将大矩阵分解成两个小矩阵,且这两个小矩阵都不包含负值。 代码来自Chih-Jen Lin

2021-03-09

robustcontrol.m

评分: 针对H无穷大控制,附加Matlab程序,有解释,适合初学者。针对H无穷大控制,附加Matlab程序,有解释,适合初学者。针对H无穷大控制,附加Matlab程序,有解释,适合初学者。

2019-12-10

多目标优化免费NSGA-II代码+详细解释(详见文章)

多目标优化免费NSGA-II代码+详细解释(详见文章)该函数基于求解多目标最优解的进化算法,即目标的帕累托前沿。最初只输入种群大小和回采标准,或算法自动停止的总代数。您将被要求输入目标函数的数量、决策变量的数量以及决策变量的范围空间。您还必须通过编辑evaluate_objective()函数来定义自己的目标函数。

2019-04-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除