自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(72)
  • 收藏
  • 关注

原创 【Dataset】UCI

文章目录【一】 Adult(美国人口普查年收入50K)  【一】 Adult(美国人口普查年收入50K) 【下载地址】https://archive.ics.uci.edu/ml/datasets/Adult 【数据集简述】UCI 数据库中的数据集 Adult,是针对美国某区域的一次人口普查结果,可以用来预测居民收入是否超过 50K,分为训练集(adult.data)和测试集(adult.test) 【数据集标签】| nam

2020-06-15 09:17:31 513

原创 【AI】_06_Topic Models(主题模型)

文章目录【一】 Frequentist VS Bayesian(统计学两大领域)【1.1】 Frequentist(频次)【1.2】 Bayesian(贝叶斯)【1.3】 二者的区别【二】 Topic Models(主题模型)【2.1】 LSA(潜在语义分析)【2.2】 pLSA(概率潜在语义分析)【2.3】 LDA(潜在狄利克雷分布)【2.4】 lad2vec(基于word2vec)&nbsp...

2020-04-04 11:48:46 350

原创 【NLP】_12_XLNet

文章目录【一】 XLNet(简单介绍)  【一】 XLNet(简单介绍)

2020-03-29 12:21:17 255

原创 【NLP】_11_Bert

文章目录【一】 Bert(简单介绍)【二】 模型结构(与 GPT 和 ELMo 对比)【三】 Embedding(三个部分)【四】 Masked LM(遮掩语言模型)【五】 Next Sentence Prediction(预测下一个句子)【六】 Fine-Tunning(根据任务微调)【七】 Advantages / Disadvantage(优缺点)  【一】 Be...

2020-03-21 21:15:50 227

原创 【ML】_00_02_降维算法

文章目录【一】 PCA(Principal Component Analysis,主要成分分析)【1.1】 斜方差公式(Cov\bm {Cov}Cov)【1.2】 构建斜方差矩阵 C\bm CC【1.3】 构建斜方差矩阵 D\bm DD【1.4】 推导过程(S\bm SS → P\bm PP)【二】 LDA(Linear Discriminant Analysis,线性差异分析)【2.1】 基本定...

2020-03-10 15:23:02 193

原创 【MySQL】_03_SQL 语句

文章目录【一】 数据完整性【1.1】 数据类型(TYPE)【1.2】 数据约束(CONSTRAINTS)【二】 数据库操作(DATABASE)【2.0】 基本操作(EXIT,SHOW,VERSION,NOW)【2.1】 创建(CREATE)【2.2】 删除(DROP)【三】 数据表操作(TABLE)【3.1】 创建(CREATE)【3.2】 添加(ADD)【3.3】 删除(DROP,DELETE)...

2020-03-10 00:59:35 125

原创 【MySQL】_02_MySQL基础

文章目录【一】 Linux 相关命令(牢记)【二】 MySQL 配置(mysql.cnfmysql.cnfmysql.cnf)【三】 Navcat for MySQL(图形化界面)  【一】 Linux 相关命令(牢记) 查询所有包含 mysql 这个字段的进程ps -aux | grep "mysql"启动 mysqlsudo servi...

2020-03-09 13:32:14 95

原创 【MySQL】_01_数据库介绍

文章目录【一】 RDBMS(Relational Database Management System,关系数据库管理系统)【二】 SQL(Structured Query Language,结构化查询语言)【三】 MySQL(轻中量级)  【一】 RDBMS(Relational Database Management System,关系数据库管理系统) ...

2020-03-09 11:44:26 94

原创 【MATH】_06_正态 (高斯) 分布

文章目录【一】 定义(连续型)【二】 标准正态(高斯)分布【三】 经典题目(必做)  【一】 定义(连续型) f(x)=12πσ⋅e(x−μ)22σ2        s.t    −∞<x<+∞f ( x ) = \bm \red {\frac { 1 } { \sqrt { 2 \pi \sigma } } \cdot e ^ { \frac...

2020-03-08 23:36:19 413

原创 【MATH】_05_指数分布

文章目录【一】 定义(连续型)【二】 经典题目(必做)  【一】 定义(连续型) f(x)=λe−λx      x>0,      f(x)=0      x≤0f ( x ) = \lambda e ^ { - \lambda x } \;\;\;x>0, \;\;\; f ( x ) = 0 \;\;\; x \leq 0f(x)=λe−...

2020-03-08 22:43:18 263

原创 【MATH】_04_均匀分布

文章目录【一】 定义(连续型)【二】 经典题目(必做)  【一】 定义(连续型) f(x)=1b−a      x∈(a,b),      f(x)=0      x∈其他f ( x ) = \frac { 1 } { b - a } \;\;\; x \in ( a , b ), \;\;\; f ( x ) = 0 \;\;\; x \in 其他f(x...

2020-03-08 22:18:28 270

原创 【MATH】_03_泊松分布

文章目录【一】 定义(离散型)【二】 近似(二项分布)【三】 经典题目(必做)  【一】 定义(离散型) 随机变量 X 的概率分布为: P(X=k)=e−λλkk!        s.t    k=0,1,2,...,    λ>0P ( X = k ) = \frac { e ^ { - \lambda } \lambda ^ { ...

2020-03-08 21:27:49 1003

原创 【MATH】_02_伯努利 (0-1) 分布

文章目录【一】 定义(离散型)【二】 二项分布(0-1分布的叠加)  【一】 定义(离散型) X01Pqp  【二】 二项分布(0-1分布的叠加) n\bm nn 重 伯努利试验:设试验 EEE 只有两种可能得结果 AAA 和 A‾\overline AA,P(A)=pP(A)=pP...

2020-03-08 15:04:42 963

原创 【MATH】_01_概率论基础

文章目录【一】 Sample Spaces(样本空间)【二】 Probability Spaces(概率空间)【三】 Conditional Probability(条件概率)  【一】 Sample Spaces(样本空间) 定义:随机试验 EEE 的所有结果构成的集合,称为 EEE 的样本空间,记为如下,SSS 中的元素 eee 为 基本事件 或 样...

2020-03-08 12:24:57 486 1

原创 【ML】_00_01_防止过拟合

文章目录【零】 出现过拟合的原因【一】 降低模型复杂度【二】 Data Augmentation(数据增强)【三】 L1-Norm(L1 正则化)【四】 L2-Norm(L2 正则化)【五】 L1-Norm + L2-Norm(Elasting Net)【六】 Decision Tree Pruning(决策树剪枝)【七】 SVM松弛变量 (个别点线性不可分)【八】 Dropout(随机丢弃神经元...

2020-03-07 12:09:02 229

原创 【NLP】_09_Seq2Seq Model

文章目录【一】 Multimodal Learning(多模态学习)【二】 Seq2Seq Model(序列到序列模型)【三】 Evaluate Seq2Seq Model(评估模型效果)【3.1】 Beam Search(选取 Top K 个值作为候选)  【一】 Multimodal Learning(多模态学习) 多种模型的拼接(图片,文本,语音等...

2020-03-07 11:57:36 119

原创 【数据结构和算法】_10_剪枝

【一】 Interview(面试题) 【1.1】 LeetCode 51 52:N Queens(N皇后问题)题目说明:西洋象棋,如何将 n 个皇后放置在 n x n 的棋盘上,并且使得皇后之间不能相互攻击DFS(深度优先搜索)def solveNQueens(self, n): if n < 1: return [] self.result = [] # ...

2020-03-05 21:58:03 337

原创 【数据结构和算法】_09_广度 / 深度 优先搜索

文章目录【一】 Breadth - First Search(广度优先搜索)【二】 Depth - First Search(深度优先搜索)【三】 Interview(面试题)【3.1】 LeetCode 102:Binary Tree Level Order(二叉树的层次遍历)【3.2】 LeetCode 104:Max depth(二叉树的最大深度)【3.3】 LeetCode 111:Min...

2020-03-05 15:21:15 123

原创 【ML】_09_Boosting(集成学习分支2)

文章目录【一】 Boosting(近年来很流行的一个流派)【二】 AdaBoost(自适应)【三】 GBDT(梯度下降树)【四】 XGBoost(待补充)  【一】 Boosting(近年来很流行的一个流派) 【有监督】现在最常用的,也最需要掌握的,分类算法 特点:各个弱学习器之间 有 依赖关系,将一些变现一般的模型,通过特定的方法组合...

2020-03-04 14:53:59 189

原创 【ML】_08_Bagging(集成学习分支1)

文章目录【一】 Bagging(算法的一个流派,自助聚合)【二】 Random Forest(随机森林)  【一】 Bagging(算法的一个流派,自助聚合)提出背景:为了减少 bias,我们可以学习一棵很大很深的 决策树,但是决策树很容易 过拟合;而随机划分数据来训练模型,过拟合的决策树产生不一样的预测结果,variance 很大特点:各个弱学习器之间 没有 依...

2020-03-04 14:50:09 267

原创 【ML】_07_BP(反向传播)

文章目录【一】 Back Propagation(BP算法,反向传播)【二】 正向传播(Forward)【三】 BP 求导流程【四】 Gradient Checking(梯度检测)  【一】 Back Propagation(BP算法,反向传播) 非常重要的,反向传播更新参数的算法,必须掌握  【二】 正向传播(Forw...

2020-03-04 14:45:11 108

原创 【ML】_05_Naive Bayes(朴素贝叶斯)

文章目录【一】 Naive Bayes(朴素贝叶斯)【二】 Conditional Independent(条件独立)【三】 公式(可用于 文本分类,垃圾邮件分类)  【一】 Naive Bayes(朴素贝叶斯) 【有监督】简单的,基于概率的,分类算法  【二】 Conditional Independent(条件独立)...

2020-03-04 14:40:50 86

原创 【ML】_06_EM(隐变量)

文章目录【一】 Latent Variable Model(隐变量模型)【二】 Expectation Maximization(EM算法)【三】 手推 EM 算法  【一】 Latent Variable Model(隐变量模型) 举个例子:比如说一个人的观测值为【公益活动,运动,执行力强】,但其对应的未观测值为【善良,坚持,博学】,也就是说这是一种因...

2020-03-04 14:32:40 308

原创 【ML】_04_DT(决策树)

文章目录【一】 Decision Tree(决策树)【二】 Entropy(信息熵)【三】 Information Gain(信息增益,越大越好):ID3 算法【四】 Information Gain Ratio(信息增益率,越大越好):C4.5 算法【五】 Gini Index(Gini系数,越小越好):CART 算法  【一】 Decision Tree(决策树)...

2020-03-04 14:24:11 208

原创 【ML】_03_SVM(支持向量机)

文章目录【一】 SVM(Support Vector Machine,支持向量机)【二】 手撕 SVM(必须掌握)【三】 拉格朗日对偶性【四】 SVM 的 Dual Problem(对偶问题)【五】 Kernel Trick(核函数)  【一】 SVM(Support Vector Machine,支持向量机) 【有监督】拥有核函数的分类算法,数学理论基...

2020-03-04 14:12:55 135

原创 【ML】_02_LR(逻辑回归)

文章目录【一】 LR(Logistic Regression,逻辑回归)【二】 Softmax 回归(多个 LR 的组合,多分类)【三】 Sigmoid (激活函数)【四】 Cross Entropy Loss(交叉熵损失函数):【五】 应用场景  【一】 LR(Logistic Regression,逻辑回归) 【有监督】常用的二分类算法,功能强大,逻...

2020-03-04 13:48:30 190

原创 【ML】_01_KNN(K邻近)

文章目录【一】 KNN(K邻近算法)【二】 投票机制(多数决)【三】 如何选取 K【四】 交叉验证(K-Fold)【五】 Disadvantage(缺点)  【一】 KNN(K邻近算法) 【有监督】最基础的分类算法,简单易懂  【二】 投票机制(多数决)  【三】 如何选取 K ...

2020-03-04 12:27:28 168

原创 【数据结构和算法】_08_贪心算法

文章目录【一】 Greedy(贪心)【二】 Interview(面试题)【2.1】 LeetCode 122:Buy / Sell Stocks(买卖股票的最佳时机)  【一】 Greedy(贪心) 贪心法,又称贪心算法,贪婪算法:在对问题求解时,总是做出在当前看来是最好的选择,目光短浅 适用场景:问题能够分解成 子问题 来解决,子问题...

2020-03-03 20:50:07 127

原创 【数据结构和算法】_07_递归&分治

文章目录【一】 Recursion(递归,盗梦空间)    【1.1】 盗梦空间(阶乘)    【1.2】 代码模板【二】 Divide and Conquer(分治)    【2.1】 分解问题    【2.2】 代码模板【三】 Inte...

2020-03-02 23:02:40 129

原创 【数据结构和算法】_06_二叉树遍历

文章目录【一】 Pre - Order(前序遍历,根 - 左 - 右)【1.1】 示意图【1.2】 代码示例【二】 In - Order(中序遍历,左 - 根 - 右)【2.1】 示意图(二叉搜索树时升序)【2.2】 代码示例【三】 Post - Order(后序遍历,左 - 右 - 根)【3.1】 示意图【3.2】 代码示例  【一】 Pre - Order(前序遍历...

2020-02-25 23:39:01 124

原创 【数据结构和算法】_05_树 & 图

文章目录【一】 Tree(树)【1.1】 完全二叉树【1.2】 二叉搜索树(Binary Search Tree)【二】 Garph(图)【三】 Interview(面试题)【3.1】 LeetCode 98:Validate BST(验证二叉搜索树)【3.2】 LeetCode 236,235:Lowest Common Ancestor(二叉树 / 二叉搜索树的最近公共祖先) 【...

2020-02-24 21:55:00 200 1

原创 【NLP】_06_CRF(条件随机场)

【一】Directed Graph and Undirected Graph(有向图和无向图)   【二】Joint Probability(联合概率) Directed Graph(有向图) Undirected Graph(无向图,运用 Clique 概念,每个 Clique 称为一个 Factor) ...

2020-02-24 11:47:33 175

原创 【NLP】_05_HMM(隐马尔科夫模型)

文章目录【一】三大主要问题【二】经典例子【三】3 个参数(A B π)【四】Viterbi(维特比算法)【五】F / B Algorithm(Forward / Backward 算法)  【一】三大主要问题在已知模型参数的条件下,基于观测值,反推出其背后的序列(Decode)基于观测值,反推出模型的参数(EM)计算出观测值序列的边缘概率 【二】经...

2020-02-19 18:09:33 232

原创 【NLP】_03_基础词向量

【一】Word2Vec(词向量) Word2Vec,作为 NLP 领域深度学习的基础,是每个工程师都绕不过的重点话题。虽然从18年年底就诞生出了 Bert,GPT 等预训练模型,横扫 NLP 领域,但其还是局域 Word2Vec 的向量和思想训练出来的。 【1.1】Skip-Gram(通过 中心词 预测 上下文)...

2020-02-18 12:17:35 174

原创 【NLP】_04_句法分析

文章目录【一】Syntax Tree(句法树)【二】CKY 算法(动态规划) 【一】Syntax Tree(句法树) 【N:名词】【V:动词】【P:介词】【NP:名词短语】【PP:介词短语】 Old Machine Translation(老旧的机器翻译) From CFG(Context Free Grammars) to PCFG...

2020-02-17 16:39:06 401

原创 【NLP】_02_NLP经典任务

【一】NER(命名实体识别) ORG(组织),LOC(地点),PER(人物) 常用方法(原文链接:https://blog.csdn.net/weixin_37665090/article/details/89454829)LSTM 的优点是能够通过双向的设置学习到观测序列(输入的单词)之间的依赖,在训练过程中,LSTM 能够根据目标(比如识别实体)自动提取...

2020-02-17 14:04:59 331

原创 【NLP】_01_NLP基础知识

【一】Inverted Index(倒排索引)Vocabulary:[ Word1, Word2, …, WordN ]Word1: [ Doc1, Doc2, … ];Word2: [ Doc1, Doc2, … ];WordN: [ Doc1, Doc2, … ]建立倒排表,用于快速检索,如搜索引擎 【二】Noisy Channel ModelBayes 贝叶斯公式...

2020-02-08 10:47:32 215

原创 【CV】08_图像分割 (Segmentation)

U - NET

2019-11-13 11:42:17 316

原创 【CV】HoughTransform_霍夫变换

【一】Hough Transform检测图像中是否有 特定几何形状 的物体 【二】逐步推导演示 【1】笛卡尔坐标系中一条线,霍夫空间一个点在笛卡尔坐标系中,我们可以 y = mx + b 通过绘制 y 对 x 来表示直线但是,我们也可以通过绘制 b 对 m 来将此线表示为霍夫空间中的单个点例如,具有等式的线 y = 2x + 1 可以表示为(2,1)霍夫空...

2019-11-11 15:55:02 147

原创 【CV】Canny_边缘检测

【一】介绍Canny Detector 是一种针对快速实时边缘检测而优化的多阶段算法该算法的基本目标是检测亮度(大梯度)的急剧变化,例如从白色到黑色的转换在给定一组阈值的情况下将它们定义为边缘 【二】四个阶段 【1】降噪与所有边缘检测算法一样,噪声是一个至关重要的问题,通常会导致错误检测应用 5x5 高斯滤波器 对图像进行卷积(平滑)以降低检测器对噪声的...

2019-11-11 13:17:39 610

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除