算法
文章平均质量分 73
pennyyangpei
这个作者很懒,什么都没留下…
展开
-
阅读笔记 - 《统计学习方法 - 李航》
阅读笔记 - 《统计学习方法 - 李航》1 统计分析1.1 常见的几种损失函数1.2 风险函数1.3 过拟合1.4 损失函数 1.5 模型选择的方法1:正则化1.6 模型选择的方法2:交叉验证 1.7 生成方法与判别方法1.8 分类器评估指标-精确率、召回率、f11.9 序列标...原创 2018-07-16 17:10:12 · 636 阅读 · 0 评论 -
PageRank算法
一、PageRank原理二、各类问题2.1、终止问题2.2、陷阱问题三、改进4.1、解决终止点问题和陷阱问题4.2、图示五。优缺点一、PageRank原理PageRank(网页级别)用来衡量一个网站的好坏的唯一标准。在揉合了诸如Title标识和Keywords标识等所有其它因素之后,在搜索结果中令网站排名获得提升,从而提高搜索结果的相关性和...原创 2018-07-14 15:04:17 · 2139 阅读 · 1 评论 -
机器学习中常用的距离度量总结
一、欧式距离二、曼哈顿距离三、切比雪夫距离四、闵可夫斯基距离(闵式距离)五、马氏距离六、标准欧式距离七、汉明距离八、杰卡德距离九、测地距离(Geodesic Distance)几种常见的距离 一、欧式距离 &nb...原创 2018-07-14 15:23:25 · 1491 阅读 · 0 评论 -
数据处理中的维数灾难
一、定义 ~~~~~~~~维度就是特征的数量,随着维度的增加,分类器性能逐步上升,到达某点之后,其性能便逐渐下降 &原创 2018-07-14 15:45:40 · 4025 阅读 · 0 评论 -
凸优化问题
一、概念 ~~~~~~~最优化问题目前在机器学习,数据挖掘等领域应用非常广泛,因为机器学习简单来说,主要做的就是优化问题,先初始化一下权重参数,然后利用优化方法来优化这个权重,直到准确率不再是上升,迭代停止。 两个正数的算术原创 2018-07-14 16:03:09 · 3914 阅读 · 0 评论 -
关联规则Apriori算法
算法原理 一、概念①支持度:P(A ∩ B),既有A又有B的概率 ②置信度: P(B|A),在A发生的事件中同时发生B的概率 p(AB)/P(A) 例如购物篮分析:牛奶 -> 面包 例子:[支持度:3%,置信度:40%] 支持度3%:意味着3%顾客同时购买牛奶和面包 置信度40%:意味着购买牛奶的顾客40%也购买面包 ③如果事件A中包含k个元素,那么称这个事件A为k项集...原创 2018-07-14 16:15:29 · 1552 阅读 · 0 评论 -
EM算法
一、概念二、应用场景距离计算案例案例优化图解步骤一、概念顾名思义: ~~~~~~最大期望算法(Expectation Maximization Algorithm,又译期望最大化算法),是一种迭代算法,用于含有隐变...原创 2018-07-14 16:17:24 · 265 阅读 · 0 评论 -
正则化
一、正则化(Regularization) ~~~~~~~~机器学习中几乎都可以看到损失函数后面会添加一个额外项,常用的额外项一般有两种,中文称作L1正则化和L2正则化,或者L1范数和L2范原创 2018-07-14 16:25:57 · 4647 阅读 · 2 评论 -
牛顿法
牛顿法原创 2018-07-14 16:33:14 · 365 阅读 · 0 评论 -
人工智能机器学习目录
1、     &a原创 2018-07-14 14:53:53 · 731 阅读 · 0 评论 -
机器学习十大算法之一:SVM支持向量机
机器学习十大算法之一:SVM支持向量机1 SVM思维导图2 SVM2.1 SVM概念              &a原创 2018-07-06 20:59:21 · 686 阅读 · 0 评论 -
十种常见排序算法的总结与实现
一、算法概述1.1、算法分类1.2、算法复杂度1.3、相关概念二、分类2.1、冒泡排序(Bubble Sort)2.2、选择排序(Selection Sort)2.3、插入排序(Insertion Sort)2.4、希尔排序(Shell Sort)2.5、归并排序(Merge Sort)2.6、快速排序(Quick Sort)2.7、堆排序(Heap Sort...原创 2018-07-16 17:17:23 · 651 阅读 · 0 评论 -
《算法图解》整理笔记
一,第一章 算法简介1.2 二分查找 二分查找是一种算法,其输入是一个有序的元素列表(必须有序的原因稍后解释)。如果要查找的元素包含在列表中,二分查找返回其位置;否则返回null。 使用二分查找时,每次都排除一半的数字。 一般而言,对于包含n个元素的列表,用二分查找最多需要log2n步,而简单查找最多需要n步。仅当列表是有序的时候,二分查找才管用。 二分法代码实现:def ...原创 2018-07-04 20:37:23 · 20377 阅读 · 2 评论 -
机器学习十大算法之一:决策树
1-1 基本流程一、概念:决策树:是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果,本质是一颗由多个判断节点组成的树。二、划分依据:①熵物理学上,熵 Entropy 是“混乱” 程度的量度。 系统越有序,熵值越低;系统越混乱或者分散,熵值越高 信息理论: 1、当系统的有序状态一致时,数据越集中...原创 2018-07-05 09:01:08 · 553 阅读 · 0 评论 -
机器学习十大算法之一:K-means算法
K-means算法 (无监督算法,聚类算法)1-1 基本流程一、概念:二、主要特点:三、算法流程:kmeans作用:去除奇异值小结:1-2 算法效果衡量标准一、K值确定:二、轮廓系数:三、Canopy算法配合初始聚类:1、Canopy简介:2、Canopy+Kmeans:四、Calinski-Harabasz Index:K-me...原创 2018-07-05 16:17:37 · 1457 阅读 · 0 评论 -
机器学习十大算法之一:KNN
1-1 机器学习算法分类一、基本分类:①监督学习(Supervised learning)数据集中的每个样本有相应的“正确答案”, 根据这些样本做出 预测, 分有两类: 回归问题和分类问题。 步骤1: 数据集的创建和分类 步骤2: 训练 步骤3: 验证 步骤4: 使用 ( 1) 回归问题举例 例如: 预测房价, 根据样本集拟合出一条连续曲线。 ( 2) ...原创 2018-07-05 16:21:59 · 655 阅读 · 0 评论 -
图像分类器:基于opencv、随机森林、逻辑回归算法实现
图像分类器:基于opencv、随机森林、逻辑回归算法实现 ~~~~~~~~本文介绍了什么是图像分类以及图像分类的过程,介绍了图像分类的关键操作、opencv的使用、图像的三种颜色空间:RGB转载 2018-07-05 16:52:21 · 13968 阅读 · 15 评论 -
机器学习入门:特征工程与数据降维
机器学习入门:特征工程与数据降维1 为什么要进行数据预处理1.1 数据清洗1.1.1 数据清洗常见问题a. 缺失值处理b. 噪声数据处理c. 异常值处理d. 脏数据处理e. 去重处理f. ETL - extract、transform、loadg. 离群点与噪声 &...原创 2018-07-05 17:12:57 · 1118 阅读 · 0 评论 -
机器学习十大算法之一:朴素贝叶斯Bayes
机器学习十大算法之一:朴素贝叶斯Bayes1 课题导入1.1 贝叶斯公式 P(A∪B)=P(A)+P(B)−P(A∩B)P(A∪B)=P(A)+P(B)−P(A∩B)P(A \cup B) = P(A) + P(B) - P(A \cap B) P(AB)=P(A|B)P(B)=P(B|A)P(A)P(AB)=P(A|B)P(B)=P(B|A)P(A)P(AB) = P(A...原创 2018-07-05 19:52:55 · 865 阅读 · 1 评论