算法
文章平均质量分 79
翱翔的江鸟
转行萌新学习中
github地址:https://github.com/wxfghy
展开
-
算法基础知识之分类和聚类
《白话大数据与机器学习》笔记分类1. 朴素贝叶斯朴素贝叶斯提供了一种思维方式,即通过先验概率换算得到后验概率从而对决策分类的方法 已知条件: 类条件概率密度参数表达式先验概率基础公式: 参数说明: 样本空间划分为D1~Di共i个部分P表示括号内事件发生的概率等式左边表示当事件x发生时Dj发生的概率应用公式: 参数说明: P(A),事件A的先验概率...原创 2018-07-06 11:22:04 · 948 阅读 · 0 评论 -
Java基本算法的实现代码
0. 一些简单的解释选择排序选择[1:-1]数组中的最小值,与索引0交换数值选择余下[2:-1]数组中的最小值,与索引1交换数值依次遍历余下部分的数组,直到交换所有数值冒泡排序只检查相邻两个元素的大小,按升序交换位置为避免最后阶段的无效比较,加入布尔值判断是否有数据进行了交换,无交换直接跳出循环结束排序为避免每次比较都要遍历全部数组,加入索引规定每次遍历的索引...原创 2018-07-18 15:14:56 · 2037 阅读 · 0 评论 -
Numpy基本用法
1. 创建数组ndarrayndarray是N维数组对象, 快速而灵活的大数据集容器其中所有元素的数据类型必须是相同的ndarray包括shape属性(各维度大小的元组)和dtype属性(数组数据类型) ndarray创建函数 特点 array 支持列表,元组,数组或其他序列类型,可推断也可指定dtype arange 相当于range,返回n...原创 2018-06-26 16:58:55 · 1840 阅读 · 0 评论 -
《机器学习实战》笔记01~学习算法前的准备
1.机器学习算法的用途监督学习 算法 用途 K-临近算法 线性回归 朴素贝叶斯算法 局部加权线性回归 支持向量机 Ridge回归 决策树 Lasso最小回归系数估计- 无监督学习 算法 用途 K-均值 最大期望算法 DBSCAN Parzen窗设计2.选择算法的依...原创 2018-05-10 13:58:58 · 169 阅读 · 0 评论 -
《机器学习实战》笔记02~K-近邻(KNN)算法(分类)
1.K-近邻算法的优缺点采用测量特征值间的距离的方法进行分类优点在于,精度高,无数据输入假定,对异常值不敏感缺点在于,计算复杂度和空间复杂度高适用于数值型,标称型2.KNN工作原理存在训练样本集,样本集中每个数据都有标签及所属分类新数据输入时,选择样本数据集中前k个(通常k不大于20)距离最近(最相似)的数据统计k个数据中的分类数量,选择次数最多的分类分配给新数据...原创 2018-05-10 17:20:00 · 331 阅读 · 0 评论 -
算法基本名词解释
欧氏距离 适用环境: 用于描述两个多维点之间的距离曼哈顿距离 适用环境: 用于描述两个多维点之间的距离,比欧氏距离计算更加方便且消除开方后取近视值带来的误差高斯分布(正态分布) 参数说明: 1. exp是e^的意思,即e的指数,e约等于2.72 2. 极值为x=μ时,y=1/(√(2π)σ) 3. μ越大,函数曲线中轴越偏右 4. σ越大,函数曲线坡度越平...原创 2018-05-10 17:30:13 · 5169 阅读 · 0 评论 -
《机器学习实战》笔记03~决策树算法
1.决策树的优缺点优点: 计算复杂度不高,结果易理解,对中间值缺失不敏感,可处理不相关的特征数据缺点: 过度匹配适用: 数值型,标称型原创 2018-05-21 16:20:54 · 273 阅读 · 0 评论 -
算法理论基础笔记
降维目标减少输入的数目剔除噪声数据提高已有算法的性能,减少计算开销1. PCA按照数据方差最大方向调整数据的主成分分析法2. SVD矩阵分解技术的一种,奇异值分解法1. 主成分分析法(PCA)旋转坐标轴 第一个坐标轴是数据最大方差所在的方向第二个坐标轴与第一个坐标轴正交,方差次大重复旋转坐标轴,次数为数据中特征数量旋转次数越多,所得...原创 2018-07-25 16:45:38 · 1094 阅读 · 0 评论