算法
静静七分醉
该动手的年龄别只动脑
展开
-
机器学习是个啥
目录相关概念阐述什么是机器学习机器学习的应用机器学习算法概述强化学习(RL)相关概念阐述数据挖掘:data mining,如何从海量数据中挖掘出有用的信息来。机器学习:machine learning,目标是归纳一个x->y的函数(映射),来做分类、聚类或者回归的工作。数据挖掘的工作是通过机器学习提供的算法工具实现的,深度学习:deep learnin...原创 2019-06-27 16:52:46 · 373 阅读 · 0 评论 -
十大经典排序算法
目录1. 分类2. 算法复杂度3.各个排序详解冒泡排序(Bubble Sort)算法描述选择排序(Selection Sort)工作原理算法描述插入排序(Insertion Sort)工作原理算法描述希尔排序(Shell Sort)原理算法描述归并排序(Merge Sort)原理算法描述快速排序(Quick Sort)基...转载 2019-08-05 20:54:01 · 411 阅读 · 0 评论 -
逻辑回归 — Sigmoid函数 —预测是否出现过交通事故
目录1. 数据的种类2. Sigmoid函数3. 案列 :预测是否会发送交通事故4. 总结逻辑回归模型是离散数据(二次分布)1. 数据的种类连续性数据:给定一个区间,可以取区间内任意一实数——工资(连续)离散型数据:给定一个区间,只能取区间有限的实数值——性别(男女)正太线性模型(基于正太分布,连续分布),只能对连续性数据响应,不能对离散的数据响应。2. S...原创 2019-08-07 21:49:01 · 8318 阅读 · 0 评论 -
教室调度问题—贪婪算法—要求尽可能多的将课程安排在某间教室,如何安排?——结束时间最早的课,动态规划——背包问题——贪心算法
问题描述 课程 开始时间 结束时间 美术 9:00 10:00 英语 9:30 10:30 数学 10:00 11:00 计算机 ...原创 2019-08-02 21:06:50 · 2833 阅读 · 0 评论 -
回归模型的自我理解
目录最小二乘法背景故事原理及推导过程一元线性回归模型多元线性回归模型逐步回归多重共线性多重共线性和最小二乘法岭回归(RR)LASSO回归最小角回归广义线性回归模型逻辑回归模型回归:数据有“回归到平均数的趋势”回归分析研究因变量和自变量的关系(完全确定关系,有一定关系但无法确定,这是我们研究的主题)最小二乘法最小二乘法(又称最小平...原创 2019-06-28 21:23:06 · 2700 阅读 · 0 评论 -
数据容错机制之纠删码——Erasure code
数据容错机制: 1.复本冗余机制:比如HDFS的文件多副本机制, 优点:恢复效率,占用带宽较少,几乎不消耗cpu资源 缺点:磁盘利用率低,3个复本策略,利用率:33.3% 2.纠删码(Erasure code ,):用于数据恢复,而且可以提高集群磁盘利用率(原始数据+校验数据)(hadoop3.0底层适用,冷数据-指不怎么用的数据) 思想:通过引入数据...原创 2019-08-08 19:07:01 · 3877 阅读 · 0 评论 -
信息检索技术 全文检索 倒排索引
目录概述搜索方法顺序扫描法索引与全文检索全文检索原理比较两种方法如何创建索引概述全文检索主要对非结构化数据的数据检索。非结构化数据另外一种叫法叫:全文数据。搜索方法顺序扫描法顺序扫描法:比如要找内容包含某一个字符串的文件,就是一个文档一个文档的看,对于每一个文档,从头看到尾,如果此文档包含此字符串,则此文档为我们要找的文件,接着看下一个文件,直到扫描...原创 2019-07-18 21:10:27 · 1820 阅读 · 1 评论 -
垃圾(GC)回收机制及算法以及配置调优
目录概述1.产生垃圾的地方2.垃圾回收过程3.内存1.如何判断一个对象是否可以被回收?1.1引用计数法1.2可达性分析算法2.垃圾收集算法2.1 标记-清除算法(Mark-Sweep)2.2 复制算法(Copying)2.3 标记-整理算法(Mark-Compact)——老生代2.4 分代收集算法(GenerationalCollecti...原创 2019-07-19 19:10:36 · 1606 阅读 · 0 评论 -
贝叶斯算法 — 朴素贝叶斯分类器— 过滤垃圾邮件 — 流失用户 — 用户画像
目录应用1. 胃疼胃癌2. 过滤垃圾邮件朴素贝叶斯分类器概念介绍朴素贝叶斯分类器原理贝叶斯分类器的应用公式求得是后验概率,等式右侧为先验概率贝叶斯定理本质:通过 先验概率 求后验概率应用1. 胃疼胃癌假设:H代表胃癌事件,X代表胃疼事件。则P(H | X)表示的是:当一个人胃疼时,是胃癌的概率有多少? P(H | X)称为后验概率,我们利...原创 2019-08-05 20:56:29 · 12728 阅读 · 3 评论 -
推荐系统模型(基于用户推荐,基于物品推荐,推荐冷启动问题)——ALS算法——相似度的计算
目录1. 概述1.1 协同过滤1.2 相似度的计算1.3 ALS算法2. 代码实践2.1 案列1:综合2.2案列2:基于用户的推荐2.3 模型存储与加载2.3.1 存储2.3.2 加载2.4 案列3:基于物品推荐3. 推荐系统的冷启动问题① 用户冷启动② 系统冷启动 ③ 物品冷启动1. 概述买了一个手机,再次刷新会出现类似的产...原创 2019-07-24 21:25:57 · 5942 阅读 · 1 评论