算法研究
文章平均质量分 73
gao8658
这个作者很懒,什么都没留下…
展开
-
深度学习-增强学习概览
(1) DQN与DDPG离散状态:DQN是一个面向离散控制的算法,即输出的动作是离散的。对应到Atari 游戏中,只需要几个离散的键盘或手柄按键进行控制。然而在实际中,控制问题则是连续的,高维的,比如一个具有6个关节的机械臂,每个关节的角度输出是连续值,假设范围是0°~360°,归一化后为(-1,1)。若把每个关节角取值范围离散化,比如精度到0.01,则一个关节有200个取值,那么6个...原创 2018-07-20 11:06:48 · 1361 阅读 · 0 评论 -
机器学习-决策树算法
1 决策树决策树是一种能解决分类或回归问题的机器学习算法。其有良好的扩展性,可以产生多种变种。并且结合模型融合方法扩展新的算法AdaBoost,GBDT等算法。 参考文章:C4.5算法详解(非常仔细):https://blog.csdn.net/zjsghww/article/details/51638126解释很详细:http://www.saedsayad.com/...原创 2018-08-10 10:45:46 · 2589 阅读 · 0 评论 -
机器学习-Bias-Variance
对Bias和Variance的来源的解释Bias:来源于训练集中没有的,测试集中存在的data产生的。Variance:来源于训练集里有的,但是测试集里没有的,且不应该属于ground truth的data(这里其实有个假设:就是test data认为是没有噪音的,完全是ground truth)。三个值h相当于模型对训练集不含有variance的数据进行拟合产生的最...原创 2018-08-01 17:30:29 · 759 阅读 · 0 评论 -
机器学习-Python自然语言处理库
自然语言处理的库非常多,下面列举一些对Python友好,简单易用,轻量,功能又全的库。1 中文中文自然语言处理工具评测:https://github.com/mylovelybaby/chinese-nlp-toolkit-testawesome: https://github.com/crownpku/Awesome-Chinese-NLPHanlp地址:https://git...原创 2018-08-06 17:31:54 · 930 阅读 · 0 评论 -
NLP-词和文档向量化方法
0 为什么要向量化?向量化文本就可以将一些文本处理问题转换为机器学习问题:0.1 机器学习问题:文本分类,文本聚类,情感分析等,输入到seq2seq等模型需要数字化的词的表示形式。0.2 文本、关键词检索问题(算相似度):关键词搜索,文档检索等计算机去理解文本的语义核心在于通过词和上下文统计词的分布去表示文本,或通过几何的视角通过词上下文去找到词在空间中的几何表示(深度学习方法)。...原创 2018-08-06 17:25:02 · 5867 阅读 · 0 评论 -
机器学习-向量检索+存储格式技术
(1) 向量相似性检索算向量相似度在很多算法中都有应用,对大规模服务来说,如何加速向量检索与相似度计算是非常有价值的。应用场景:1 机器学习算法内部步骤:KNN, K-means2 向量相似搜索:图像检索,word关键词检索 下面列出了其中的一些方式和方法:两个问题:- 1 检索-相似向量检索:引用自:http://www.flickering.cn/a...原创 2018-08-03 12:06:52 · 4373 阅读 · 0 评论 -
深度学习-问题模型优化
技术是随着问题而产生的,如果不从要解决问题的角度出发应用技术,最终会演化为技术堆砌,并由于每个技术点的副作用进而引起新的问题。以问题驱动的方式总结常用的模型训练方法和这些训练方法要解决的问题。这些训练方法一般在论文中都能找到这些较为常用的配置,将分为两个部分,一个部分是CNN,一个部分是RNN。共性的部分一般放在CNN部分.1 CNN1.1 weight decay解决问题:...原创 2018-08-17 17:00:45 · 1579 阅读 · 0 评论 -
深度学习-物体检测概览
1 物体检测任务输入:图像输出:Bounding Box(回归任务):矩形边界框框出物体位置物体类别(分类任务):判断矩形框内的物体类别2 物体检测评测指标2.1 Top1%和Top5%正确率参考:https://stats.stackexchange.com/questions/156471/imagenet-what-is-top-1-and-top-5-error...原创 2018-07-19 18:03:20 · 2838 阅读 · 3 评论 -
机器学习-机器学习常见算法时间复杂度
有了算法复杂度的估计,才有了整个算法更好的优化头绪和方向。1. KNN时间复杂度o(n*k):n为样本数量,k为单个样本特征的维度。如果不考虑特征维度的粒度为o(n)空间复杂度o(n*k):n为样本数量,k为单个样本特征的维度。如果不考虑特征维度的粒度为o(n)参考:https://blog.csdn.net/saltriver/article/details/52502253...原创 2018-07-18 17:08:51 · 21605 阅读 · 2 评论 -
机器学习-损失函数
1似然函数(参数取值可能性最大)em算法中,估计参数的可能性大小2误差平方和(表征整体误差最小)线性回归的最小二乘法中,参数估计3准确率(返回结果的正确率,占的比例),召回率(返回正确结果的数量大小)查询返回的正确信息中4置信度(规则的在前置条件下的条件概率),支持度(项集占总体的大小,是否频繁)统计频繁项和关联规则5信息熵(描述整个信息集合需要的信息量大小,越大越占空间)决策树,进行划分的评判6...原创 2013-11-17 15:39:09 · 1273 阅读 · 0 评论 -
机器学习-相似度计算
在很多机器学习算法和任务中,经常需要度量两个样本或向量之间的距离或相似度,下面列出一些常见的度量方式及其应用:1.常见的距离算法 1.1欧几里得距离(Euclidean Distance)基本上就是两个点的空间距离,下面这个图就能很明显的说明他和余弦相似度区别,欧式距离更多考虑的是空间中两条直线的距离,而余弦相似度关心的是空间夹角。 1.2曼哈顿距离(Manhattan Dis...原创 2013-11-17 12:06:26 · 2283 阅读 · 0 评论 -
深度学习-经典CNN网络
以下是经典的卷积神经网络结构的总结,从中我们可以了解到整个CNN的发展趋势和进化方向。LeNet:较早的深度神经网络结构。 AlexNet:相比LeNet,网络更深。使用了堆叠卷积层来做特征提取,通常是一个卷积层之后连接一个MaxPooling层,形成网络结构。 GoogLeNet:减少参数数量,最后一层用Max Pooling层代替了全连接层,同时引入Inception-v4模块的使用。...原创 2018-03-28 17:51:23 · 2302 阅读 · 0 评论 -
深度学习-深度学习开源框架汇总
随着深度学习如火如荼的发展,越来越多的深度学习框架开始涌现出来,群雄逐鹿,鹿死谁手还未确定,基于现有团队的技术沉淀和应用场景的需求,进行框架选择是较为稳妥的方案。1. TensorFlowTensorFlow是Google推出的深度学习框架,Tensorflow让用户可以快速设计深度学习网络,将底层细节进行抽象,而不用耗费大量时间编写底层CUDA或C++代码。官网链接:https://www.te...原创 2013-08-17 07:55:22 · 1421 阅读 · 0 评论 -
深度学习-深度学习开源框架汇总
随着深度学习如火如荼的发展,越来越多的深度学习框架开始涌现出来,群雄逐鹿,鹿死谁手还未确定,基于现有团队的技术沉淀和应用场景的需求,进行框架选择是较为稳妥的方案。1. TensorFlowTensorFlow是Google推出的深度学习框架,Tensorflow让用户可以快速设计深度学习网络,将底层细节进行抽象,而不用耗费大量时间编写底层CUDA或C++代码。官网链接:https://www.te...原创 2018-03-28 18:03:28 · 1821 阅读 · 0 评论 -
大数据系统-图数据分析
图数据分析技术流派:用于联机事务图的持久化技术(通常直接实时地从应用程序中访问)。这类技术被称为图数据库,它们和“通常的”关系型数据库世界中的联机事务处理(Online Transactional Processing,OLTP)数据库是一样的。(Traversal Based Online Queries)用于离线图分析的技术(通常都是按照一系列步骤执行)。也就是常见的图机器学习技术。...原创 2013-11-17 15:23:16 · 2309 阅读 · 0 评论 -
机器学习-Spark MLlib
MLlib是一些常用的机器学习算法和库在Spark平台上的实现。MLlib是AMPLab的在研机器学习项目MLBase的底层组件。MLBase是一个机器学习平台,MLI是一个接口层,提供很多结构,MLlib是底层算法实现层。 MLlib中包含分类与回归、聚类、协同过滤、数据降维组件以及底层的优化库。MLlib组件图通过这幅图读者可以对MLlib的整体组件和依赖库有一个宏观的把握。下面...原创 2013-11-17 12:18:32 · 1328 阅读 · 0 评论 -
机器学习-KNN算法
(1) KNN算法解决什么问题?KNN是一种机器学习算法,可以解决下面问题:分类问题 回归问题 离群点检测 (2) KNN算法流程计算测试数据与每个训练数据之间的距离; 按照距离的由小到大进行排序; 选取距离最小的K个点; 确定前K个点所在类别的出现频率;(回归问题求K个点的均值) 返回前K个点中出现频率最高的类别作为测试数据的预测分类。(3) KNN算法实现...原创 2018-07-16 17:07:10 · 630 阅读 · 0 评论 -
深度学习-End to End自动驾驶
下面内容从端到端的自动驾驶的方案看相关技术脉络: 1988年,ALVINN: An Autonomous Land Vehicle In a Neural Network 已经有人开始尝试使用End-to-End。但局限于30×32像素,还没有CNN,这样也能在简单道路上实现自动驾驶。方案:采用全连接神经网络,输入viedo和laser range finder作为输入。...原创 2018-07-18 13:51:12 · 3868 阅读 · 0 评论