博客专栏  >  云计算/大数据   >  算法设计与数据分析

算法设计与数据分析

剖析经典算法,设计算法解决实际问题,将数据分析进行到底!

关注
3 已关注
15篇博文
  • 5 分钟带你弄懂 k-means 聚类

    聚类与分类的区别分类:类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类的数据进行分类。属于监督学习。聚类:事先不知道数据会分为几类,通过聚类分析将数据聚合成几个群体。...

    2017-11-08 16:16
    206
  • 对比欧氏距离与余弦相似度

    欧式距离欧氏距离就是我们平常所说的距离,如果是平面上的两个点 A(x1,y1)A(x_1,y_1) 和 B(x2,y2)B(x_2,y_2) ,那么 A 与 B 的欧式距离就是 (x1−x2)2+(y...

    2017-11-07 16:48
    290
  • 如何通俗易懂地理解皮尔逊相关系数?

    要理解 Pearson 相关系数,首先要理解协方差(Covariance)。协方差表示两个变量 X,Y 间相互关系的数字特征,其计算公式为:COV(X,Y)=1n−1∑n1(Xi−X⎯⎯⎯)(Yi−Y...

    2017-11-06 11:45
    189
  • 常用的数量统计量的计算及统计意义

    数量统计量是只适合数量类型数据的统计量,使我们最常见的统计量。笔者之前对资料特征数的计算作了简单地介绍,详情可跳转至 资料特征数的计算,本片博客力求全面和简洁易懂。对于数量类型的数据样本 X1,X2,...

    2017-11-02 20:20
    110
  • 常用的数据标准化方法

    数据的标准化(normalization)是将数据按照一定规则缩放,使之落入一个小的特定区间。这样去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。其中最典型的...

    2016-06-13 14:46
    12175
  • 资料特征数的计算

    变量的分布具有两个明显的特征:集中性和离散型。为了反映变量分布的这两个基本性质,必须计算它们的特征数。反映集中性的特征数是平均数,其中应用最普遍的是算术平均数。反映离散性的特征数为变异数,其中最为常用...

    2016-02-29 15:36
    669
  • 粒子群算法解决函数优化问题

    1 选题描述 粒子群算法(particle swarm optimization,PSO)是计算智能领域,除了蚁群算法、鱼群算法之外的一种群体智能地优化算法。该算法最早由Kennedy和Eberhar...

    2015-07-03 13:35
    7362
  • 最长上升子序列

    描述 题目描述    Redraiment是走梅花桩的高手。Redraiment总是起点不限,从前到后,往高的桩子走,但走的步数最多,不知道为什么?你能替Redraiment研究他最多走的步数吗...

    2015-08-01 16:35
    345
  • 算法设计与分析

    多种算法求解非线性方程 1.内容分析 1.1非线性方程介绍 非线性方程,就是因变量与自变量之间的关系不是线性的关系,这类方程很多,例如平方关系、对数关系、指数关系、三角函数关系等等。求解此类方程往往很...

    2015-07-25 10:46
    1190
  • 将真分数分解为埃及分数

    描述 分子为1的分数称为埃及分数。现输入一个真分数(分子比分母小的分数,叫做真分数),请将该分数分解为埃及分数。如:8/11 = 1/2+1/5+1/55+1/110。 接口说明 /* 功能: 将分...

    2015-07-30 17:11
    945
  • 最大连续bit数

    描述 功能: 求一个byte数字对应的二进制数字中1的最大连续数,例如3的二进制为00000011,最大连续2个1    输入: 一个byte型的数字    输出: 无     返回: 对应的二进制...

    2015-08-04 11:12
    378
  • 提取不重复的整数(桶排序思想)

    描述 输入一个int型整数,按照从右向左的阅读顺序,返回一个不含重复数字的新的整数。 知识点 数组 运行时间限制 10M 内存限制 128 输入 输入一个int型整数 输出 按...

    2015-08-30 16:55
    836
  • 《Going Deeper With Convolution》全文译解

    最近和组员在一起准备一个专业英语论文的演讲,选择了2014年发表在CVPR上的一篇非常著名的论文——《Going Deeper With Convolution》。所以和组员一起把这篇论文翻译了一下,...

    2017-04-21 18:12
    331
  • 过拟合与欠拟合简要总结

    在做深度学习实验时,有时候会出现实现结果令人寻味的现象,例如训练处的模型在训练集上的效果很好,而在测试集上效果较差等等。过拟合当某个模型过度的学习训练数据中的细节和噪音,以至于模型在新的数据上表现很差...

    2017-06-08 21:49
    1166
  • 中位数、众数和均值的关系

    中位数、众数和均值都是描述数据集中趋势的统计量,他们各有特点。例如,对于某种商品的各种售价,中位数处在中间的价格,大于和小于中位数的价格各为一半;众数为众多价格中出现频数最多的那个价格;而均值在大部分...

    2016-01-23 16:35
    2349

开发工具
1969404
Linux
1435483
IOS开发
7748263
img博客搬家
img撰写博客
img发布 Chat
img专家申请
img意见反馈
img返回顶部