![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
算法设计
转角_遇到你
软件开发领域的专家
展开
-
Naive Bayes算法(NB算法---朴素贝叶斯)
贝叶斯分类器的分类原理是通过某对象的先验概率,利用贝叶斯公式计算出其后验概率,即该对象属于某一类的概率,选择具有最大后验概率的类作为该对象所属的类。目前研究较多的贝叶斯分类器主要有四种,分别是:Naive Bayes、TAN、BAN和GBN。应用贝叶斯网络分类器进行分类主要分成两阶段。第一阶段是贝叶斯网络分类器的学习,即从样本数据中构造分类器,包括结构学习和CPT 学习;第二阶段是贝叶斯网络分类器原创 2016-09-26 15:02:42 · 2304 阅读 · 0 评论 -
Superior Scheduler学习心得 原创
1、组件介绍:图1-整体系统架构和组件的位置Yarn和Superir scheduler是为了和Hadoop DRM系统一起工作而专门设计的,类似于Yarn现有的开源Fair scheduler和Capacity scheduler,Superior Scheduler遵循着Yarn Scheduler的插件接口,与Yarn RM组件一起原创 2016-11-16 09:45:22 · 2187 阅读 · 1 评论 -
如何成为一名数据科学家?
"Data Science = statistics who uses python and lives in San Francisco"恰好我马上启程到 Twitter 的 data science team,而且恰巧懂一点点统计和住在旧金山,所以冲动地没有邀请就厚脸回答了:D我认为有几个大方面1)学好 python。现在几乎所以公司的数据都可以 api 给你,而 py转载 2016-10-20 14:02:22 · 281 阅读 · 0 评论 -
归并排序
归并排序是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。转载 2016-10-26 16:35:54 · 357 阅读 · 0 评论 -
快速排序
快速排序由于排序效率在同为O(N*logN)的几种排序方法中效率较高,因此经常被采用,再加上快速排序思想----分治法也确实实用,因此很多软件公司的笔试面试,包括像腾讯,微软等知名IT公司都喜欢考这个,还有大大小的程序方面的考试如软考,考研中也常常出现快速排序的身影。 总的说来,要直接默写出快速排序还是有一定难度的,因为本人就自己的理解对快速排序作了下白话解释,希望对大家理解有帮转载 2016-10-26 09:40:46 · 235 阅读 · 0 评论 -
数据结构的C实现_图_邻接表示
//图,用邻接表表示//编译环境:Dev C++5.11//ALGragh.c#include #include #define ERROR 0#define OK 1#define MAX_VERTEX_NUM 10#define QM 10 //队列的最大元素个数int visited[MAX_VERTEX_NUM];typedef char转载 2016-10-24 15:45:37 · 445 阅读 · 0 评论 -
SparkR:数据科学家的新利器
摘要:R是数据科学家中最流行的编程语言和环境之一,在Spark中加入对R的支持是社区中较受关注的话题。作为增强Spark对数据科学家群体吸引力的最新举措,最近发布的Spark 1.4版本在现有的Scala/Java/Python API之外增加了R API(SparkR)。SparkR使得熟悉R的用户可以在Spark的分布式计算平台基础上结合R本身强大的统计分析功能和丰富的第三方扩展包,对大规模数转载 2016-10-12 14:09:32 · 466 阅读 · 0 评论 -
K-means使用python进行实现
这里举了一个例子使用python来进行k-means的聚类。原创 2016-09-26 17:03:52 · 746 阅读 · 0 评论 -
聚类、K-Means、例子、细
聚类今天说聚类,但是必须要先理解聚类和分类的区别,很多业务人员在日常分析时候不是很严谨,混为一谈,其实二者有本质的区别。分类其实是从特定的数据中挖掘模式,作出判断的过程。比如Gmail邮箱里有垃圾邮件分类器,一开始的时候可能什么都不过滤,在日常使用过程中,我人工对于每一封邮件点选“垃圾”或“不是垃圾”,过一段时间,Gmail就体现出一定的智能,能够自动过滤掉一些垃圾邮件了。这是因为在点选的转载 2016-09-18 11:12:00 · 7603 阅读 · 0 评论 -
快速排序算法
快速排序最初是由Tony Hoare设计的,其最坏情况下的时间复杂度为O(n^2),即逆序的情况下,但是现实中这种情况比较少见,所以是一种很有效的排序算法,其平均时间复杂度为O(n*logn)。而且快排是一个不稳定的排序算法。转载 2016-09-18 11:00:31 · 394 阅读 · 0 评论 -
朴素贝叶斯分类器的应用
朴素贝叶斯分类器的应用生活中很多场合需要用到分类,比如新闻分类、病人分类等等。本文介绍朴素贝叶斯分类器(Naive Bayes classifier),它是一种简单有效的常用分类算法。一、病人分类的例子让我从一个例子开始讲起,你会看到贝叶斯分类器很好懂,一点都不难。某个医院早上收了六个门诊病人,如下表。 症状转载 2016-12-30 15:17:07 · 669 阅读 · 0 评论