算法
文章平均质量分 61
sofuzi
这个作者很懒,什么都没留下…
展开
-
4种查找算法
一、查找的基本概念查找,也可称检索,是在大量的数据元素中找到某个特定的数据元素而进行的工作。查找是一种操作。 二、顺序查找 说白了就是,从头到尾,一个一个地比,找着相同的就成功,找不到就失败。很明显的缺点就是查找效率低。【适用性】:适用于线性表的顺序存储结构和链式存储结构。平均查找长度=(n+1)/2.时间复杂度为O(n)。 三、折半查找在有序表中,取...转载 2017-12-31 18:10:29 · 371 阅读 · 0 评论 -
动态规划初识(从dfs到dfs优化到动态规划顺推和逆推)
思想:动态规划是通过组合子问题来解决问题的,是用于求解包含重叠子问题的最优化问题的方法。 入门题目:数字三角形题目描述:给出了一个数字三角形。从三角形的顶部到底部有很多条不同路径。对于每条路径,把路径上面的数加起来可以得到一个和,你的任务就是找到最大的和。 注意:路径上的每一步只能从一个数(x,y)走到(x+1,y)或(x+1,y+1)。 如:7...转载 2018-08-18 10:59:41 · 1805 阅读 · 0 评论 -
数据结构---拓扑排序详解
1、拓扑排序的介绍对一个有向无环图(Directed Acyclic Graph简称DAG)G进行拓扑排序,是将G中所有顶点排成一个线性序列,使得图中任意一对顶点u和v,若边(u,v)∈E(G),则u在线性序列中出现在v之前。 拓扑排序对应施工的流程图具有特别重要的作用,它可以决定哪些子工程必须要先执行,哪些子工程要在某些工程执行后才可以执行。为了形象地反映出整个工程中各个子工程(活动)之间...转载 2018-08-12 16:35:33 · 434 阅读 · 0 评论 -
贪心算法经典例题
2019网易提前批题小易有一些立方体,每个立方体的边长为1,他用这些立方体搭了一些塔。现在小易定义:这些塔的不稳定值为它们之中最高的塔与最低的塔的高度差。小易想让这些塔尽量稳定,所以他进行了如下操作:每次从某座塔上取下一块立方体,并把它放到另一座塔上。注意,小易不会把立方体放到它原本的那座塔上,因为他认为这样毫无意义。现在小易想要知道,他进行了不超过k次操作之后,不稳定值最小是多少。...原创 2018-08-14 22:22:50 · 2677 阅读 · 0 评论 -
机器学习算法--逻辑回归原理介绍
转载于:https://blog.csdn.net/chibangyuxun/article/details/53148005一、逻辑回归基本概念1. 什么是逻辑回归逻辑回归就是这样的一个过程:面对一个回归或者分类问题,建立代价函数,然后通过优化方法迭代求解出最优的模型参数,然后测试验证我们这个求解的模型的好坏。Logistic回归虽然名字里带“回归”,但是它实际上是一种分类方法,主要用于两分类问...转载 2018-07-02 11:27:12 · 390 阅读 · 0 评论 -
梯度下降法的三种形式:批量梯度下降法(BGD)、随机梯度下降法(SGD)、小批量梯度下降法(MBGD)
转载于:http://www.360doc.com/content/17/0323/08/1489589_639370019.shtml第四点略转载 2018-07-02 12:24:14 · 668 阅读 · 0 评论 -
三种梯度下降的方式:批量梯度下降、小批量梯度下降、随机梯度下降
转载于:https://blog.csdn.net/uestc_c2_403/article/details/74910107在机器学习领域中,梯度下降的方式有三种,分别是:批量梯度下降法BGD、随机梯度下降法SGD、小批量梯度下降法MBGD,并且都有不同的优缺点。下面我们以线性回归算法(也可以是别的算法,只是损失函数(目标函数)不同而已,它们的导数的不同,做法是一模一样的)为例子来对三种梯度下降...转载 2018-07-02 11:55:05 · 2832 阅读 · 0 评论 -
100亿数据找出最大的1000个数字(top K问题)
在大规模数据处理中,经常会遇到的一类问题:在海量数据中找出出现频率最好的前k个数,或者从海量数据中找出最大的前k个数,这类问题通常被称为top K问题。例如,在搜索引擎中,统计搜索最热门的10个查询词;在歌曲库中统计下载最高的前10首歌等。1、最容易想到的方法是将数据全部排序。该方法并不高效,因为题目的目的是寻找出最大的10000个数即可,而排序却是将所有的元素都排序了,做了很多的无用功。2、局部...原创 2018-06-27 10:51:36 · 16129 阅读 · 8 评论 -
TF-IDF及其算法
概念 TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜寻引擎应用,作为文件与...转载 2018-05-16 18:08:26 · 7777 阅读 · 2 评论 -
利用TFIDF进行实时微博情感分类
一、思路分析先来分析一下思路:本项目所用的语料库是pos.txt和neg.txt两个文件,分别代表pos(积极)和neg(消极)类别,文件中有很多条已经分好类的微博,一整行为一条。 1、计算tftf应该分类别计算。分别计算某个词在每个类别中的tf。这是什么意思呢?我们往下看。某一个词在某种类别的tf=这类文件中这个词出现的次数/这类文件...原创 2018-05-16 18:07:16 · 3534 阅读 · 1 评论 -
用递归实现二叉树的三种遍历
qianxu(Treenode root){//前序遍历 record();//把当前节点值记录下来 qianxu(root.left); qianxu(root.right);}zhongxu(Treenode root){//中序遍历 zhongxu(root.left); record(); zhongxu(root.right);}houxu(Treenode r...原创 2018-05-07 20:55:20 · 353 阅读 · 0 评论 -
二叉树的四种遍历方法
转载于:http://www.cnblogs.com/fly-me/p/wei-ti-jiaoer-cha-shu-de-si-zhong-bian-li-fang-fa.html前序中左右中序左中右后序左右中前序遍历若树为空,则空操作返回。否则,先访问根节点,然后前序遍历左子树,再前序遍历右子树。(W)型 (中 左 右)中序遍历若树为空,则空操作返回。否则,从根节点开始(注意并不是先访问根节点...转载 2018-04-20 21:11:00 · 2197 阅读 · 0 评论 -
朴素贝叶斯分类算法
转载于:http://www.cnblogs.com/ahu-lichang/p/7157855.html1、朴素贝叶斯分类算法原理1.1、概述贝叶斯分类算法是一大类分类算法的总称贝叶斯分类算法以样本可能属于某类的概率来作为分类依据朴素贝叶斯分类算法是贝叶斯分类算法中最简单的一种注:朴素的意思是条件概率独立性P(A|x1x2x3x4)=p(A|x1)*p(A|x2)p(A|x3)p(A|x4)则为...转载 2018-04-06 21:58:01 · 458 阅读 · 0 评论 -
java中常见的几种排序方式
转自:http://blog.csdn.net/yqlakers/article/details/69935673作者:YQlakers之前也学习了几种常见的排序方式,也没有作过总结,这次来对其中几种常见的排序方式进行一次小小对比和总结,作者水平有限,文章中如有错误,望不吝指出。1冒泡排序冒泡排序应该是我们学习C语言开始最先接触的一个排序方式,其排序方式的主要思想为:在要排序的一组数中,对当前还未...转载 2017-12-31 18:03:37 · 334 阅读 · 0 评论 -
java的8种排序
转载:http://www.iteye.com/topic/1129454作者:MrLee23 各种常用排序算法 类别 排序方法 时间复杂度 空间复杂度 稳定性 最好 平均 最坏 辅...转载 2017-12-31 18:06:27 · 284 阅读 · 0 评论 -
深度优先遍历经典例题
牛牛准备参加学校组织的春游, 出发前牛牛准备往背包里装入一些零食, 牛牛的背包容量为w。牛牛家里一共有n袋零食, 第i袋零食体积为v[i]。牛牛想知道在总体积不超过背包容量的情况下,他一共有多少种零食放法(总体积为0也算一种放法)。输入描述:输入包括两行第一行为两个正整数n和w(1 <= n <= 30, 1 <= w <= 2 * 10^9),表示零食的数量和...原创 2018-08-14 01:41:56 · 4785 阅读 · 0 评论