千万级微博语料数据整理

数据说明 整理了千万级的微博数据,可以做各种微博语料分析,字段非常丰富 数据最终是一个json文件,每一行都是一个小的json { "_id": { "$oid": "5a6c0686ac7eef81e560e71...

2018-01-27 14:53:55

阅读数:1484

评论数:0

动态规划

dp问题,关键是寻找到递推关系式。 主要也就是几类核心问题,可统一整理。最长递增子序列从一个整的序列中,取出一个子序列,使其能够保持递增的性质 F(1)=1; F(i) = max{1,F[j]+1|j#include<iostream> #include<cstdio&g...

2017-06-29 12:23:52

阅读数:178

评论数:0

递归

在宏观上把握一件事情 并且明确跳出递归的条件 经典问题:汉诺塔

2017-06-27 21:14:51

阅读数:134

评论数:0

拓扑排序

先判断能否进行拓扑排序,本质就是检查是否存在环 统计入度的情况,将入度为0的,加入队列中。#include<iostream> #include<cstdio> #include<vector> #include<queue> using name...

2017-06-27 15:30:20

阅读数:130

评论数:0

C++ STL

STL是C++中的标准模板库。包括了常见的算法和数据结构。在OJ中广泛使用。本文是对STL的一个整理。排序 头文件< algorithm > 基本用法:sort函数 sort(a,a+n),左闭右开的区间 二分查找 头文件< algorithm > 调用lower_boun...

2017-06-24 16:24:44

阅读数:279

评论数:0

最小生成树(MST)

Kraskal算法1.初始所有节点都独立 2.按照边的权值递增遍历所有的边,若遍历到的边上的两个点,分属在不同的集合,则这条边就是最小生成树上的一条边,并将这两个顶点合并。 3.如果出现集合数量只为1个,说明最小生成树已经构成。如果遍历完所有的边,集合还大于1个,说明原图不连通,最小生成树不存...

2017-04-15 16:13:51

阅读数:202

评论数:0

并查集

集合判断两个点是不是在一个集合里面 检查图中有多少个孤立节点 很多问题都可以抽象为集合问题代码在合并两个树的同时,进行路径压缩。让所有的节点指向根节点。#include <iostream> using namespace std; int Tree[1001]; int N=10...

2017-04-15 13:43:40

阅读数:148

评论数:0

常用的推荐算法小结

推荐系统的必然互联网发展到现阶段,信息已经不是匮乏,而是爆炸。所以良好的用户体验就是把用户喜欢的,感兴趣的从大量的数据中筛选出来,再呈现给用户,实现千人千面的效果。所以推荐系统的出现就是必然了,他可以推荐每个用户感兴趣的产品,同时也将每个产品呈现到感兴趣的用户面前。实现用户和产品的双赢。推荐系统架...

2017-04-11 23:40:34

阅读数:6540

评论数:0

大数类

大数C++中没有大数类,需要手动构造代码#include <iostream> #include <stdio.h> #include <cmath> #include <sstream> #include <stack> #includ...

2017-04-05 23:29:52

阅读数:155

评论数:0

二叉排序树

定义二叉排序树是一棵特殊的二叉树,它是一棵二叉树但同时满足如下条件: 对于树上任意一个结点,其上的数值 必大于等于其左子树上任意结点数值, 必小于等于其右子树上任意结点的数值。中序遍历二叉排序树得到的就是递增的序列二叉排序树的插入1.若当前树为空,则 x 为其根结点。 2.若当前结点大于 ...

2017-04-03 18:25:17

阅读数:247

评论数:0

二叉树

二叉树构建创建节点class Node{ public: char data; Node * left; Node * right; Node(char data){ this->data = data; left = righ...

2017-04-03 17:30:17

阅读数:159

评论数:0

哈夫曼树

哈夫曼树哈夫曼树是带权路径长度WPL(Weighted Path Length)最小的二叉树,也是最优二叉树。哈夫曼树的构造,选出最小的和次小的节点合并权值形成新的节点,再重复。有一个重要结论:最小带权路径长度为非叶子结点的和 求解最小带权路径长度为了方便的得到两个最小的节点,使用优先队列来实现,...

2017-04-02 12:13:57

阅读数:503

评论数:0

栈的使用

堆栈堆栈是一种线性的数据结构,只能在一端插入和删除 先进先出! 在C++中#include <iostream> #include <stack> using namespace std;int main(){ stack<int> s;//定义栈 ...

2017-03-31 17:38:00

阅读数:363

评论数:0

查找

二分查找先排序bool search_key(int key,int n,int *a){ int right,left,middle; right = n-1; left = 0; while (left<=right){ middle = ...

2017-03-22 21:51:11

阅读数:271

评论数:0

考研机试整理

北邮北邮2014年Problem A. 分数加法题目描述 求2-a+2-b,其中a和b均为正整数,结果请用最简分数表示。 输入格式 第一行为测试数据的组数T(1<=T<=400)。请注意,任意两组测试数据之间是相互独立的。 每组测试数据一行,包含两个整数a和b(2<=a,...

2017-02-19 19:26:15

阅读数:1134

评论数:0

搜索问题整理

搜索问题主要就是DFS与BFS,要明确什么情况下用哪一种方法。DFSDFS基本就是全部都遍历一遍,时间高,通过递归实现算法。 一定要考虑剪枝! 采用情况:要输出所有的解,或者通过所有的解要判断是否可能符合题意。 常见的剪枝:路径剪枝,奇偶剪枝 在hdu上的题目包括:1016;1010;BF...

2017-02-10 18:12:43

阅读数:213

评论数:0

动态规划问题整理

刷HDU的OJ,动态规划的问题,其实很多都是由经典的问题演化过来的,特整理一遍。领悟其中的思想,形成编程的固定套路!01背包问题题目描述:有编号分别为a,b,c,d,e的五件物品,它们的重量分别是2,2,6,5,4,它们的价值分别是6,3,5,4,6,现在给你个承重为10的背包,如何让背包里装入的...

2017-02-09 17:38:31

阅读数:178

评论数:0

单源最短路径---Dijkstra算法

基本模型 基本思想:每次找离源点最近的一个顶点,然后以改顶点为中心进行扩展,最终得到源点到其余所有点的最短路径。 具体步骤: 1. 将所有的顶点分为两个部分:已知最短路程的顶点集合P和未知最短路径的顶点集合Q。 2. 设置源点s到自己的最短路径为0,即dis[s]=0。若存在有源点能直接到...

2016-12-19 19:10:03

阅读数:315

评论数:0

Floyd算法求最短路径并记录路径

基本模型从最开始只允许经过1号顶点中转,接下来允许经过1号和2号中转……..允许经过1~n号所有的顶点进行中转,求任意两点间的最短路程。用一句话概括就是:从i号顶点到j号顶点之经过前k号的最短路程。实例 求任意两点之间的最短路径#include <stdio.h> #define I...

2016-12-19 13:11:51

阅读数:4077

评论数:0

图的遍历(DFS&BFS)

基本模型 图的存储使用邻接矩阵的方法 深度优先遍历:沿着图的某一条分支遍历直到末端,然后回溯,再沿着另一条进行同样的遍历,知道所有的顶点都被访问过为止。 广度优先遍历:首先以一个未被访问过的顶点作为起始顶点,访问其所有相邻的顶点,然后对每个相邻的顶点,再访问它们相邻的未被访问的顶点,直到所有的顶点...

2016-12-19 12:20:31

阅读数:322

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭