自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (6)
  • 收藏
  • 关注

原创 one-hot&TF&TF-IDF

矩阵A(m x n)的含义:m:文章数n:单词数A[i][j]=2代表在文章i里单词j出现了2次。one-hot矩阵:矩阵中,用1代表该单词在该文章中存在,用0表示不存在。TF矩阵:在每一行上,向量的每一个值标志对应的词语出现次数归一化后的频率。比如:TF-IDF矩阵:首先计算IDF向量文章总数为m,对于某个单词,统计出它在j篇文章中出现过,则IDFj=log(...

2018-07-26 21:42:38 326

原创 局部加权线性回归时间序列预测

华为软件精英挑战赛2018题目。训练集样本x是日期序列(简略成自然数序列),x=[1,2,3,4,...,n]虚拟机数量序列(按天累计)y=[y1,y2,...,yn]在一般的线性回归中,只需要拟合一个参数θ,即可用y(n+1)=θ*(n+1)预测出下一天的虚拟机数量。而局部线性回归中,给每一个点赋予一定的权重,赋予权值的准则是距离待预测点越近则权值越大。具体是使用公式:...

2018-07-26 21:12:36 1917

原创 如何上传文件到github上

登录github网页,新建一个repository[rɪˈpɒzətri] (仓库),随后得到这个页面:发现,找了个遍也没能找到上传文件的按钮,只能乖乖的使用git上传,基本按照图中指示语句来操作:(需要事先安装好git)(1)在想要上传的文件夹目录内点击鼠标右键,点击“Git Bash Here”,打开git命令行。(2)输入 git init(3)输入   git ad...

2018-07-26 17:12:15 126

原创 合法的出栈队列

题目名称 : 队列重排(数据结构)时间限制 : 1000 ms空间限制 : 32 MB问题给定一个队列,如,1,2,3, 其中1是队头,问能否通过一个栈得到新的队列,如得到2,3,1 是可以的,得到3,2,1也是可以的,但是得到3,1,2是不可能的。输入第一行是一个整数n,表示队列的元素(整数)个数, 下一行是由n个不同元素构成的初始队列(第一个是队头),再下一行是一个整数...

2018-07-24 21:30:22 667

原创 Prim最小生成树问题

Description某个小岛的族长遇到了一个问题。多年以前一大笔国外援助资金花在了建筑村庄间的大批道路上,但是多年以来森林侵蚀了很多道路,因此维护如此巨大的道路网络过于昂贵。族长必须停止维护一些道路。当然,通过剩余还在维护的道路,各个村庄之间互相连通,尽管路程不像以前那样短了。族长必须决定在连通所有村庄的条件下,每月花费的最少维护费用。村庄以大写英文字母编号(从A开始)。你的任务是写一个程序...

2018-07-23 23:33:28 797

原创 最短路径问题Dijkstra算法

Description给你n个点,m条无向边,每条边都有长度d和花费p,给你起点s终点t,要求输出起点到终点的最短距离及其花费,如果最短距离有多条路线,则输出花费最少的。Input Format输入n,m,点的编号是1~n,然后是m行,每行4个数 a,b,d,p,表示a和b之间有一条边,且其长度为d,花费为p。最后一行是两个数 s,t;起点s,终点t。(1<n<=100...

2018-07-23 21:58:02 391

原创 leetcode 从前序与中序遍历序列构造二叉树

根据一棵树的前序遍历与中序遍历构造二叉树。注意:你可以假设树中没有重复的元素。例如,给出前序遍历 preorder =[3,9,20,15,7]中序遍历 inorder = [9,3,15,20,7]返回如下的二叉树: 3 / \ 9 20 / \ 15 7/** * Definition for a binary tr...

2018-07-22 12:54:15 673

原创 2018华为软件精英挑战赛-模拟退火算法

2018年的华为软件精英挑战赛题目简介:给出华为云虚拟机过去的租借数量历史数据,用以训练模型并预测下一个时间段里的虚拟机租借数量,然后把这些预测得到的虚拟机装填进一定规格的物理机中,即分为预测和装填两个部分。 总结一下装填部分使用的模拟退火算法:算法原理装填的基础算法是FF(首次适应算法),而虚拟机的序列会影响FF算法的装填效果。比较明显的是FFD把序列降序之后再使用FF算法往往效...

2018-07-20 23:21:15 1149

CCV下载方法.txt

Columbia Consumer Video (CCV) Database --- A Benchmark for Consumer Video Analysis 我原本是用youtube-dl来直接在youtube下载的,结果youtube限制访问量,最后又另求别人要来的资源。资源内含下载链接和下载方法。数据集压缩包共30G Recognizing visual content in unconstrained videos has become a very important problem for many applications. Existing corpora for video analysis lack scale and/or content diversity, and thus limited the needed progress in this critical area. To stimulate innovative research on this challenging issue, we constructed a new database called CCV, containing 9,317 YouTube videos over 20 semantic categories. The database was collected with extra care to ensure relevance to consumer's interest and originality of video content without post-editing. Such videos typically have very little textual annotation and thus can benefit from the development of automatic content analysis techniques.

2019-08-31

C++矩阵运算模块

矩阵运算模块包括矩阵相加、相减、相乘、转置、求逆、数乘、求行列式等。资源共有三个文件:Demo.cpp、Matrix.cpp和Matrix.h,其中Demo里有使用例子,可直接运行。

2018-04-09

《机器学习实战》pdf及所附python代码和数据集文件

本书第一部分主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法,如k近邻算法、朴素贝叶斯算法、Logistic回归算法、支持向量机、AdaBoost集成方法、基于树的回归算法和分类回归树(CART)算法等。第三部分则重点介绍无监督学习及其一些主要算法:k均值聚类算法、Apriori算法、FP-Growth算法。第四部分介绍了机器学习算法的一些附属工具。

2018-04-06

逻辑回归算法C++代码及实验数据文件

logistic/sigmoid函数作用:把取值范围从负无穷到正无穷的公式计算结果,压缩到0和1之间,这样的输出值表达为“可能性”更直观。 逻辑回归算法用于估计预测目标的可能性,它属于软分类算法,即最终得到的是一个具体的概率,而不仅仅是“是”或“不是”这样的二分类结果;

2018-04-02

决策树代码及实验数据文件

决策树是一个通过训练的数据来搭建起的树结构模型,根节点中存储着所有数据集和特征集,当前节点的每个分支是该节点在相应的特征值上的表现,而叶子节点存放的结果则是决策结果。通过这个模型,我们可以高效的对于未知的数据进行归纳分类。每次使用决策树时,是将测试样本从根节点开始,选择特征分支一直向下直至到达叶子节点,然后得到叶子节点的决策结果。

2018-04-02

云计算MapReduce实现KNN算法

云计算MapReduce实现KNN算法,使用环境:在vmware虚拟机上安装unbuntu14系统,系统中安装hadoop。文件中包含有MapReduce以及KNN的java代码、包含训练数据的excel表格以及详细的教程文档,文档中手把手教到如何使用代码和文件

2018-04-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除