自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 资源 (1)
  • 收藏
  • 关注

原创 RNN-资料记录

网上找了好多资料看,主要是参考了“deep learning” 这本书。图片粘贴不过来,就全部截图了.......解决Long term问题LSTM理解lstm:中文版:http://www.jianshu.com/p/9dc9f41f0b29 英文版  http://col

2016-07-02 23:52:32 495

转载 spark优化

转载:http://blog.cloudera.com/blog/2015/03/how-to-tune-your-apache-spark-jobs-part-1/http://blog.cloudera.com/blog/2015/03/how-to-tune-your-apache-spark-jobs-part-2/Avoid reduceByK

2015-12-28 16:22:28 538

转载 spark mapPartition方法与map方法的区别 以及 join的用法

转载:http://wanshi.iteye.com/blog/2183906 rdd的mapPartitions是map的一个变种,它们都可进行分区的并行处理。    两者的主要区别是调用的粒度不一样:map的输入变换函数是应用于RDD中每个元素,而mapPartitions的输入函数是应用于每个分区。    假设一个rdd有10个元素,分成3个分区。如果使用map方法,

2015-09-14 10:31:51 13641

转载 特征选择[转载,翻译]

问题描述:进行模型训练时,特征数据必不可少,但是特征数量、特征质量如何,对模型效果起着十分关键的作用。有时候特征维度很高但是有很多特征对模型效果提升是无益的,甚至在有的模型中特征之间还会进行干扰。此时特征选择是十分必要的,通过特征选择选取最优特征子集能达到提高模型训练速率和模型效果的目的。特征选择流程:进行特征选择时,需要生成特征子集,确定好评价函数(模型效果是否变优),停止准则(什么

2015-08-26 14:25:22 785

原创 不平衡分类问题处理方法

问题描述:工作中处理分类问题时,很多情况是多个分类类别的数据分布不平衡,有的类别的数据量可能远小于其他类别。并且在实验中发现,进行分类模型训练时,各类别的数据比例不同对最终模型分类效果的影响很大。解决方法:对于这类问题,主要从数据和学习两个角度进行处理。训练集大小,类优先级,误分代价几个重要影响因素需要重点处理。从数据角度:训练集重采样,训练集划分;从学习算法角度:分类器集成,

2015-08-21 11:24:04 1627

原创 matlab积累

matlab中矩阵用法:1.反斜杠:如果a,b均为常数,则a\b=b/a如果A,B为矩阵,则A\B=A的逆*B即A\B的结果为一个向量,为方程组Ax=B的解。

2015-05-24 17:37:29 465

原创 python知识积累

python sorted:http://gaopenghigh.iteye.com/blog/1483864

2015-05-17 22:26:24 361

原创 theano卷积神经网络-场景

theano卷积神经网络用于图片的场景分类研究

2015-05-17 00:06:03 597

原创 推荐

学校创新项目做的推荐系统,主要参考文献为巩亮的推荐系统书。主要利用用户的用户行为,用户标签以及对资源进行动态分类,虽然有很多不足,但自认为还是有些特点的,考虑得比较细致了。主题思路:根据用户的兴趣模板,用户的历史记录来给用户做针对性的资源推荐。并且能够根据用户的信息反向动态调整资源分类。下面是算法的具体实现:1          首先我们将用户分为新用户和老用户,因为新用户会遇

2015-04-12 11:41:40 556

原创 MacOS 安装 convnet的几个问题

1. 类似fatal error: 'jpeglib.h' file not found或者 X11/Xlib.h找不到这种文件找不到的问题。  原因:该文件引入路径不对,可能是电脑上不存在这类文件,更多可能是该类文件指向不对。   解决方法:此时一般需要先找出该文件所在位置,然后再建立相应的映射,如软链接ln -s XXX XXX这种做法2.编译convnet时,报uint没定义这种

2015-04-04 20:38:10 2998

原创 C++实现小根堆

#include#includeusing namespace std;/**堆排序算法适用于海量元素,时间复杂度为O(nlog(n)),辅助空间也只需O(1);*有大根堆和小根堆两种,大根堆根节点比两子节点大;小根堆相反。*此例说明的是小根堆*/template void swap(const T &a ,const T &b){ T t; t=a;

2014-04-20 00:01:23 5580

原创 C++,希尔排序

#includeusing namespace std;/**希尔排序也是缩小增量排序,其时间复杂度较插入排序要好,因为在最后进行插入排序之前已经基本有序了;*插入排序的时间复杂度为O(n^2),而希尔排序能缩小到O(n^3/2)*///template //模版传递指针和数组需注意//void shell_sort(const *arr(T),const T &n,c

2014-04-18 23:39:54 536

原创 C++实现快速排序

#include#includeusing namespace std;/**冒泡排序算法平均时间复杂度为O(nlog(n)),最坏情况O(n^2)*/template void swap(const T &m,const T &n){T temp;temp=m;m=n;n=temp;}int part(vector &Sort,int a,in

2014-04-18 21:53:25 424

原创 C++实现冒泡排序

#includeusing namespace std;templatevoid swap(const T &m,const T &n){T temp;temp=m;m=n;n=temp;}int main(int argc,char *argv[]){int n,i,j;//,*Sortcin>>n;//Sort=(int*)malloc(size

2014-04-18 20:58:56 705

北邮计算机复试资料

bupt复试资料,有人工智能PDF,编译原理PPT,软件工程PPT,数据库PPT,体系结构课件

2019-03-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除