自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 资源 (10)
  • 收藏
  • 关注

原创 线程池理解

一、为什么要使用线程池?        多线程技术主要解决处理器单元内多个线程执行的问题,它可以显著减少处理器单元的闲置时间,增加处理器单元的吞吐能力。但我们知道线程和创建和销毁的开销很大,所以为了提高效率的一个手段就是尽可能减少创建和销毁对象的次数,然后对这些对象重复使用,而不是频繁的创建和销毁。假设一个服务器完成一个任务所需时间为:T1创建线程时间,T2在线程中执行任务时间,T3线程销毁时

2016-08-31 22:14:11 474

转载 MatLab2012b/MatLab2013b分类器大全(svm,knn,随机森林等)

转自文章MatLab2012b/MatLab2013b分类器大全(svm,knn,随机森林等)train_data是训练特征数据, train_label是分类标签。Predict_label是预测的标签。MatLab训练数据, 得到语义标签向量 Scores(概率输出)。1.逻辑回归(多项式MultiNomial logistic Regression)Fac

2016-08-30 14:57:19 513

原创 Yarn---统一资源管理系统

YARN (Yet Another Resource Negotiator另一种资源协调者)Apache Hadoop Yarn是 Hadoop MRv2计算机框架中构建的一个独立的、通用的资源管理系统,可为上层应用提供统一的资源管理和调度,它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。一、Yarn的出现背景        由于MRv1在扩展性、可靠性、资源利用率和多

2016-08-29 16:47:43 6901

原创 Hadoop1.0与Hadoop2.0的区别

学习时遇到这个问题,这里总结一下:一、从Hadoop整体框架来说        Hadoop1.0即第一代Hadoop,由分布式存储系统HDFS和分布式计算框架MapReduce组成,其中HDFS由一个NameNode和多个DateNode组成,MapReduce由一个JobTracker和多个TaskTracker组成。        Hadoop2.0即第二代Hadoop为克服Ha

2016-08-29 15:45:47 22055

原创 设计模式之观察者模式

一、详细介绍        观察者模式(有时又被称为发布(publish )-订阅(Subscribe)模式、模型-视图(View)模式、源-收听者(Listener)模式或从属者模式)是软件设计模式的一种。在此种模式中,一个目标物件管理所有相依于它的观察者物件,并且在它本身的状态改变时主动发出通知。        观察者模式(Observer)完美的将观察者和被观察的对象分离开。举个例子

2016-08-26 16:23:51 796

原创 Java中abstract与interface的区别

抽象类(Abstract class):含有abstract修饰符的class即为抽象类。(1)abstract class不能创建实例对象;(2)含有abstract方法的类必须定义为abstract class,但abstract class类中的方法不必是抽象的;(3)abstract类中定义的抽象方法必须在具体子类中实现,所以不能有抽象的构造方法和抽象的静态方法;【解析

2016-08-26 11:15:06 2298

原创 设计模式之工厂模式

工厂模式是用来创建对象的设计模式,工厂模式又分为简单工厂模式、工厂模式和抽象工厂模式三种,下面依次介绍一、简单工厂模式1、介绍        简单工厂模式是最简单的一种。专门定义一个类来负责创建其他类的实例,被创建的实例通常都具有共同的父类,这称为静态工厂方法模式,属于类的创建型模式。其实质是由一个工厂类根据传入的参数,动态决定应该创建哪一个产品类的实例,并且这些产品类继承自一个父类或

2016-08-25 10:48:21 513

原创 GitHub使用过程中add出错

在使用过程中,由于先上传一个文件时,突然想删除上传文件的部分, 于是就Ctrl+C中断了传输,然后再次上传就遇到了“fatal: Unable to create 'F:/Git/MovieLens-RecSys/.git/index.lock': File exists.If no other git process is currently running, this probab

2016-08-22 08:56:14 596

原创 基于用户的协同过滤算法的电影推荐系统

上一篇讲解了推荐算法的分类,这里电影推荐系统具体分析一下第一步:建立用户电影矩阵模型        如表1所示,协同过滤算法的输入数据通常表示为一个m*n的用户评价矩阵Matrix,m是用户数,n是电影数,Matrix[ij]表示第i个用户对第j个电影的评价:第二步:发现兴趣相似的用户        这一阶段,主要完成对目标用户最近邻居的查找,通过计算目标用户与其他用户

2016-08-21 16:54:02 48291 32

原创 推荐算法介绍

随着计算机领域技术的高速发展,电子商务时代的普及,个性化的推荐系统深入生活应用的各个方面。个性化推荐算法是推荐系统中最核心的技术,在很大程度上决定了电子商务推荐系统性能的优劣。而协同过滤推荐是个性化推荐系统应用最为广泛的技术,协同过滤推荐主要分为基于用户的协同过滤推荐、基于项目的协同过滤推荐和基于模型的协同过滤推荐。一、根据目标用户推荐 1、大众行为的推荐引擎:基于系统所

2016-08-21 16:21:26 18765 3

原创 Tachyon---基于内存的分布式存储系统

Tachyon是一个以内存为核心的开源分布式存储系统,也是目前发展最迅速的开源大数据项目之一。Tachyon为不同的大数据计算框架(如Apache Spark,Hadoop MapReduce, Apache Flink等)提供可靠的内存级的数据共享服务。此外,Tachyon还能够整合众多现有的存储系统(如Amazon S3, Apache HDFS, RedHat GlusterFS, Op

2016-08-19 17:19:07 5622

原创 进程与线程的区别及相应的通信方法

进程和线程的区别?一、定义进程:从操作系统的角度来说进程是具有一定独立功能的程序关于某个数据集合上的一次运行活动,是系统进行资源分配和调度的一个独立单位;从并发编程来说是并发执行程序在执行过程中分配和管理资源的基本单位。线程:是进程的一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位。线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器

2016-08-18 22:18:21 1743

原创 烧香问题

题意描述:有两根不均匀分布的香,每根香烧完的时间是一个小时,请用两根香确定一段15分钟的时间解题分析:由于香分布不均匀,所以直接确定是不可能的。容易想到的方法是从香两端开始点燃,但这样只能确定一段30分钟的时间,另一根香如何燃烧呢?一根香燃烧总时间是60分钟,可以用另一根香先帮其确定30分钟,然后再把另一根香的两头都点燃,则此时再燃烧完就正好是15分钟了;具体步骤如下:(1)点燃第

2016-08-17 16:39:59 2446

原创 海盗分金问题

题意描述:5个海盗分100个金子,他们依次提出一个方案,如果有一半或以上的人同意就通过,如果没有通过则提议的人就被丢到海里,再继续分金。海盗首先希望生存,然后希望获得最大利益,假如你是第一个海盗你会怎么提议方案?解题分析:对海盗编号A、B、C、D、和E,如果第一个海盗提出自己拿全部则肯定会被扔进海里,所以他必须分给其他人一些,但如何以分出去最少的金子获得最大的收益呢?好像没有头绪,但可以换一个

2016-08-17 16:05:46 2362

原创 3个开关与3盏灯的问题

题意描述:有两个房间,一间房间中有3盏灯,另一间房间有3盏类的开关,两房间是分割开的。现要求是分别进这两房间一次,然后判断出哪个类对应哪个开关?(提示:每个房间只能进一次;白炽灯效果会更好)解题分析:两个房间隔离,也就是说从一个房间完全看不到另一个房间信息,所以利用灯泡亮度判断对应关系不可取;而根据费电程度来区别也是没有多大意义的;因此便想到通过温度进行区分,具体做法如下:因为每个房间只能

2016-08-17 15:42:26 2869

原创 将容积为10的液体利用3、7容器均分成两份

题意描述:有3个容器,分别是3、7和10体积,容器没有刻度。10体积的容器中装满某种液体,3、7容器是空的,没有其他工具,现在请把这种液体平均分成精确的两份解题分析:这类题目是一个智力题目,因为容器没有刻度,所以要想精确分成两份,必须利用3个容器的固有容量进行反复倒换,也就是说每次倒入或倒出都必须能够知道具体是多少。则最少需要以下10步:3(V)7(V)10

2016-08-17 15:15:08 2294

原创 约瑟夫环的问题---最后剩下哪一个

题意描述:0,1,……,n-1这n个数字排成一个圆圈,从数字0开始每次从这个圆圈里面删除第m个数字。求这个圆圈中最后剩下的一个数字解题思路一:模拟一个环,然后每次删除第m个数字解题思路二:上述思路可行,但明显时间复杂度O(mn)。因此还是希望找找删除数字有什么规律。        递归公式:  0  ,                 n = 1

2016-08-16 10:10:04 2682

原创 计算字符串的相似度

题意描述:给定任意两个字符串,写出一个算法计算它们的相似度许多程序会大量使用字符串,对于不同的字符串,我们希望能够有办法判断其相似程度。定义下列操作方法使得两个不同的字符串变得相同:(1)修改一个字符(如把‘a’改为‘b’);(2)增加一个字符(如把‘abdd’变为‘aebdd’);(3)删除一个字符(如把‘travelling’变为‘traveling’);比如,对于‘a

2016-08-16 09:45:28 725

原创 获取当前时间的下一天时间

题意描述:程序实现获取当前时间的下一天的时间解题思路:最暴力的解法就是首先获得当前时间的年月日时分秒信息,然后依次再day+1得到后面一天的时间;如果day+1是月底,则month+1;如果month+1是年底,则year+1;然后还要判断每个月的天数、是否是闰年等问题,会发现一个简单的问题会变得异常复杂于是就想到Java中的Date类来处理日期格式,通过它获得日期信息,而Date类的底层

2016-08-16 09:32:38 2701

原创 TCP可靠传输、流量控制、拥塞控制小结

一、TCP可靠传输我们都知道TCP可靠传输以保证数据包不会丢失、失序、重复,主要用到以下三点技术:1、滑动窗口,以字节为单位。正面以A、B通信为例讲解:        发送窗口:表示在没有收到B确认的情况下,A可以连续发送的字节数。凡是已发送但没有收到确认的必须保留在窗口内,以便超时重传使用。        发送窗口的大小由窗口前沿和后沿共同确定,其变化可能有两种情况:(1)不动【

2016-08-04 21:41:30 1236

原创 Java连接数据库小结

一、JDBC介绍JDBC(Java DataBase Connectivity,Java数据库连接)是一种用于执行SQL语句的JavaAPI,可以为多种关系数据库提供统一访问,它由一组用Java语言编写的类和接口组成。JDBC为开发人员提供了一标准的API,据此可以构建更高级的工具和接口,使数据库开发人员能够用纯Java的API编写数据库应用程序。JDBC由两部分组成,第一部分是供程序

2016-08-01 12:00:41 3202

计算机网络第五版

计算机网络第五版

2016-08-20

Redis设计与实现

Redis设计与实现

2016-08-20

Java_TCPIP_Socket编程

Java_TCPIP_Socket编程

2016-07-06

中国计算机学会推荐国际刊物会议列表(数据库数据挖掘与内容检索)

2016-06-20

GroupLens_MovieLens数据集

数据集简介如下:(上传空间有限,这里我只传了一个最新的2016/1的数据集,如果有需要的话到官网下载吧http://grouplens.org/datasets/movielens/) MovieLens 100K Dataset Stable benchmark dataset. 100,000 ratings from 1000 users on 1700 movies. Released 4/1998. MovieLens 1M Dataset Stable benchmark dataset. 1 million ratings from 6000 users on 4000 movies. Released 2/2003. MovieLens 10M Dataset Stable benchmark dataset. 10 million ratings and 100,000 tag applications applied to 10,000 movies by 72,000 users. Released 1/2009. MovieLens 20M Dataset Stable benchmark dataset. 20 million ratings and 465,000 tag applications applied to 27,000 movies by 138,000 users. Released 4/2015. MovieLens Latest Datasets Small: 100,000 ratings and 6,100 tag applications applied to 10,000 movies by 700 users. Last updated 1/2016. Full: 22,000,000 ratings and 580,000 tag applications applied to 33,000 movies by 240,000 users. Last updated 1/2016. MovieLens Tag Genome Dataset 11 million computed tag-movie relevance scores from a pool of 1,100 tags applied to 10,000 movies.

2016-01-14

Spark学习资料

EECS-2014-12,Spark作者的论文

2015-08-14

Hadoop平台搭建步骤

Hadoop平台搭建步骤,这份文档里面详细的讲述了平台的搭建步骤

2014-03-29

spring in action 中文版 后五章

spring in action 中文版 后五章,里面详细描述了spring,提供编程者查阅API

2014-03-29

Visual C++

Visual C++ 面向对象编程教程王育坚

2013-11-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除