自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(80)
  • 收藏
  • 关注

原创 Scala01入门

第1章 可伸展的语言Scala应用范围广,从编写脚本,到建立大型系统。运行在标准Java平台上,与Java库无缝交互。更能发挥力量的地方:建立大型系统或可重用控件的架构。将面向对象和函数式编程加入到静态类型语言。在Scala中,函数就是对象。函数类型是能够被子类继承的类。Scala是纯粹的面向对象语言:每个值都是对象,每个操作都是方法调用。如1+1,实际是调用I

2017-02-25 14:53:49 397

原创 数据结构08查找

第九章查找另一种在实际应用中大量使用的数据结构--查找表。所谓查找,即为在一个含有众多的数据元素的查找表中找出某个“特定的”数据元素。查找表 search table是由同一类型的数据元素构成的集合。集合中的数据元素之间存在着完全松散的关系,故查找表非常灵便。对查找表经常进行的操作:>查询某个元素是否在查找表中;>检索某个元素的各种属性;>插入>删除

2017-02-24 09:20:32 487

原创 数据结构07排序

第十章内部排序10.1 概述排序就是把一组数据按关键字的大小有规律地排列。经过排序的数据更易于查找。 排序前Ki=Kj,且Ki在前:排序方法是稳定的,若排序后Ki在前;排序方法是不稳定的,如排序后Kj在前。 分类:内部排序:排序过程在内存中进行;外部排序:待排序记录的数量很大,内存一次不能容纳全部记录,需要对外存进行访问。 内部排序每一种方法

2017-02-23 20:48:14 354

原创 数据结构06树和二叉树

第六章树和二叉树6.1 树的定义和基本术语树 Tree 是n个结点的有限集。任意一棵非空树中:(1)有且仅有一个特定的称为根(root)的结点;(2)当n>1时,其余结点可分为m(m>0)个互不相交的有限集T1,T2,...,Tm,其中,每一个集合本身又是一棵树,并且称为根的子树(SubTree)。结点:包含一个数据元素及若干指向其子树的分支。结点的度(de

2017-02-23 16:34:48 484

原创 数据结构05数组和广义表

第五章 数组 和 广义表数组和广义表可以看成是线性表在下述含义上的扩展:表中的数据元素本身也是一个数据结构。5.1 数组的定义n维数组中每个元素都受着n个关系的约束,每个元素都有一个直接后继元素。可以把二维数组看成是这样一个定长线性表:它的每个数据元素也是一个定长线性表。数组一旦定义,它的维数和维界就不再改变。因此,除了结构的初始化和销毁之外,数组只能有存取元素和修改

2017-02-23 15:45:56 611

原创 数据结构04串

第四章 串STL:string http://blog.csdn.net/weixin_37289816/article/details/54716009计算机上非数值处理的对象基本上是字符串数据。在不同类型的应用中,字符串具有不同的特点,要有效的实现字符串的处理,必须选用合适的存储结构。4.1 串类型的定义串 String由零个或多个字符组成的有限序列。s

2017-02-23 14:59:50 498

原创 数据结构03栈和队列

第三章栈和队列STL栈:stackhttp://blog.csdn.net/weixin_37289816/article/details/54773495队列:queue http://blog.csdn.net/weixin_37289816/article/details/54773581priority_queue http://blog.csdn.net/wei...

2017-02-23 11:02:29 320

原创 数据结构02线性表

第二章 线性表C++中STL顺序表:vector    http://blog.csdn.net/weixin_37289816/article/details/54710677链表:list    http://blog.csdn.net/weixin_37289816/article/details/54773406在数据元素的非空有限集中:(1)存在唯一一个被称作

2017-02-23 10:13:22 260

原创 数据结构01绪论

第一章绪论1.1 什么是数据结构数据结构是一门研究非数值计算的程序设计问题中,计算机的操作对象以及他们之间的关系和操作的学科。面向对象程序=数据结构+算法数据结构是介于数学、计算机硬件、计算机软件三者之间的一门核心课程。数据结构是程序设计、编译、数据库、操作系统的基础。1.2 基本概念和术语数据 data:对客观事物的符号表示,在计算机中是指所有能输入到计算

2017-02-23 10:11:34 316

转载 操作系统05死锁

进程管理4--Deadlock and StarvationConcurrency:Deadlock and Starvation内容提要>产生死锁与饥饿的原因>解决死锁的方法>死锁/同步的经典问题:哲学家进餐问题 Deadlock  系统的一种随机性错误·Permanent blocking of a set of processes that either

2017-02-19 15:40:51 758

转载 操作系统04进程同步与通信

4.1 进程间的相互作用4.1.1 进程间的联系资源共享关系相互合作关系临界资源应互斥访问。临界区:不论是硬件临界资源,还是软件临界资源,多个进程必须互斥地对它们进行访问。把在每个进程中访问临界资源的那段代码称为临界资源区。显然,若能保证诸进程互斥地进入自己的临界区,便可实现它们对临界资源的互斥访问。为此,每个进程在进入临界区之前,应先对欲访问的临界

2017-02-17 19:37:07 556

转载 操作系统03进程管理Process_Scheduling

2 Process Scheduling>Type of scheduling>Scheduling Criteria (准则)>Scheduling Algorithm>Real-Time Scheduling (嵌入式系统) 2.1 Learning ObjectivesBy the end of this lecture you should be able to

2017-02-17 17:42:05 1664

转载 操作系统02进程管理Process_Description_and_Control

作业的基本概念:用户再一次计算过程中或一次事务处理过程中,要求计算机系统所做的工作的集合。包含多个程序、多个数据、作业控制说明书系统调用时操作系统提供给编程人员的唯一接口。1、文件操作类;2、进程控制类;3、资源申请类;4、进程通信类;5、信息维护类  用户程序和操作系统间传递信息,如获得时间。作业调度算法:先来先服务最短作业优先响应比高

2017-02-17 16:09:38 1269

转载 操作系统01概述

第一章概论《Operating System Internals and Design Principles》《Applied Operating System Concepts》操作系统——裸机上的第一层软件,它是对硬件系统功能的首次扩充,填补人与机器之间的鸿沟。1.1 操作系统与计算机同在1.2 对操作系统的认识 对操作系统的认识有两

2017-02-17 09:50:19 2326

转载 Java07多线程

14 多线程操作系统的多任务(multitasking):在同一时刻运行多个程序的能力。多线程在较低的层次上扩展了多任务的概念:一个程序同时执行多个任务。通常,每一个任务称为一个线程(tread),它是线程控制的简称。可以同时运行一个以上线程的程序称为多线程程序(multithreaded)。 多进程与多线程的区别:线程拥有自己的一整套变量;线程只是共享数据。共享变

2017-02-16 23:34:03 311

转载 机器学习13大规模数据集

大型数据集的学习(Learning With Large Datasets)如果我们有一个低方差的模型, 增加数据集的规模可以帮助你获得更好的结果。 我们应该怎样应对一个有 100 万条记录的训练集? 以线性回归模型为例,每一次梯度下降迭代,我们都需要计算训练集的误差的平方和,如果我们的学习算法需要有 20 次迭代,这便已经是非常大的计算代价。 首先应该做的事是去检查一个这么大规模

2017-02-16 22:35:13 2581

转载 机器学习12推荐系统

推荐系统(Recommender Systems) 推荐系统根据浏览用户过去买过什么书,或过去评价过什么电影来判断并推荐新产品给用户。这些系统会为像亚马逊和网飞这样的公司带来很大一部分收入。因此,对推荐系统性能的改善,将对这些企业的有实质性和直接的影响。对机器学习来说,特征是很重要的,你所选择的特征,将对你学习算法的性能有很大的影响。因此,在机器学习中有一种大思想,它针

2017-02-16 20:09:20 181

原创 主成分分析法 (PCA) 用于数据可视化实验 -- Matlab版

第一步:下载数据集。https://www.csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/multiclass.html#pendigits第二步:改变数据格式。注:此数据集的各特征值均为像素,即属于同一量纲,故无需归一化步骤。原格式为:8 1:88 2:92 3:2 4:99 5:16 6:66 7:94 8:37 9

2017-02-16 11:04:18 4719 1

原创 机器学习11主成分分析

降维(Dimensionality Reduction):动机一:数据压缩(Data Compression)数据压缩不仅允许们压缩数据,因而使用较少的计算机内存或磁盘空间,它还可以加快学习算法。 可以把任何维度的数据降到任何想要的维度, 例如将 1000 维的特征降至 100 维。动机二:数据可视化(Visualization)如果要将这个 50 维的数据可视

2017-02-15 22:57:29 253

转载 机器学习10聚类

无监督学习在非监督学习中,我们需要将一系列无标签的训练数据,输入到一个算法中, 然后让它找这个数据的内在结构。 我们可能需要某种算法帮助我们寻找一种结构。图上的数据看起来可以分成两个分开的点集(称为簇),一个能够找到我圈出的这些点集的算法,就被称为聚类算法。这将是我们介绍的第一个非监督学习算法。 当然, 此后还将提到其他类型的非监督学习算法,它们可以找到其他类型的结

2017-02-15 15:19:09 306

转载 机器学习09支持向量机

支持向量机(Support Vector Machines)在监督学习中,许多学习算法的性能都非常类似,因此,重要的不是你该选择使用学习算法 A 还是学习算法 B,而更重要的是,应用这些算法时,所创建的大量数据在应用这些算法时,表现情况通常依赖于你的水平。比如:你为学习算法所设计的特征量的选择,以及如何选择正则化参数,诸如此类的事。还有一个更加强大的算法广泛的应用于工业界和学术

2017-02-15 08:42:53 251

转载 机器学习08机器学习系统设计

首先要做什么 一个垃圾邮件分类器算法为例:为了解决这样一个问题,首先要做的决定是如何选择并表达特征向量 x。可以选择一个由 100 个最常出现在垃圾邮件中的词所构成的列表,根据这些词是否有在邮件中出现,来获得我们的特征向量(出现为 1,不出现为 0),尺寸为 100×1。 为了构建这个分类器算法,我们可以做很多事,例如: 1. 收集更多的数据,让我们有更多的垃圾

2017-02-14 11:38:23 241

转载 机器学习07应用机器学习的建议

决定下一步做什么(Deciding What to Try Next)确保在设计机器学习系统时,能够选择一条最合适、最正确的道路。具体来讲,将重点关注的问题是:假如你在开发一个机器学习系统,或者想试着改进一个机器学习系统的性能。你应如何决定接下来应该选择哪条道路?1. 获得更多的训练实例——通常有效,但代价较大,下面的方法也可能有效,可考虑先采用下面的几种方法。

2017-02-14 06:55:07 209

转载 机器学习06神经网络--学习

代价函数标记方法:神经网络的训练样本有 m 个每个包含一组输入 x 和一组输出信号 yL 表示神经网络层数Sl表示每层的 neuron 个数(SL 表示输出层神经元个数)将神经网络的分类定义为两种情况:二类分类:SL=1, y=0 or 1 表示哪一类; K 类分类:SL=K, yi = 1 表示分到第 i 类;(K>2)

2017-02-13 23:39:52 323

转载 机器学习05神经网络--表示

神经网络:表示(Neural Networks: Representation)如今的神经网络对于许多应用来说是最先进的技术。对于现代机器学习应用,它是最有效的技术方法。神经网络模型是许多逻辑单元按照不同层级组织起来的网络, 每一层的输出变量都是下一层的输入变量。下图为一个 3 层的神经网络:第一层为输入层(Input Layer)

2017-02-12 22:40:50 211

转载 机器学习04正则化

正则化(Regularization)过拟合问题(Overfitting):如果有非常多的特征,通过学习得到的假设可能能够非常好地适应训练集 :代价函数可能几乎为 0),但是可能会不能推广到新的数据。第一个模型是一个线性模型,欠拟合,不能很好地适应我们的训练集;第三个模型是一个四次方的模型,过于强调拟合原始数据,而丢失了算法的本质:预测新数据。我们可以看

2017-02-12 19:36:17 201

转载 机器学习03Logistic回归

逻辑回归 (Logistic Regression)目前最流行,使用最广泛的一种学习算法。分类问题,要预测的变量 y 是离散的值。逻辑回归算法的性质是:它的输出值永远在 0 到 1 之间。逻辑回归模型的假设是:其中:X 代表特征向量g 代表logistic function,是一个常用的Sigmoid function。S

2017-02-12 16:19:09 200

转载 机器学习02线性回归、多项式回归、正规方程

单变量线性回归(Linear Regression with One Variable)预测器表达式:选择合适的参数(parameters)θ0 和 θ1,其决定了直线相对于训练集的准确程度。建模误差(modeling error):训练集中,模型预测值与实际值之间的差距。目标:选出使建模误差平方和最小的模型参数,即损失函数最小。

2017-02-12 11:51:09 865

转载 机器学习01简介

Machine Learning 是人工智能的核心,主要使用归纳、综合而不是演绎。让计算机模拟人类行为,以获取新的知识或技能重新组织已有的知识结构使之不断改善自身性能一个程序能从经验 E 中学习,解决任务 T,达到性能度量值P,有了经验 E 后,经过 P 评判,程序在处理 T 时的性能有所提升。主题:1、监督学习:回归、支持向量机、核函数、神经网络2

2017-02-12 11:46:58 213

转载 Storm教程3编程接口

SpoutsSpout是Stream的消息产生源,Spout组件的实现可以通过继承BaseRichSpout类或者其他Spout类来完成,也可以通过实现IRichSpout接口来实现。需要根据情况实现Spout类中重要的几个方法有:open方法当一个Task被初始化的时候会调用此open方法。一般都会在此方法中对发送Tuple的对象SpoutOutput

2017-02-11 18:00:07 294

转载 Storm教程2安装部署

Storm 安装部署部署Storm集群需要依次完成的安装步骤:        1.安装jdk6及以上版本;  2. 搭建Zookeeper集群;  3. 安装Storm依赖库;  4. 下载并解压Storm发布版本;  5. 修改storm.yaml配置文件;  6. 启动Storm各个后台进程。———————————————————————————————

2017-02-11 17:34:49 369

转载 Storm教程1理论介绍

流式计算的历史:    早在7、8年前诸如UC伯克利、斯坦福等大学就开始了对流式数据处理的研究,但是由于更多的关注于金融行业的业务场景或者互联网流量监控的业务场景,以及当时互联网数据场景的限制,造成了研究多是基于对传统数据库处理的流式化,对流式框架本身的研究偏少。目前这样的研究逐渐没有了声音,工业界更多的精力转向了实时数据库。    2010年Yahoo!对S4的开源,2011年twi

2017-02-11 16:08:56 348

转载 9 文件系统管理

9.1 回顾分区和文件系统分区类型主分区:总共最多只能分四个扩展分区:只能有一个,主分区加扩展分区最多有四个,必须再划分成逻辑分区才能使用。逻辑分区:在扩展分区中划分的    IDE硬盘最多支持59个逻辑分区    SCSI硬盘最多支持11个逻辑分区 ————————————————————————————————————————————————— 分区

2017-02-11 00:19:41 223

转载 Java06集合

13 集合实现方法时,不同的数据结构会导致性能有很大差异。 13.1 集合接口Java集合类库将接口(interface)与实现(implementation)分离。可以使用接口类型存放集合的应用,一旦改变了想法,可以轻松额使用另外一种不同的实现。List l = new ArrayList若想改为链表实现,只需上句为List l = new LinkedList 

2017-02-09 23:33:34 175

转载 8 权限管理

8.1 ACL权限8.1.1 简介与开启用于解决身份不够用的问题ACL(access control list)  访问控制表 ACL是存在于计算机中的一张表,它使操作系统明白每个用户对特定系统对象,例如文件目录或单个文件的存取权限。这张表对于每个系统用户有拥有一个访问权限。最一般的访问权限包括读文件(包括所有目录中的文件),写一个或多个文件和执行一个文件(如果它是一个可执

2017-02-09 23:11:22 195

转载 7 用户和用户组

7.1 用户配置文件7.1.1 用户信息文件 /etc/passwdman 5 passwd  查看配置文件功能第1字段: 用户名称第2字段: 密码标志 X代表有密码 如果用户没有密码,则只允许本地登录第3字段: UID(用户ID)           0     超级用户           1-499 系统用户(伪用户) 绝对不能删          

2017-02-09 22:56:10 155

转载 观察者模式

发布-订阅(Publish/Subscribe)模式定义了一种一对多的依赖关系,让多个观察者对象同时监听某一个主体对象。这个主体对象在状态发生变化时,会通知所有观察者对象,使它们能够自动更新自己。//Subject类,抽象通知者,用抽象类或接口实现,保存所有观察者的引用,提供增加、删除观察者的接口。abstract class Subject{ pr

2017-02-09 17:20:30 125

转载 Java05泛型

12 泛型12.1 为什么使用泛型泛型程序设计(Generic programming):意味着编写的代码可以被很多不同类型的对象所重用。类型参数(type parameters)通配符类型(wildcard type) 可以将Manager添加到ArrayList中,但不能把Employee添加到ArrayList中。 12.2 定义简单泛型类一个泛型类(Generi

2017-02-08 10:53:03 153

转载 Java04异常、断言、日志和调试

11 异常、断言、日志和调试异常处理(exception handing)使用断言来启动检测Java日志框架调试技巧11.1 处理错误如果一个方法不能够采用正常的途径完成任务,就通过另外一个路径退出方法。在这种情况下,方法不返回任何值,而是抛出一个封装了错误信息的对象。此外,调用这个方法的代码也将无法继续执行。异常处理机制开始搜索能够处理这种异常情况的异常处理器(e

2017-02-07 18:10:17 241

转载 Java03接口与内部类

6 接口与内部类接口 interface对象克隆 内部类 inner class代理 proxy 6.1 接口public interface Comparable{ int compareTo(T other);}Arrays.sort(Object[] a) 利用的是mergesort 接口也可以被扩展public interfa

2017-02-07 16:01:42 199

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除