自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(75)
  • 收藏
  • 关注

转载 纵表和横表的概念及其相互转换

横表就是普通的建表方式,如表结构为:主键、字段1、字段2、字段3...。 如果变成纵表后,则表结构为: 主键、字段代码、字段值。而字段代码则为字段1、字段2、字段3...。  具体为电信行业的例子。以用户帐单表为例,一般出账时用户有很多费用,其数据一般存储为:时间,客户ID,费用科目,费用。这种存储结构一般称为纵表,其特点是行数多,字段少。纵表在使用时由于行数多,统计用户数或对用户进行分档时还需要...

2018-09-26 08:57:45 1126

转载 正则化和归一化

正则化,归一化(标准化和正规化):对数据进行预处理的两种方式,目的是让数据更便于计算和获得更加泛化的结果,但并不改变问题的本质。 正则化:要求一个逻辑回归问题,假设一个函数,覆盖所有可能:y=wx,其中w为参数向量,x为已知样本的向量,用yi表示第i个样本的真实值,用f(xi)表示样本的预测值,从而确定损失函数L(yi,f(xi))=yi−sigmoid(xi)。该损失函数代表一种误差。对...

2018-09-25 22:12:35 2319

原创 ID3决策树

信息熵与信息增益:熵代表信息的混乱程度。一个特征的熵越小,说明这个特征的信息越纯净,价值越大,用总的信息熵减去该特征信息熵的信息增益就越大,越应该在初始的时候作为划分数据集的特征。 实现代码: (环境为Python3.x)from numpy import *from math import logimport operator#创建数据集def createDataS...

2018-08-08 17:35:54 408

原创 k-近邻算法(KNN)

工作原理:存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征醉相思数据(最近邻)的分类标签。一般来说,我们只选择样本数据集中前k个最相似的数据,这就是K-近邻算法中k的出处,通常K是不大于20的整数。最后,选择k个最相似数据中...

2018-08-06 19:10:34 293

转载 原型图、交互设计、UI图的关系

其实一直以来都纳闷,产品经理要做原型图,然后UI设计师要画UI 图,这两个之间貌似有许多重复的地方,而且还是大多时候还是并行进行,实在不知道二者之间的关系是什么,通过查阅资料,做一下总结。做原型是表达自己思路的一种方式,任何岗位都可以制作原型与其他岗位进行工作上的沟通。当然,各个岗位制作的原型的侧重点是不一样的。产品经理和交互设计师所做的原型在衔接的地方难免有一些重复。但是交互设计师所负责的原型制...

2018-04-11 12:09:00 14571

转载 广告营销DSP和DMP概念解释

作者:叶小森链接:https://www.zhihu.com/question/29765723/answer/118133113来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。如果要通俗易懂去讲明DSP和DMP,我会先讲明他们的由来和彼此之间的关系,具体如下:Ad Network:由于碎片化的传播环境导致了网络上出现了N多的中小广告位

2018-01-25 11:08:23 16481

转载 新手怎样做好需求分析师(BA)

在如今经济高速发展日新月异的互联网行业,有种职位叫做需求分析师(business analyst简称BA)。这种职位在互联网行业是比较高大上的,待遇比也码农好,自然能力要求也是非常高的。是专门跟业务把交道,梳理业务规则,把业务需求梳理好传递给开发人员开发的。一个大型的项目会有明细的分工:业务、项目经理、PMO、架构师、BA(需求分析师)、SE(开发)、运维人员。所以BA在项目中起到承上启下的作用,

2017-12-01 17:29:17 16788 1

转载 数据仓库结构设计(星型结构和雪花结构)

在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型。在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织。当所有维表都直接连接到“ 事实表”上时,整个图解就像星星一样,故将该模型称为星型模型, 如图 2 。星型架构是一种非正规化的结构,多维数据集的每一个维度都直接与事实表相连接,不存在渐变维度,所以数据有一定

2017-07-05 11:32:29 1575

转载 linux面试常问命令

1. 绝对路径用什么符号表示?当前目录、上层目录用什么表示?主目录用什么表示? 切换目录用什么命令?绝对路径: 如/etc/init.d当前目录和上层目录: ./ ../主目录: ~/切换目录: cd2. 怎么查看当前进程?怎么执行退出?怎么查看当前路径?查看当前进程: ps执行退出: exit查看当前路径: pwd3

2017-05-25 17:43:59 52817

转载 TCP相关面试题总结

1、TCP三次握手过程  wireshark抓包为:(wireshark会将seq序号和ACK自动显示为相对值)           1)主机A发送标志syn=1,随机产生seq =1234567的数据包到服务器,主机B由syn=1知道,A要求建立连接; 此时状态A为SYN_SENT,B为LISTEN        2)主机B收到请求后要确认连接信息,向A发送ack =

2017-05-24 18:54:02 471

转载 数据库隔离级别详解

一、隔离级别及含义事务隔离级别(transaction isolation levels):隔离级别就是对对事务并发控制的等级。ANSI/ ISO SQL将其分为串行化(SERIALIZABLE)、可重复读(REPEATABLE READ)、读已提交(READ COMMITED)、读未提交(READ UNCOMMITED)四个等级。为了实现隔离级别通常数据库采用锁(Lock)。一般在编程的时候

2017-05-24 18:50:14 488

转载 面试HTTP问题总结

HTTP简介HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网(WWW:World Wide Web )服务器传输超文本到本地浏览器的传送协议。HTTP是一个基于TCP/IP通信协议来传递数据(HTML 文件, 图片文件, 查询结果等)。HTTP是一个属于应用层的面向对象的协议,由于其简捷、快速的方式,适用于分布式超媒体信

2017-05-24 18:47:38 710

转载 BAT面试之操作系统内存详解

本文主要内容:本文讲述操作系统对于内存的管理的过去和现在,以及一些页替换的算法的介绍。进程的简单介绍进程是占有资源的最小单位,这个资源当然包括内存。在现代操作系统中,每个进程所能访问的内存是互相独立的(一些交换区除外)。而进程中的线程所以共享进程所分配的内存空间。在操作系统的角度来看,进程=程序+数据+PCB(进程控制块)。没有内存抽象在早些

2017-04-24 13:48:23 479

原创 处理机调度算法总结

1. 先来先服务调度算法先来先服务(FCFS)调度算法思想:每次调度都是从后背作业队列中选择一个获多个最先进入该队列的作业,将它们调入内存,为他们分配资源、创建进程,然后放入就绪队列。特点:在进程调度中采用FCFS算法时,每次调度是从就绪队列中选择一个最先进入该队列的进程。该进程一直运行到完成或发生某事件而阻塞后才放弃处理机。利弊:适合长作业和CPU繁忙型作业(需要大量的CPU时间

2017-04-23 20:42:40 6424

原创 进程和线程相关知识总结

进程1. 组成结构:由程序段、代码段和进程控制块(PCB)组成。2. 基本属性:1)是一个可以独立拥有资源的独立单位   2)同时又是一个可独立调度和分派的基本单位。3. 三种基本状态:就绪状态、执行状态、阻塞状态。一些系统中还有挂起状态进程控制块(PCB)1. 作用:使一个在多道程序环境下不能独立运行的程序(含数据),称为一个能独立运行的基本单位,一个能与其它进程并发

2017-04-21 22:45:21 514

转载 数据库面试常问的一些基本概念

1、超键、候选键、主键、外键超键:在关系中能唯一标识元组的属性集称为关系模式的超键。一个属性可以为作为一个超键,多个属性组合在一起也可以作为一个超键。超键包含候选键和主键。候选键:是最小超键,即没有冗余元素的超键。主键:数据库表中对储存数据对象予以唯一和完整标识的数据列或属性的组合。一个数据列只能有一个主键,且主键的取值不能缺失,即不能为空值(Null)。外键:在一

2017-04-17 20:48:06 321

转载 深入理解JVM笔记之内存管理机制

运行时数据区域程序计数器每个线程都有一个程序计数器(PC),是当前线程所执行的字节码的行号指示器,通过改变程序计数器的值来选取下一条指令。各线程之间的计数器互不影响,是线程私有的内存。 如果线程执行的是一个JAVA方法,则计数器记录的为正在执行的字节码指令的地址,如果执行的是Natvie方法,这计数器的值为空(Undifined)。 程序计算器所在的内存区域是唯一一个JVM

2017-04-17 19:46:12 367

转载 Hive技术原理解析

什么是Hive?       Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言,称为 HQL,它允许熟悉 SQL 的用户查询数据。同时,这个语言也允许熟悉 MapReduce 开发者的开发自定义的 mapper

2017-04-17 16:07:41 2412

转载 IT 界求职分析

注:本文内容对百度贴吧一篇帖子进行了整理,仅供自己学习参考。贴吧地址:https://tieba.baidu.com/p/3829075619?see_lz=1内容原作者:lolita_处我眼中的IT界offer。。。。。。 综合考虑发展,薪水,环境,压力。 =============================下为该楼主(某巨头猎头公司内部人员)分析的IT

2017-04-12 16:52:05 1750

原创 树的遍历-已知中序+(前序|后序)求(后序|前序)

首先我们先看一下已知前序,中序。求后序遍历的结果。[java] view plain copy print?package com.zjianhao.tree;      /**  * Created by 张建浩(Clarence) on 2016-5-22 21:21.  * the author's website:

2017-04-02 14:47:33 885

原创 给一个二叉树的前序和中序序列,求二叉树的层序序列

题目:给一个二叉树的前序和中序序列,求二叉树的层序序列(2017年去哪儿网春招笔试题)思路:给定前序序列和中序序列,可以唯一构造出一颗二叉树,再利用队列进行层序遍历二叉树即可。关键:一个前序遍历序列和一个中序遍历序列可以确定一颗唯一的二叉树。       根据前序遍历的特点, 知前序序列(PreSequence)的首个元素(PreSequence[0])为二叉树

2017-04-02 14:25:51 1795

转载 Java构建一颗二叉树

转自:http://ocaicai.iteye.com/blog/1047397目录: 1.把一个数组的值赋值给一颗二叉树 2.具体代码 注意:1. 父节点数组下标从0到 n/2 -1 ,但是遍历时要小于n/2-1,因为最后一个父节点可能没有右孩子,当n/2-1为奇数时才有右孩子,为偶数时只有左孩子。2. 结点左孩子下标为2n+1,右孩子下标为2n+2。1.

2017-04-02 13:35:52 12788 2

转载 MyISAM和InnoDB索引引擎的B+树索引实现

1. MyISAM索引实现:1)主键索引:MyISAM引擎使用B+Tree作为索引结构,叶节点的data域存放的是数据记录的地址。下图是MyISAM主键索引的原理图:                                                                           (图myisam1)这里设表一共有三列,

2017-03-31 20:00:15 7854 2

原创 B+树与数据库索引

本文对两篇文章进行了提取总结:http://www.cnblogs.com/heiming/p/5865101.htmlhttp://www.ruzuojun.com/topic/420.html一、innodb存储引擎索引概述:innodb存储引擎支持两种常见的索引:B+树索引和哈希索引。innodb支持哈希索引是自适应的,innodb会根据表的使

2017-03-31 19:41:37 1569

原创 图解B+树并和B-树特点对比总结

摘要: 一,    M阶B+树的定义(M阶是指一个节点最多能拥有的孩子数,M>2): 图1.1 3阶B+树         (1)根结点只有1个,分支数量范围[2,m]。         (2)除根以外的非叶子结点,每个结点包含分支数范围[[m/2],m],其中[m/2]表示取大于m/2的最小整数。一,    M阶B+树的定义(M阶是指一个节点最多能拥有的孩子数,M>2):

2017-03-31 14:09:36 3909

转载 如何线程安全的使用HashMap

进入正题,在周二面试时,一面的面试官有问到 HashMap 是否是线程安全的,如何在线程安全的前提下使用 HashMap,其实也就是HashMap,Hashtable,ConcurrentHashMap 和 synchronized Map 的原理和区别。当时有些紧张只是简单说了下HashMap不是线程安全的;Hashtable 线程安全,但效率低,因为是 Hashtable 是使用 sync

2017-03-30 17:11:54 9242 1

原创 B-树特征及插入删除操作总结

一. B-树特征和基本概念:B-树中所有结点孩子结点个数的最大值是B-树的阶。对于一个 m 阶的B-树(为了查找效率考虑,要求m >= 3):结构要求:1. 根节点至少有2个分支,1个关键字 2. 非根结点至少有 m/2(向上取整)个分支,(m/2) - 1 个关键字。3. 所有结点最多有 m 个分支,m - 1 个关键字。特点:1. 有 n 个分支的结点有 n -

2017-03-30 16:14:30 7852 2

转载 Java包装类、自动装箱与拆箱知识总结

面试题:结果:truetruefalsetrue下文转自:http://blog.csdn.net/zhangliangzi/article/details/50552587因为在学习集合时知道集合里存放的对象都是Object类型,取出的时候需要强制类型转换为目标类型(使用泛型集合不需要),如int a = (Inte

2017-03-29 11:17:49 307

原创 Java 多线程加锁的方式总结及对比

参考博文:http://www.cnblogs.com/handsomeye/p/5999362.html一.Java多线程可以通过:1. synchronized关键字2. Java.util.concurrent包中的lock接口和ReentrantLock实现类这两种方式实现加锁。二.synchronized关键字加锁的缺陷:如果一个代码块被s

2017-03-28 14:27:53 78636 9

原创 java 运算符总面试题总结

题目:请写出下面几个表达式的结果,答案可以用10进制或16进制书写1. 0xaa | 0x552. 15 & 2403. 10 ^ 124. -2 >> 15. -2 >>> 1解答:1. 分析:十六进制数用0x……来表示,后面一个十六进制位是四位,两个十六进制位为一个字节,最多后面可以有8个十六进制位,32个字节,如:0xFFFFFFFF

2017-03-28 11:19:19 3249

转载 Java中普通代码块,构造代码块,静态代码块区别

//执行顺序:(优先级从高到低。)静态代码块>mian方法>构造代码块>构造方法。其中静态代码块只执行一次。构造代码块在每次创建对象是都会执行。1 普通代码块 1 //普通代码块:在方法或语句中出现的{}就称为普通代码块。普通代码块和一般的语句执行顺序由他们在代码中出现的次序决定--“先出现先执行” 2 public class CodeBlock01{ 3

2017-03-26 21:08:35 213

转载 Java多线程生产消费者模式和BlockingQueue同步队列

前言:     在新增的Concurrent包中,BlockingQueue很好的解决了多线程中,如何高效安全“传输”数据的问题。通过这些高效并且线程安全的队列类,为我们快速搭建高质量的多线程程序带来极大的便利。本文详细介绍了BlockingQueue家庭中的所有成员,包括他们各自的功能以及常见使用场景。认识BlockingQueue阻塞队列,顾名思义,首先它是一个队列,而一个

2017-03-24 14:05:06 739

原创 Synchronized同步静态方法和非静态方法总结

1.Synchronized修饰非静态方法,实际上是对调用该方法的对象加锁,俗称“对象锁”。       Java中每个对象都有一个锁,并且是唯一的。假设分配的一个对象空间,里面有多个方法,相当于空间里面有多个小房间,如果我们把所有的小房间都加锁,因为这个对象只有一把钥匙,因此同一时间只能有一个人打开一个小房间,然后用完了还回去,再由JVM 去分配下一个获得钥匙的人。情况1:同一个

2017-03-23 14:54:53 40558 16

转载 TCP三次握手详解及释放连接过程(三次握手四次挥手)

TCP头部: 其中 ACK   SYN  序号  这三个部分在以下会用到,它们的介绍也在下面。暂时需要的信息有:ACK : TCP协议规定,只有ACK=1时有效,也规定连接建立后所有发送的报文的ACK必须为1SYN(SYNchronization) : 在连接建立时用来同步序号。当SYN=1而ACK=0时,表明这是一个连接请求报文。对方若同意建立连接

2017-03-22 19:42:55 977

转载 平衡二叉树原理

平衡二叉树简称平衡树,是由Adelson-Velskii和Landis于1962年首先提出的,所以又称为AVL树。他的定义很简单,就是若一棵二叉树的每个左右节点的高度差最多相差1,此二叉树即是平衡二叉树。把二叉树的每个节点的左子树减去右子树定义为该节点的平衡因子。二叉平衡树的平衡因子只能是1、0或者-1。平衡二叉树是对二叉搜索树(又称为二叉排序树)的一种改进。二叉搜索树有一个缺点就是,树的

2017-03-21 14:54:42 647 1

转载 哈夫曼树

注:本文转载仅做个人学习备忘原文: http://blog.csdn.net/shuangde800/article/details/7341289一、哈夫曼树的概念和定义 什么是哈夫曼树?让我们先举一个例子。判定树:        在很多问题的处理过程中,需要进行大量的条件判断,这些判断结构的设计直接影响着程序的执行效率。例如,编制

2017-03-21 14:52:59 1135

转载 正确使用Volatile关键字

Java 语言中的 volatile 变量可以被看作是一种 “程度较轻的 synchronized”;与 synchronized 块相比,volatile 变量所需的编码较少,并且运行时开销也较少,但是它所能实现的功能也仅是synchronized 的一部分。本文介绍了几种有效使用 volatile 变量的模式,并强调了几种不适合使用 volatile 变量的情形。Java 语言

2017-03-20 17:55:39 254

转载 java中的synchronized(同步代码块和同步方法的区别)

问题的由来:看到这样一个面试题://下列两个方法有什么区别public synchronized void method1(){}public void method2(){ synchronized (obj){}}12345671234567synchronized用于解决同步问题,当有多条线程同时访问共享数据时,如果不进行同步,就会发生错误,Java提供

2017-03-20 17:38:26 201

转载 java中的Iterator和Iterable 区别

java.lang.Iterable java.util.Iterator Iterator是迭代器类,而Iterable是接口。 好多类都实现了Iterable接口,这样对象就可以调用iterator()方法。 一般都是结合着用,比如 HashMap类就实现了Iterable接口,而要访问或打印出Map中所有内容时,就可以这样: HashMap hashMap;

2017-03-19 19:10:09 433

转载 深入浅析Java中Static Class及静态内部类和非静态内部类的不同

java中的类可以是static吗?答案是可以。在java中我们可以有静态实例变量、静态方法、静态块。类也可以是静态的。java允许我们在一个类里面定义静态类。比如内部类(nested class)。把nested class封闭起来的类叫外部类。在java中,我们不能用static修饰顶级类(top level class)。只有内部类可以为static。     静态内部类和非

2017-03-19 13:34:15 343

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除