- 博客(11)
- 资源 (8)
- 收藏
- 关注
原创 数据挖掘工程师的面试问题与答题思路
一个Java程序可以认为是一系列对象的集合,而这些对象通过调用彼此的方法来协同工作。下面简要介绍下类、对象、方法和实例变量的概念。对象:对象是类的一个实例,有状态和行为。例如,一条狗是一个对象,它的状态有:颜色、名字、品种;行为有:摇尾巴、叫、吃等。类:类是一个模板,它描述一类对象的行为和状态。方法:方法就是行为,一个类可以有很多方法。逻辑运算、数据修改以及所有动作都是在方法中完成的。实例变
2016-06-22 22:23:12 8270
原创 大话数据结构——查找
查找(Searching)是根据给定的某个值,在查找表中确定一个其关键字等于给定值的数据元素(或记录)。一、顺序表查找顺序查找又叫线性查找,是最基本的查找技术,它的查找过程是:从表中第一个(或最后一个)记录开始,逐个记性记录的关键字和给定值比较,若某个记录的关键字和给定值相等,则查找陈宫,找到所查的记录;如果直到最后一个(或第一个)记录,其关键字和给定值比较都不等时,则表中没有所查的记录,查找不成功
2016-06-16 11:35:59 677
原创 大话数据结构——图
图(Graph)是由定点的又穷非空集合和顶点之间边的集合组成,通常表示为:G(V,E),其中,G表示一个图,V是图G中顶点的集合,E是图G中边的集合。一、各种图的定义图按是否有方向分可分为有向图和无向图。有向边用尖括号“<>”表示,无向边用小括号“()”表示。 简单图:无环无重复边。我们以下讨论的都是简单图。 无向完全图:任意两个顶点之间都存在边。 含有n个顶点的无向完全图有n*(n-1)/2
2016-06-14 16:31:03 1575
原创 大话数据结构——树
一、树的定义**树(Tree)是n(n>=0)个结点的有限集。**n=0又称为空树。在任意一课非空的树中:(1)有且仅有一个特定的称为跟(Root)的结点;(2)当n>1时,其余结点可分为m(m>0)个互不相交的有限集,其中每一个集合本身又是一棵树,并且称为根的子树(SubTree)。 树是一种一对多的数据结构。 需要注意的是: (1)当n>0时根结点是惟一的,不可能存在多个根结点。 (2)
2016-06-13 17:51:36 7225
原创 大话数据结构——串
串(string)是由零个或多个字符组成的有限序列,又名字符串。 字符串有很多函数,replace、ToUpper、ToLower(转小写)、Trim(去掉两边空格)、IndexOf(从左到右查找子串的位置)、SubString、SubLength等等。一、串的存储结构串的存储结构与线性表相同,分为顺序存储结构和链式存储结构。 1. 顺序存储结构 串的顺序存储结构是用一组地址连续的存储单元来存
2016-06-12 11:46:22 1373 1
原创 大话数据结构—栈与队列
栈一、栈的定义栈是(stack)是限定尽在表尾进行插入和删除操作的线性表。 栈又称为后进先出(Last In First Out)的线性表,简称LIFO结构。二、进栈出栈变化形式注意: 并不是最新进栈的元素只能最后处栈。如,我们现在有三个元素一次进栈,次序会有以下5种: 1. 1、2、2进,再3、2、1出,出栈次序为321; 2. 1进,1出,2进,2出,3进,3出,出栈次序为123; 3.
2016-06-09 12:07:19 955
原创 用户画像
用户画像:标签化、 用标签描述用户行为用户画像:动态信息数据 用户行为产生的数据:注册、浏览、点击、购买、签收、评价 比较重要的行为:购买商品、浏览商品、放入购物车、关注商品用户画像的用途:分类统计,数据挖掘,营销推荐模型算法 性别模型 用户忠诚度模型 疑似马甲模型:马甲指一个用户注册多个账号 用户购物类型模型 用户身高尺码模型 手机相关标签:对手机相关标签参考意义比较大;手机品牌、
2016-06-06 23:05:07 1327
原创 Linux简介
一、Linux发展史 1991年出现Linux,之前有个玩意叫Minus,用于教学的。Linux有内核版本和发行版本(企业字内核版本的基础上加入自己的理解),内核版本更加标准。二、开源软件简介 Aphache(网站服务搭建软件)、Nginx、Mysql、mongoDB、python、samba、Ruby 使用的自由:绝大多数开源软件免费; 研究的自由:可以获得软件源代码; 散布及改良的自由
2016-06-06 11:25:35 374
原创 HIVE入门
Hive概述什么是 Hive? * Hive 是建立在 Hadoop HDFS 上的数据库仓库基础建构 * Hive 可以用来进行数据库提取转化加载(ETL) * Hive 定义了简单的类似 SQL 查询语言,称为 HQL,它允许熟悉 SQL 的用户查询数据 * Hive 允许熟悉 MapReduce 的开发者自定义 mapper 和 reducer 来处理内建的 mapper 和 redu
2016-06-05 11:41:20 843
原创 Hadoop 大数据平台架构与实践
初识HadoopHadoop是一个开源的分布式存储+分布式计算平台。Hadoop核心组成部分:HDFS:分布式文件系统,存储海量的数据。MapReduce:并行处理框架,实现任务分解和调度。Hadoop可以用来做什么? 搭建大型数据仓库,PB级数据的存储、处理、分析、统计等业务。Hadoop优势:高扩展、低成本(不依赖高端硬件,只需要PC机就可以实现)、成熟的生态圈(开源、有很多衍生的小工具
2016-06-05 10:26:28 1030
原创 大数据基础技术和应用
大数据概述数据的表现形式:线下数据信息化:数据库、文字记录、照片……互联网-移动互联网:网页数据、用户行为记录、数字图像……传感器:设备监控、智能家居、摄像头……大数据的4V特征:大量化(Volume):存储量大、增量大;多样化(Variety):来源多、格式多;快速化(Velocity):高速数据I/O;价值密度低(Value)大数据基础技术一、工程技术Hadoop介绍Hadoo
2016-06-04 12:04:47 2646
Hadoop2.7.7配合使用的winutil
2018-08-22
java编写的主成分分析(PCA)降维技术
2015-05-12
java的rt.jar,是java程序的运行环境所用。
2014-12-14
standard.jar
2014-04-02
jar包下载jstl.jar
2014-04-02
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人