自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

转载 数据分析笔试

最近也进行了几场数据分析的笔试,看到了这篇文章总结的知识点,还是比较常考的。文章地址:http://dy.163.com/v2/article/detail/C484KJCU05119G2C.html知识点1:贝叶斯公式  贝叶斯公式:P(B|A)=P(A|B)*P(B)/P(A)  其中P(A)可以展开为  P(A)=P(A|B1)P(B1)+P(A|B2

2017-09-09 11:18:13 1815

原创 R语言实现聚类算法

1.聚类层次聚类        在层次聚类中,起初每一个实例或观测值属于一类。聚类就是每一次把两类聚成 新的一类,直到所有的类聚成      单个类为止,算法如下: (1) 定义每个观测值(行或单元)为一类; (2) 计算每类和其他各类的距离; (3) 把距离短    的两类合并成一类,这样类的个数就减少一个; (4) 重复步骤(2)和步骤(3),直到包含所有观测值的类合并成单

2017-08-10 11:30:04 10393

原创 R语言实现决策树

1.决策树(1)决策树定义    分类决策树模型是一种描述对实例进行分类的树形结构。决策树是一种由节点和有向边组成的树形结构,节点分为     三种:            ①根节点:没有入边,但有零条或多条出边,包括全部实例的集合;            ②内部节点:恰有一条入边和两条或多条出边,表示一个特征或属性;            ③叶节点:恰有一条入边,但没有出边,

2017-08-10 09:58:18 4164

原创 SQL练习(二)-- 排名问题

leetcode--将分数进行排名,并按降序排列,其中分数相同排名也应相同。输入:+----+-------+| Id | Score |+----+-------+| 1 | 3.50 || 2 | 3.65 || 3 | 4.00 || 4 | 3.85 || 5 | 4.00 || 6 | 3.65 |+----+-------+输出

2017-08-08 16:16:52 384

原创 SQL-limit

mySQL中LIMIT用法LIMIT,返回结果的行数语法格式:select * from tablename limit[offset,] rows | rows offset LIMIT 子句可以被用于强制 SELECT 语句返回指定的记录数。LIMIT 接受一个或两个数字参数。参数必须是一个整数常量。如果给定两个参数,第一个参数指定第一个返回记录行的偏移量,

2017-08-08 10:25:45 328

原创 SQL练习(一)

1.查询出表中第二大值例:查询出Employee表中第二高的薪水,若有则返回第二高的薪水,若查询没有第二高的薪水,则返回null+----+--------+| Id | Salary |+----+--------+| 1 | 100 || 2 | 200 || 3 | 300 |+----+--------+输出:+-------

2017-08-04 11:03:49 366

转载 Hive的数据类型和数据模型

本文原链接:http://www.cnblogs.com/sharpxiajun/archive/2013/06/03/3114560.html本文介绍hive的数据类型,数据模型以及文件存储格式。这些知识大家可以类比关系数据库的相关知识。  首先我要讲讲hive的数据类型。  Hive支持两种数据类型,一类叫原子数据类型,一类叫复杂数据类型。  原子数据类型包括数

2017-07-27 17:06:13 328

原创 Hive

1.Hive简介Hive是一个基于Hadoop文件系统上的数据仓库架构,它为数据仓库的管理提供了许多功能:数据ETL工具、数据存储管理和大型数据集的查询与分析能力。Hiverson定义了类SQL的语言--Hive QL,Hive QL允许用户进行和SQL类似的操作。Hive适用于处理不变的大规模数据集(例如网络日志)上的批量任务,不提供数据数据排序和查询cache功能,也不提供在线事务处理

2017-07-26 08:57:45 270

原创 EXCEL常用函数总结

整理一下在练习中用到的excel函数:1.find函数,对要查找的文本进行定位,以确定位置。语法格式:=find(find_text,within_text,start_num)说明:其中find_text为要查找的文本,within_text为文本所在单元格,start_表示从第几个字符开始查找。(注:若要查找字符,需要将字符用英文双引号括起来,数字则不用)find函

2017-07-24 15:01:12 6638

原创 R-随机抽样选取训练集与验证集

在分类中,常常要将数据集分为两部分,一部分作为训练数据集,一部分作为验证数据集(测试数据集);R语言中的sample()函数能够从数据集中有放回或者无放回的抽取大小为n的一个随机样本。用法:sample(x, size, replace = FALSE, prob = NULL)说明:x表示一个或多个要选择的元素的向量;size表示要抽取元素的个数;replace = FALS

2017-07-20 11:50:25 17374 1

原创 R-字符串处理函数

字符串连接函数:paste( )主要参数:paste(..., sep = " ", collapse = NULL)paste( )函数用于字符串连接,其中sep 负责两组字符串间的连接;collapse 负责一组字符串内部的连接。example:#输入向量   #两组字符串向量连接,连接符号可选#一组字符串

2017-07-20 11:20:14 235

原创 Rstudio安装后打不开

最近电脑重装了系统,之后重新安装了R和Rstudio,之前在很多机子上都装过R,步骤都很简单也没有出现过问题,这次安装了Rstudio后,打开Rstudio后出现了以下提示:查询之后总结了一下可能的原因及解决方法:1.R和Rstudio安装路径不能有中文;2.R和Rstudio安装目录相同;3.最后我通过右键-属性-以管理员身份运行,Rstudio可以打开。

2017-07-18 10:28:08 38193 12

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除