自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(60)
  • 收藏
  • 关注

原创 Excel中的Vlookup函数匹配

今天去了一家企业面试数据分析师,给的笔试题是16道excel题再加上一个数据分析的数据,总共一个小时的时间。说实话第一次这样面试,今天就来说说都考了什么题,分函数来讲。vlooup匹配这是很多互联网公司基本都要会的,面试的第一道题就是Vlookup。举例数据如下:1.查找多项:如下表所示需要根据姓名查找多列数据时:2.切记锁定:\3.日期查询:...

2019-03-26 21:28:42 631

原创 程序设计基础

第四部分 程序设计基础 (历年比例8%)★★ 程序设计总体原则:清晰第一、效率第二。◆ 良好程序风格包括:源程序要文档化,数据说明的次序要规范化,避免滥用goto语句。◆ 结构化程序设计的核心是算法,面向对象的核心是对象(类)。★★ 结构化程序设计的基本原则是:【自顶向下】、【逐步求精】、【模块化】、【限制使用Goto语句】。★★ 类是一组具有相同属性和相同操作的对象的集合。面...

2019-03-24 14:17:01 985

原创 数据库设计基础

第三部分 数据库设计基础 (历年比例24%)1、数据库系统基本概念◆ 数据库设计的根本目标是要解决【数据共享问题】。数据独立性最高的阶段是【数据库系统阶段】。在数据库管理技术发展的三个阶段中,数据共享最好的是【数据库系统阶段】。数据库系统可能发生各种各样的故障,可能破坏数据库中数据的故障是(磁盘损坏)。磁盘是存储数据库中数据的介质,若磁盘故障会造成数据损坏。数据库、数据库管理系...

2019-03-24 14:00:22 1260

原创 Rstudio生成html报告的一些小点

自从知道CSDN后每次都要坚持打卡,不管自己学的深浅,只要稍微入门了啥都就不是问题了今天写写如何写R_markdown。1.代码块(1)加入如同下图的斜点(2)想要自己加载的包不出警告信息如下:2.插入自己想要的变量解释表格并且不显示代码除了文字部分,对一个文档或者报告来说,表格也是非常重要的需求,表格一般可以有代码处理数据后生成的,也可以是读入外部数据所产生的,不管来源哪种,都可...

2019-03-20 23:24:18 4234

原创 R语言关于房地产数据清洗

> library(readxl) #加载读取excel包> data=read_excel("E:/R/房地产招聘1.xlsx") #读取数据> str(data) #查看数据结构Classes ‘tbl_df’, ‘tbl’ and 'data.frame': 929 obs. of 11 variables: $ 招聘岗位 : chr "新媒体...

2019-03-20 23:09:21 783

原创 R静态网页爬虫

记得记得两年前对于R不感冒,看爬虫的时候觉得太难就不学了,今天闲着无聊就重新拾起,自己相较于两年前有了进步,懂得查找爬虫知识,有耐心去学习爬虫。今天就学习了静态网页提取数据,爬取链家房产的三爻附近的房子。什么叫静态网页请参照百度百科学习哈!代码如下:> library("xml2") # 读取HTML和XML格式数据> library("rvest") # 网页数据抓取...

2019-03-19 12:27:55 915

转载 R语言中常用包(二)

数据导入以下R包主要用于数据导入和保存数据feather:一种快速,轻量级的文件格式。在R和python上都可使用readr:实现表格数据的快速导入。中文介绍可参考这里readxl:读取Microsoft Excel电子表格数据openxlsx:读取Microsoft Excel电子表格数据googlesheets:读取google电子表格数据haven:读取SAS,SPSS和Sta...

2019-03-19 10:15:04 2292

原创 E-R图

E-R图也称实体-联系图(Entity Relationship Diagram),提供了表示实体类型、属性和联系的方法,用来描述现实世界的概念模型。它是描述现实世界关系概念模型的有效方法。是表示概念关系模型的一种方式。 1.成分 用“矩形框”表示实体型;用“椭圆图框”表示实体的属性,用”菱形框“表示实体型之间的联系。 ...

2019-03-19 09:58:54 3710 2

原创 MYSQL错题

本来想着把全部选择题做完之后分类呢,但是太懒暂时先凌乱的发了。 1.数据库规范化设计的步骤包括:需求分析、概念结构设计、逻辑结构设计、物理结构设计、数据库实施、数据库运行和维护。 2.数据库系统的特点:数据结构化、数据冗余度小、数据共享性好、数据独立性高。 3.数据库系统的三级模式包括:外模式、模式、内模式。 一个数据...

2019-03-19 09:57:37 440

原创 MYSQL视图

马上要考sql程序设计了,因此自己要每天记录学习的内容,今天记录一下视图。 视图是虚拟的表。视图只包含使用时动态检索数据的查询。 1. 视图常见应用: (1)重用SQL语句。 (2)简化复杂的SQL操作。 (3)使用表的组成部分而不是整个表。 (4)保护数据。可以给用户授予...

2019-03-19 09:55:10 328

原创 计算机二级数据库复习重点2 软件工程基础

第二部分 软件工程基础 (历年比例27%)软件工程基本概念   ★★ 软件是包括【程序】、【数据】及【相关文档】的完整集合,软件是一种逻辑产品。软件工程三要素包括【方法、工具和过程】,其中【过程】支持软件开发的各个环节的控制和管理。 ◆ 软件工程的核心思想:把软件产品当作是一个工程产品来处理,强调在软件开发过程中应用【工程化】原则。 软件测试主要包括...

2019-03-17 14:08:34 375

原创 计算机二级数据库复习重点1【算法与数据结构】

【算法与数据结构】(历年比例41%)1、算法◆ 问题处理方案的正确而完整的描述称为【算法】。算法分析的目的是,分析算法的效率以求改进。算法的基本特征是【可行性】、【确定性】、【有穷性】和拥有足够情报。◆算法是指解题方案的准确而完整的描述,算法不等于程序,也不等于计算方法,设计算法时不仅要考虑对数据对象的运算和操作,还要考虑算法的控制结构。◆ 算法的复杂度是衡量算法好坏的度量,分为【...

2019-03-16 14:11:56 571

原创 主成分、因子、聚类

1.主成分分析 主成分分析:利用降维的思想,将在损失很少信息的前提下把多个指标转化为几个综合指标(主成分),用综合指标来解释多变量的方差- 协方差结构。 求解主成分的方法:从协方差阵出发(协方差阵已知),从相关阵出发(相关阵R已知)。 优点:首先它利用降维技术用少数几个综合变量来代替原始多个变量,这些综合变量集中了原始变量的大部分信息。其次它通过计算综合主成分...

2019-03-15 16:23:56 1033 1

原创 聚类

聚类分析数据文件建立> getwd() #设置工作目录> stardata <- read.csv("star30.csv",header=T)> str(stardata)> summary(stardata)##得到数据摘要信息'data.frame': 30 obs. of 14 variables: $ 姓名 : Factor w/ ...

2019-03-15 16:05:14 1463 4

原创 R语言文本分析《三国演义》

数据读取与包的加载由于最近对文本分析比较感兴趣,所以分析三国演义的文本。getwd()setwd("E:\\三国")library(jiebaR)library(ggplot2)library(jpeg)library(reshape2)library(wordcloud)一、读取前十行> sanguo <- readLines("E:/三国/三国演义白话文版.t..

2019-03-14 22:44:32 3708 1

原创 触发器

1.激活触发器的命令是INSERT、DELETE、UPDATE。2.触发器是一个被指定关联到一个表的数据库对象,当对一个表的特定事件出现时,它将会被激活,在需要时才被执行,保障数据库数据的完整性和多个表之间数据的一致性,可以创建在表上,不能创建在视图上。3.当触发器涉及对表自身的更新操作时,只能使用BEFOREUPDATE触发器,而AFTERUPDATE触发器将不被允许。4.查看触...

2019-03-12 22:39:40 1430

原创 游标

游标是一个存储在MYSQL服务器上的数据库查询,它不是一条SELECT语句,而是被该语句检索出来的结果集。游标主要应用于交互式应用。1.声明游标游标在使用之前必须先声明,可用DECLARE CURSOR语句声明游标,其一般格式为:DECLAR<游标名>[INSENSITIVE][SCROLL]CURSORFOR<SELECT-查询块>[FOR{REA...

2019-03-11 22:37:09 2154

原创 事件

1.事件是基于特定时间周期触发来执行某些任务,事件在创建后,必须执行MySQL命令来查看当前是否已开启事件调度器,创建事件的语句是CREATE EVENT,事件触发后,执行事件中定义的SQL语句序列。2.事件是基于特定时间周期触发来执行某些任务,用于维护系统数据的实时性,删除事件的语句是DROPEVENT。3.在MySQL中创建事件时,单次计划任务或重复计划任务均是指定的执行时机。...

2019-03-11 22:19:11 272

原创 数据库系统

数据库系统1.一个数据库有三级模式结构:外模式、模式、内模式,外模式也称用户模式,可以有多个,模式和内模式只能有一个。在数据库系统的三级模式结构中,面向某个或某几个用户的数据视图是(外模式)。外模式又称用户模式,可以有多个,模式和内模式只能有一个。2.一个数据库的两级映像能够保证数据库系统的独立性,其中外模式/模式映像保证数据库系统中的数据能够具有较高的逻辑独立性,模式/内模式映...

2019-03-10 22:42:52 1025

原创

栈(stack)又名堆栈,它是一种运算受限的线性表。其限制是仅允许在表的一端进行插入和删除运算。这一端被称为栈顶,相对地,把另一端称为栈底。向一个栈插入新元素又称作进栈、入栈或压栈,它是把新元素放到栈顶元素的上面,使之成为新的栈顶元素;从一个栈删除元素又称作出栈或退栈,它是把栈顶元素删除掉,使其相邻的元素成为新的栈顶元素。选择题:1.栈是按"先进后出"的原则组织数据的,数据的插入和删除都...

2019-03-10 22:26:53 126

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除