自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(49)
  • 资源 (2)
  • 收藏
  • 关注

原创 如何检验数据样本的正态性?

正态分布是自然界中最常见的也是一种最重要的分布。因此,人们在使用统计分析方法时,总是乐于正态假定,但该假定是否成立,就需要进行正态性检验了。定义:指如果一组观测值来自正态总体.具有正态分布的特性,就称该组观测值具有正态性。检验方法:1、图示法1.1 PP图P-P图是根据变量的累积概率对应于所指定的理论分布累积概率绘制的散点图,用于直观地考察样本数据是否服从某一概率分布。如果...

2018-09-18 00:15:36 29234

转载 决策树-CART回归树

1、什么是CART?CART,又名分类回归树,是在ID3的基础上进行优化的决策树,学习CART记住以下几个关键点:(1)CART既能是分类树,又能是分类树;(2)当CART是分类树时,采用GINI值作为节点分裂的依据;当CART是回归树时,采用样本的最小方差作为节点分裂的依据;(3)CART是一棵二叉树。分类树的作用是通过一个对象的特征来预测该对象所属的类别,而回归树的目的是根...

2018-09-16 18:26:34 7898 1

原创 R语言入门-数据类型

数据类型通常,在使用任何编程语言进行编程时,您需要使用各种变量来存储各种信息。 变量只是保留值的存储位置。 这意味着,当你创建一个变量,你必须在内存中保留一些空间来存储它们。您可能想存储各种数据类型的信息,如字符,宽字符,整数,浮点,双浮点,布尔等。基于变量的数据类型,操作系统分配内存并决定什么可以存储在保留内存中。与其他编程语言(如C中的C和java)相反,变量不会声明为某种数据类型...

2018-09-15 21:08:52 921

原创 R语言入门-变量

变量变量为我们提供了我们的程序可以操作的命名存储。 R语言中的变量可以存储原子向量,原子向量组或许多Robject的组合。 有效的变量名称由字母,数字和点或下划线字符组成。 变量名以字母或不以数字后跟的点开头。变量名 合法性 原因 var_name2. 有效 有字母,数字,点和下划线 VAR_NAME% 无效 有字符'%'。只有点(.)和下划线允...

2018-09-15 21:08:20 1377

原创 R语言入门-运算符

运算符运算符是一个符号,通知编译器执行特定的数学或逻辑操作。 R语言具有丰富的内置运算符,并提供以下类型的运算符。1、运算符的类型R语言中拥有如下几种运算符类型:算术运算符 关系运算符 逻辑运算符 赋值运算符 其他运算符2、算术运算符下表显示了R语言支持的算术运算符。 操作符对向量的每个元素起作用。运算符 描述 例 + 两个向量相加 ...

2018-09-15 21:07:50 3154

原创 R语言入门-循环

循环R编程语言提供以下种类的循环来处理循环需求。 单击以下链接以检查其详细信息。No. 循环类型和描述 语法 1 repeat 循环 多次执行一系列语句,并简化管理循环变量的代码。 repeat { commands if(condition) { break } } 2 while 循环 在...

2018-09-15 21:07:28 1015

原创 R语言入门-函数

函数函数是一组组合在一起以执行特定任务的语句。 R语言具有大量内置函数,用户可以创建自己的函数。在R语言中,函数是一个对象,因此R语言解释器能够将控制传递给函数,以及函数完成动作所需的参数。该函数依次执行其任务并将控制返回到解释器以及可以存储在其他对象中的任何结果。1、函数定义使用关键字函数创建R语言的函数。 R语言的函数定义的基本语法如下function_name &l...

2018-09-15 21:07:05 764

原创 R语言入门-基本语法

基本语法我们将开始学习R语言编程,首先编写一个“你好,世界! 的程序。 根据需要,您可以在R语言命令提示符处编程,也可以使用R语言脚本文件编写程序。 让我们逐个体验不同之处。1、命令提示符如果你已经配置好R语言环境,那么你只需要按一下的命令便可轻易开启命令提示符$ R这将启动R语言解释器,你会得到一个提示 > 在那里你可以开始输入你的程序,具体如下。> m...

2018-09-15 21:06:38 2080

原创 R语言入门-包

包R语言的包是R函数,编译代码和样本数据的集合。 它们存储在R语言环境中名为“library”的目录下。 默认情况下,R语言在安装期间安装一组软件包。 随后添加更多包,当它们用于某些特定目的时。 当我们启动R语言控制台时,默认情况下只有默认包可用。 已经安装的其他软件包必须显式加载以供将要使用它们的R语言程序使用。所有可用的R语言包都列在R语言的包。下面是用于检查,验证和使用R包的命令列...

2018-09-15 21:05:54 840

原创 R语言入门-文件读写

数据文件读写1、R语言读取文本文件:1.1、获取和设置工作目录您可以使用getwd()函数检查R语言工作区指向的目录。 您还可以使用setwd()函数设置新的工作目录。# Get and print current working directory.print(getwd())# Set current working directory.setwd("/web/com...

2018-09-15 21:04:39 1849

原创 R语言入门-安装R和Rstuido软件

安装R和Rstuido软件R语言是用于统计分析,图形表示和报告的编程语言和软件环境;Rstudio是编辑、运行R语言的最为理想的工具之一。1、官网下载R安装包  下载地址为:https://cran.r-project.org   进入链接,如下图所示,在页面顶部提供了三个下载链接,分别对应三种操作系统:Windows、Mac和Linux。请选择自己操作系统对应的链接,接下来我将以wi...

2018-09-15 20:31:01 233624 21

转载 PCA理论与实践

PCA理论与实践PCA作用:降维,PCA试图在力保数据信息丢失最少的原则下,用较少的综合变量代替原本较多的变量,而且综合变量间互不相关,减少冗余以及尽量消除噪声.  PCA的计算步骤:假设样本观测数据矩阵为:, 为n个样本在第i个属性上的观测值,是一个列向量1.对原始数据标准化处理(0均值化处理)2.计算样本相关系数矩阵3.计算协方差矩阵的特征值和特征向量4.选择重要的主成分,并写出主成分表达式5...

2018-04-10 21:45:32 694

转载 tableau 自定义版块地图

在Tableau的地图报表中有一个‘Filed Map’的类型,可以根据版块来显示数据。 但实际应用中Tableau固有的版块划分可能不是我们想要的,下面介绍如何自定义版块并且用作数据分析。自定义版块在Tableau中自定义版块是非常容易的。如下图我们把每个点链接起来就是一个多边形的版块上面的经纬度就不用说了。State 是我们版块的名字。其中Point Order告诉Tableau链接的顺序。 ...

2018-03-30 17:37:01 5621 1

转载 Hive 字符串函数

Hive内部提供了很多操作字符串的相关函数,本文将对其中部分常用的函数进行介绍。下表为Hive内置的字符串函数,具体的用法可以参见本文的下半部分。返回类型函数名描述intascii(string str)返回str第一个字符串的数值stringbase64(binary bin)将二

2017-11-06 20:16:55 10418

转载 ROC曲线和AUC值的python代码

原文链接:https://zhuanlan.zhihu.com/p/25212301__author__ = 'beauty'#create_time=2017-08-17import pandas as pdimport matplotlib.pyplot as pltimport numpy as npparameter=40data=pd.DataFram

2017-08-17 14:52:38 2063

原创 R中中文分词包Rwordseg的下载与离线安装

背景:服务中无法连接网络,必须在有网络的电脑中下载对应的安装包1.>下载Rwordseg的安装包->复制到服务器中->选择本地安装   R结果:程序包‘Rwordseg’打开成功,MD5和检查也通过2.> library("Rwordseg")错误: 找不到‘Rwordseg’所需要的程辑包‘rJava’3.>在有网的电脑中下载rJava包 (见附件)4.>本地安装rJ

2017-05-17 17:00:09 2075

原创 SQL 选取每个分组的某一条数据

背景:有时候我们需要对多条数据按照某个字段分组,然后选取某组中的某一个记录。例如-  同一运单 有多条装车记录时 取最大时间的记录sql 实现1.Sqlserver:SELECT waybill_id, -- 运单号 sigin_time, -- 签到时间unload_time, -- 卸车时间loading_time, -- 装车时间sen

2017-05-10 18:26:26 4171

原创 Sql 时间戳(int)转换为datetime

1.SQl server 把int型时间戳转换为相应的datetime型CONVERT(VARCHAR(20),DATEADD(SECOND,create_time,'1970-01-01 00:00:00'),120)其中空值会转换为'1970-01-01 00:00:00'>select CONVERT(VARCHAR(20),DATEADD(SECOND,

2017-04-19 21:22:06 21628

转载 pycharm 4.5注册码

Pycharm4.5注册码 激活name : newasp===== LICENSE BEGIN =====09086-1204201000001EBwqd8wkmP2FM34Z05iXch1AkKI0bAod8jkIffywp2WalWZejIQ6AAuAVVPbzHZpOvqvdJFHEBbvbXW2t1jQI===== LICENSE END ====

2017-04-14 20:43:34 1930

原创 python 爬虫学习笔记(2)

目标:爬取知乎代码:# -*- coding: utf-8 -*-__author__ = 'beauty'# import sys# reload(sys)# sys.setdefaultencoding("utf-8")import systype = sys.getfilesystemencoding()'''作者:liuzhijun微信: lzjun567公

2017-04-07 11:43:04 323

原创 python 爬虫学习笔记(1)

目标:爬取糗事百科的段子代码:# -*- coding: utf-8 -*-__author__ = 'beauty'import systype = sys.getfilesystemencoding() #为了防止出现乱码import urllib2import repage = 1url = 'http://www.qiushibaike.com/ho

2017-04-07 10:08:16 335

转载 python 中文乱码解决方法

python 中文乱码解决方法

2017-04-05 19:53:18 474

原创 指定日期最后一天的表示方法

1.MySQL :select curdate(); --获取当前日期select last_day(curdate()); --获取当月最后一天。select DATE_ADD(curdate(),interval -day(curdate())+1 day); --获取本月第一天select d

2017-03-30 18:38:52 4862

原创 MySQL :where 语句与Having 语句的区别

1、where 一般用在group by 语句的前面,先筛选后分组;而having 一般用在group by 语句的后面,先分组后筛选。举例:a) 显示每个地区的总人口数和总面积.SELECT region, SUM(population), SUM(area) FROM table  GROUP BY region先以region把返回记录分成多个组,这就是GROUP

2017-03-22 17:27:21 472

原创 MySQL 创建\调用存储过程

/*********************************创建存储过程*****************************************/DELIMITER $$USE `kxtx-jrbi`$$DROP PROCEDURE IF EXISTS `lianxu`$$CREATE DEFINER=`jrbiuser`@`%` PROCEDUR

2017-03-21 13:11:05 356

转载 ERROR 1044 (42000): Access denied for user 'root'@'localhost' to database 'mysql'

转自:http://www.cnblogs.com/emanlee/p/4771070.htmlmysql> use mysqlERROR 1044 (42000): Access denied for user 'root'@'localhost' to database 'mysql'mysql> exitBye[root@testtest ~]# service

2017-02-06 13:07:56 637

转载 mysqldump使用方法(MySQL数据库的备份与恢复)

mysqldump使用方法

2017-02-06 13:04:40 541

转载 运用R做树状图

利用R作树状图

2016-07-18 09:27:04 6091

转载 mysql 字符串截取函数

1、从左开始截取字符串 left(str, length) 说明:left(被截取字段,截取长度) 例:select left(content,200) as abstract from my_content_t 2、从右开始截取字符串 right(str, length) 说明:right(被截取字段,截取长度) 例:select right(content,200)

2016-07-16 16:34:50 445

转载 用户画像解析

什么是用户画像?在互联网逐渐步入大数据时代后,不可避免的给企业及消费者行为带来一系列改变与重塑。其中最大的变化莫过于,消费者的一切行为在企业面前似乎都将是“可视化”的。随着大数据技术的深入研究与应用,企业的专注点日益聚焦于怎样利用大数据来为精准营销服务,进而深入挖掘潜在的商业价值。于是,“用户画像”的概念也就应运而生。用户画像(User Profile),作为大数据的根基,它完美地

2016-04-26 18:28:43 5369

转载 什么是用户画像?金融行业大数据用户画像实践

金融消费者逐渐年轻化,80、90后成为客户主力,他们的消费意识和金融意识正在增强。金融服务正在从以产品为中心,转向以消费者为中心。所有金融行业面对的最大挑战是消费者的消费行为和消费需求的转变,金融企业迫切需要为产品寻找目标客户和为客户定制产品。一、用户画像背后的原因1、金融消费行为的改变,企业无法接触到客户80后、90后总计共有3.4亿人口,并日益成为金融企业主要的消费者,但是

2016-04-26 18:26:29 8983 1

原创 SAS学习笔记:字符串操作函数

trim(string):删除字符串的拖尾空格;strip(string):删除字符串的前置和拖尾空格;compbl(string):将连续的两个或更多的空格压缩为一个空格;compress(source):删除指定字符(若不指定要删除的字符,则删除string中的全部空格);tranwrd(source,target,replacement):对字符串中指定的字符值或字符串进行替换或消除;sub

2016-04-05 18:22:20 16339

原创 SAS学习笔记:读取混合格式的数据

/*******************************************//*****************************************SAS编程2--chap4:3:列指针控制*****************************************/data seminar_ratings;infile 'E:\library\

2016-04-05 15:51:25 752

原创 SAS学习笔记:创建图表

/* Vertical Bar Chart Representing a Frequency Count  */goptions reset=all;/**恢复默认设置,消除之前图形的标题脚注*/proc gchart data=orion.staff;   vbar Job_Title;   where Job_Title =:'Sales Rep';   title

2016-04-03 12:22:27 1849

原创 SAS学习笔记:添加超链接

定义标题是一个可点击的Web超链接ods listing close;ods html file='E:\library\sas\test.html';proc freq data=sashelp.class;tables sex;title link='http://www.sas.com' 'Test';run;ods html close;ods listin

2016-04-02 13:35:41 1127

转载 SAS:where 语句

SAS WHERE 语句用于 SAS 数据步骤或过程语句中,用于筛选数据行。简介WHERE 语句的格式很简单,只要后面跟用于数据筛选的逻辑表达式即可:WHERE logical-expression(s);下面的例子基于 test1 数据表生成 test2 数据表,但是只选择满足 sex='F' 并且 age>20 的数据行:data test2; set test1;

2016-04-01 19:07:21 12118

原创 SAS学习笔记:自定义格式

自定义格式1.自定义数值字段的格式一般数值字段:日期类型:特殊对待proc format;value datefmat low-'31dec2006'd=[year4.]                  '01jan2007'd[monyy7.] .='None';run;proc freq data=orion.employee_payroll; 

2016-04-01 18:22:10 3421

原创 SAS 怎么在数值前填充0,固定字段长度

例如,怎么填充字段x使其长度为6,不足6时前面填充0.只需在SAS中执行format x z6.;以下是测试例子:data test;input x;cards;21201;run;proc print data=test split='*';/***其中*是使标签分行的符合,当然也可以用其他符号来实现分行***/label x='new*x';fo

2016-04-01 16:49:36 9087

原创 欢迎使用CSDN-markdown编辑器

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I 引用 Ctrl

2016-04-01 16:41:51 320

转载 主成分分析和因子分析

主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分。探索性因子分析(EFA)是一系列用来发现一组变量的潜在结构的方法,通过寻找一组更小 的、潜在的或隐藏的结构来解释已观测到的、变量间的关系。1.R中的主成分和因子分析R的基础安装包中提供了PCA和EFA的函数,分别为princomp ()和factanal()psych包中有用的

2016-03-23 11:31:40 9625

Groceries数据集

该数据集是开源软件RGui里arules软件包中的Groceries数据集,记录了某个杂货店一个月的真实交易记录。具体是9835行,169列,即9835条消费记录、169个不同商品,可用于Apriori、FP_Growth、ecalt等算法进行频繁集的挖掘和关联分析。

2018-08-20

SQLyog安装包附注册码

安装方便,附带注册码

2016-12-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除