数据处理
民谣书生
只为成功找方法,不为失败找借口!
展开
-
R语言中rnorm函数
rnorm(n, mean = 0, sd = 1)n 为产生随机值个数(长度),mean 是平均数, sd 是标准差 。使用该函数的时候后,一般要赋予它 3个值.rnorm() 函数会随机正态分布,然后随机抽样 或者取值 n 次,>rnorm(5,0,1) 以N(0,1)的正态分布,分别列出5个值。r 这列代表随机,可以替换成dnorm, pnorm, qnorm 作不...原创 2018-08-30 18:56:36 · 67848 阅读 · 0 评论 -
R语言预处理(去重去NA排序)
> a <- 2:12> b <- seq(2,23,2)> c <- c(1:11)^3> d <- c(5:8, 30:36)> df <- data.frame(a,b,c,d)> df$a[df$a==8] <- NA > df$b[df$b==8] <- NA > df$c[d原创 2018-09-07 20:52:18 · 2933 阅读 · 0 评论 -
Tableau函数功能2:订单数
综上所述,如果要用到其他函数,可以逐一调用即可。原创 2018-09-11 11:15:42 · 1230 阅读 · 1 评论 -
Tableau函数3:分析发货速度
综上所述,产品的发货时间就可以通过图分析出来,找出那些发货时间慢导致客户不满意的原因。原创 2018-09-11 12:26:10 · 805 阅读 · 0 评论 -
Tableau函数4:更正利润率
函数校正:SUM(IF [产品类别] = "家具产品" THEN [利润额]+[运输成本] ELSE [利润额] END)/SUM([销售额])//考虑家具产品的运输成本修正利润率 综上所述,更正了利润率,并用//做了备注。 ...原创 2018-09-11 12:48:23 · 594 阅读 · 0 评论 -
Tableau函数:设置参数控件
综上所述,参数控件设置完毕。补充:快速表的功能。原创 2018-09-11 13:33:04 · 3303 阅读 · 0 评论 -
Tableau图表1:地图
我们将省份右击改变成地理角色:选择省市区 综上所述,你想将图表设置成为什么形式,就可以对应的修改成什么格式!原创 2018-09-11 14:45:00 · 1065 阅读 · 0 评论 -
Tableau图表2:条形图和线性图
综上所述,我们可以发现,东北和西南两区的家具利润为负值,具体可以分析在哪一个模块除了问题。原创 2018-09-11 15:44:23 · 2875 阅读 · 0 评论 -
SPSS工具:描述分析(2)---商场调研报告
原创 2018-09-15 17:27:40 · 709 阅读 · 0 评论 -
SPSS工具:数据的导入--离散--随机取样--标准化等
原创 2018-09-16 13:24:04 · 864 阅读 · 0 评论 -
Tableau图表3:多种图
原创 2018-09-12 14:10:46 · 2072 阅读 · 0 评论 -
Tableau图表4:帕累托图
帕累托图相对复杂一些,但不难制作:综上所述,帕累托图已基本实现完毕!附上用R写的帕累托图:https://blog.csdn.net/zjlamp/article/details/81322278链接处分析出,A1~A7占总类的70%,总盈利占85%。根据帕累托原则,应增加对A1~A7的成本投入,减少A8~A10的投入,以获得更高的盈利额。...原创 2018-09-12 14:35:21 · 2606 阅读 · 0 评论 -
Tableau图表:气泡图,文字云,树状图等
综上所述,完整的图表制作已经完成,但在实习工作的时候你发现的用的并不多,和之前用的R相比,我更推荐用tableau可视化.原创 2018-09-12 15:08:00 · 5976 阅读 · 0 评论 -
Tableau仪表盘:仪表盘就是多张表的操作
找到一个官方的说明:https://onlinehelp.tableau.com/current/pro/desktop/zh-cn/analyze.html动作原创 2018-09-12 16:12:19 · 7202 阅读 · 0 评论 -
分治法
一、基本概念 在计算机科学中,分治法是一种很重要的算法。字面上的解释是“分而治之”,就是把一个复杂的问题分成两个或更多的相同或相似的子问题,再把子问题分成更小的子问题……直到最后子问题可以简单的直接求解,原问题的解即子问题的解的合并。这个技巧是很多高效算法的基础,如排序算法(快速排序,归并排序),傅立叶变换(快速傅立叶变换)…… 任何一个可以用计算机求解的问题所需的计算时间都与其规模有...转载 2018-09-16 20:08:06 · 176 阅读 · 0 评论 -
动态规划分析
动态规划通过把原问题分解为相对简单的子问题的方式求解复杂问题的方法。动态规划常常适用于有重叠子问题和最优子结构性质的问题。基本思想若要解一个给定问题,我们需要解其不同部分(即子问题),再合并子问题的解以得出原问题的解。 通常许多子问题非常相似,为此动态规划法试图仅仅解决每个子问题一次,从而减少计算量: 一旦某个给定子问题的解已经算出,则将其记忆化存储,以便下次需要同一个子问题解之时直接...转载 2018-09-16 20:18:16 · 215 阅读 · 0 评论 -
SQL(mysql)语句查询--navicat 工具---(1)
-- 1、 查询Student表中的所有记录的Sname、Ssex和Class列。SELECT sname,ssex,class FROM students-- 2、 查询教师所有的单位即不重复的Depart列。SELECT DISTINCT depart FROM teachers-- 3、 查询Student表的所有记录。SELECT * from students-- 4、 查询...原创 2018-09-17 14:25:19 · 2013 阅读 · 0 评论 -
SQL(mysql)语句查询--navicat 工具---(2)
-- 13、查询最低分大于70,最高分小于90的Sno列。SELECT sno FROM scores GROUP BY sno HAVING MAX(degree) < 90 and MIN(degree) >70-- 14、查询所有学生的Sname、Cno和Degree列。SELECT a.sno,a.sname,b.degree from students as a INN...原创 2018-09-17 17:07:33 · 1464 阅读 · 0 评论 -
tableau数据分析连接数据库
1.连接mysql数据库当然你的tableau还可以连接你的hive和在其他电脑端访问你的数据库详情参见:1.http://blog.sina.com.cn/s/blog_8a122dcf0102wiub.html 2.https://www.sogou.com/link?url=DSOYnZeCC_pKZzihDKzFgzQoUk...原创 2018-09-10 19:53:00 · 2465 阅读 · 0 评论 -
Tableau分组的解决方案
上文说道:我们希望得到这样的图形,而解决方案并不是网上说的版本问题,当然也要比某视频教学的老师要好很多:1.选择产品子类别组,右击将其他的对号去掉2.在编辑组里面把其他去掉,这里面还是可以设置你怎么分组问题,比之前那个好一点...原创 2018-09-10 21:35:45 · 1529 阅读 · 0 评论 -
Tableau创建集
多出了一个集 之后发现并不能看出我们做的变换还是一样的乱,右击选中在集内还是集外:好了,至此,分集已经弄好了,比SQL好用多了是不是!后期会更新所有。...原创 2018-09-10 22:04:30 · 657 阅读 · 0 评论 -
R读取txt文件的问题
https://blog.csdn.net/HHTNAN/article/details/54706885 烦人的一下午,接了各种电话不说,关键发现现在连txt文件导入都有问题。这么简单的问题,不应该出问题呀。最终给自己的智商又交了智商税。多么规整的数据呀,一看就是三列呀。然后导入进入获取不了第三列,然后就是各种错错错。后来把数据调入spss和excel查看了一下,坑爹呀。...原创 2018-09-07 16:33:39 · 9012 阅读 · 0 评论 -
SQL(mysql)语句查询--navicat 工具---(3)--count(1)count(*)count(字段)用法的区别
SQL语句中count(1)count(*)count(字段)用法的区别在SQL语句中count函数是最常用的函数之一,count函数是用来统计表中记录数的一个函数,一. count(1)和count(*)的区别1. count(1)和count(*)的作用:都是检索表中所有记录行的数目,不论其是否包含null值。2. 区别:但是count(1)比count(*)效...原创 2018-09-18 19:26:57 · 1977 阅读 · 0 评论 -
电商数据分析要素
简单的可以理解为每个商品的属性:颜色/尺码等信息(比如红色M码是一个SKU;红色L码又是一个SKU)。SKU=Stock Keeping Unit(库存量单位),即库存进出计量的单位,可以是以件,盒,托盘等为单位。SKU是对于大型连锁超市DC(配送中心)物流管理的一个必要的方法。当下已经被引申为产品统一编号的简称,每种产品均对应有唯一的SKU号。针对电商而言,SKU有另外的注解:1、SKU是...原创 2018-09-18 21:54:12 · 1058 阅读 · 0 评论 -
Excel发现一个好玩的东西:有趣的条形图
以前在做数据分析的时候发现有人能做小人,挺好玩的例如:等等,是不是挺好玩的,下面给出具体的步骤:1.下载两张图原创 2018-09-13 20:08:17 · 2019 阅读 · 0 评论 -
SPSS工具:对应分析--品牌形象定位
对应分析是一种多元统计数据分析:至此,对应分析过程已经讲完。看看分析的结果吧:原创 2018-09-13 20:43:57 · 2632 阅读 · 0 评论 -
SPSS工具:因子分析---商户OTO运营数据
因子分析研究变量之间的相关性。以下画图有点丑,但是本质呀,同志们。 所以在做因子分析要注意:建议个案为变量的5倍以上,KMO检验统计量在0.8以上最好,0.5以下就不适合。 至此,以上都是操作过程,下面我们看看分析结果:综上所述:因子分析结束。...原创 2018-09-13 21:31:07 · 833 阅读 · 0 评论 -
SPSS工具:聚类分析(1)快速聚类---绩效评估
至此,K均值聚类步骤结束。下面分析结果:聚类分析其一结束。原创 2018-09-13 21:53:28 · 5622 阅读 · 2 评论 -
SPSS工具:聚类分析(2)--系统聚类--员工绩效
至此,快速聚类步骤完成,下面看看分析结果。原创 2018-09-13 22:21:34 · 1177 阅读 · 0 评论 -
mysql百万数据导入
1. 表结构完全一样 insert into 表1 select * from 表2 2. 表结构不一样(这种情况下得指定列名) insert into 表1 (列名1,列名2,列名3) select 列1,列2,列3 from 表23、只从另外一个表取部分值insert into 表1 (列名1,列名2,列名3) values(列1,列2,(select 列3 f...原创 2018-09-24 15:00:56 · 413 阅读 · 0 评论 -
乱码问题
http://www.360doc.com/content/17/0816/08/16915_679542503.shtml 2.sav格式问题在使用SPSS Modeler进行数据分析和数据挖掘时,官方Demos中自带数据的格式为sav格式,我们只能通过该软件进行数据的读取,如果想在其他途径如MySQL中导入该数据,那是不行的。如果我们在学习SPSS教程苦于没有合适数据的...原创 2018-09-24 16:45:26 · 870 阅读 · 0 评论 -
SPSS工具:聚类分析(3)--二阶聚类---员工绩效
好了,至此,二阶聚类操作过程结束。下面来看看输出的结果 好了,综上所述,二步聚类分析完毕。特点是可视化效果很好。原创 2018-09-14 11:03:58 · 7676 阅读 · 1 评论 -
SPSS工具:RFM分析--客户分析
这是我最喜欢且是实践过的一个分析方法。但是要注意,这种分析不一定要按照下面来,但是思想核心是一样的。要懂得根据业务变通,航空公司的客户分析和其他业务分析都不一样,你选择几个变量,几个类要根据业务出发,才能找到一个很好的特征。而且任何数据分析脱离了需求和业务都是不靠谱的,不一定你做了一个分析可以使用很多范围,有时候你需要做复盘分析和总结。应用于航空公司客户分析,游戏客户分析,电商...原创 2018-09-14 12:16:29 · 9386 阅读 · 5 评论 -
更新mysql表
CREATE TABLE new_table SELECT * FROM old_tableCREATE TABLE 新表 SELECT * FROM 旧表 WHERE 1=2insert into tb_item select * from tb_itemCREATE TABLE new_table SELECT * FROM tb_item https://mp.weixin...原创 2018-09-25 10:21:49 · 230 阅读 · 0 评论 -
Tableau创建参数
综上所述,参数创建完毕,很简单。原创 2018-09-11 10:41:05 · 2118 阅读 · 0 评论 -
SPSS工具:时间序列分析---商业销量预测
下面是操作过程: 下面来进行对比分析接下来我们来预测吧.至此,时间序列分析终于全部结束了。原创 2018-09-14 16:07:30 · 13687 阅读 · 5 评论 -
SPSS工具:逻辑回归--商户续约问题
原创 2018-09-14 16:46:33 · 542 阅读 · 0 评论 -
化妆品报告
http://index.baidu.com/?tpl=demand&word=%CA%FD%BE%DD%B7%D6%CE%F6http://index.1688.com/alizs/topOfficialSite.htm?spm=a262ha.8884054.0.0.JS17C0原创 2018-09-25 13:43:12 · 245 阅读 · 0 评论 -
SPSS工具:自动线性回归---广告投放效果预测
至此,我们的自动建模已经步骤已经结束。接下来,我们分析一下结果:1.先来了解一些新知识2.模型结果解读 至此,完整的自动线性回归的内容和细节完全介绍完毕。...原创 2018-09-14 20:25:39 · 2348 阅读 · 1 评论 -
SPSS工具:描述性分析(1)
原创 2018-09-14 21:41:45 · 2263 阅读 · 0 评论