- 博客(56)
- 收藏
- 关注
转载 零售商超数据分析
一、背景介绍和分析目的 移动互联网、大数据、人工智能、物流等技术的快速发展,传统零售业态与电商平台的深度融合,催生出新兴的业态和新商业模式。同时消费者发生了变化,80、90后成消费主力,他们对高质量商品的需求快速增强,对服务性消费的需求潜力也在不断释放,购物时越来越追求方便快捷,购物渠道从割裂走向融合。人们的消费观念不断转变,为迎合消费者新需求,线上线下融合成为商超行业发展趋势,众...
2019-09-16 13:36:00
1880
转载 TMDb电影最赚钱电影有那特征
一, 提出问题本案例来源于kaggle上的TMDB 5000 Movie Dataset数据集,为了探讨电影数据可视化,为电影的制作提供数据支持,主要研究以下几个问题:电影类型如何随着时间的推移发生变化的?电影类型与利润的关系?Universal和Paramount两家影视公司的对比情况如何?改编电影和原创电影的对比情况如何?...
2019-09-01 22:50:00
1257
转载 Excel 动态图表(macth函数)
涉及函数:1. MATCH(lookup_value, lookup_array, [match_type])。lookup_value必需。要在lookup_array中匹配的值。lookup_value参数可以为值(数字、文本或逻辑值)或对数字、文本或逻辑值的单元格引用。lookup_array必需。要搜索的单元格区域。match_type可选。数字 ...
2019-08-22 21:41:00
543
转载 Excel 动态图表设计
涉及函数1. OFFSET(reference,rows,cols,height,width)Reference 作为偏移量参照系的引用区域。Reference 必须为对单元格或相连单元格区域的引用;否则,函数 OFFSET 返回错误值 #VALUE!。Rows 相对于偏移量参照系的左上角单元格,上(下)偏移的行数。如果使用 5 作为参数 Rows,则说明目标引用区域的...
2019-08-22 20:19:00
338
转载 Tableau 同环比 交互设计
交互当天同环比step1 : 选取某一天销售额 增加计算字段step2 : 依次按照上面的做法, 选取以上一步选取那一天为基准 增加 上月和上年 销售额 的计算字段step3 : 增加判断日期字段 T/F ,然后拖入筛选出逻辑真的时间 ,效果如下step4 : 计算同环比, 然后在新建工作表中展示效果效果如下:为了能够交互使用同环比, ...
2019-08-19 22:40:00
1188
转载 Tableau 指定维度聚合FIXED
为了计算各类别中子类别销售额总和的平均值, 用来平均值判断step1 : 添加一个计算字段{ FIXED [类别]:AVG({FIXED [子类别]:SUM([销售额])})}step2 : 拖拽至度量值最终目的展示效果:转载于:https://www.cnblogs.com/liuyuanq/p/11376771.html...
2019-08-19 14:05:00
4216
转载 《谁说菜鸟不会数据分析》读书笔记(2)
1.数据分析方法论5W2H法 ---适用用户行为,业务问题分析用户购物行为分析:why-用户购买目的,产品哪方面吸引客户when-用户何时购买,多久再次购买what-公司提供什么产品,用户需求是什么who-那些用户购买,用户特点where-在哪购买,客户地区分部how-什么方式购买,支付方式how much-用户购买花费时间,交通成本4P营...
2019-08-17 18:59:00
212
转载 《谁说菜鸟不会数据分析》读书笔记(1)
1.数据分析是什么? 数据分析是指适当的统计分析方法对收集来的大量数据进行分析, 将他们加以汇总, 理解消化, 以求最大地开发数据的功能, 发挥数据的作用. 未来提取有用信息和形成结论而对数据加以详细研究和概括总结的过程. 目的就是把隐藏在一大批看似杂乱无章的数据背后的信息集中和提炼出来, 总结出研究对象的内在规律 , 帮助管理者决策判断, 以便采取适当的策略和行动...
2019-08-15 20:36:00
171
转载 撰写报告要点
问题点: 体现差异化,即不同基准对比写what,how分析,问题是what拆分指标,找重点关联指标找原因,找驱动点写报告前: 用思维导图对问题的结构化梳理好。分析过程,发现新问题,记录下来,后续做单独分析。梳理报告逻辑:整个报告,板块结构每个模块主要内容观点图表样式后续相关数据附录六脉神剑:明确对象...
2019-08-11 23:18:00
192
转载 分析报告_问题界定篇
通过一个案例 [母婴品类搜索转化率提升案例] 数据分析报告要解决什么问题?问题+数据+报告=解决方案五条铁律:1.客户思维2.先谋而后动3.data质量是生命线4.解决问题才是好猫5.伤其十指,不如短其一指麦肯锡 "七步成诗"提出问题->分解问题(逻辑树)->界定问题(5W2H)->构建数据分析逻辑->...
2019-08-11 23:15:00
304
转载 数据分析报告
困惑???从哪入手系统体系构建呈现什么观点用那些数据, 怎么处理分析, 用什么方法和工具数据分析报告是一种能力的体现!!! 报告必须有价值!!!背景???公司业务, 电商, 零售, 生鲜等.....个人角色电商业务流程???数据分析师参加公司运营和品牌商会议, 他们的谈判流程是怎么样的?回顾之前目标目标完...
2019-08-10 12:05:00
148
转载 kaggle入门之Titanic生存预测
比赛说明RMS泰坦尼克号沉没是历史上最臭名昭着的沉船之一。1912年4月15日,在她的处女航中,泰坦尼克号在与冰山相撞后沉没,在2224名乘客和机组人员中造成1502人死亡。这场耸人听闻的悲剧震惊了国际社会,并为船舶制定了更好的安全规定。造成海难失事的原因之一是乘客和机组人员没有足够的救生艇。尽管幸存下沉有一些运气因素,但有些人比其他人更容易生存,例如妇女,儿童和上流社会。在...
2019-08-10 12:02:00
243
转载 pandas基础
1.Pandas数据结构Series :是一种类似于一维数组的对象,由一组数据以及一组与之相关的数据标签(即索引)组成。DataFrame :是一个表格型的数据结构,既有行索引又有列索引的一种数据结构.2.外部导入数据导入xlsx 导入CVS导入txt导入SQL格式 : pd.read_excel(r"D:\Data-Science\s...
2019-08-05 23:10:00
103
转载 SQL执行顺序
1.From and JOIN首先我们进行查询的时候,肯定是先获得一份数据集的,From语句和JOIN被先执行的,就是为了获得数据集的。2.WHERE一旦数据集给拿到了,WHERE限制条件会被用到某些行上,并把不满足的行给抛弃掉。并且,这能够用到各种数据类型中3.GROUP BYWHERE条件限定之后,接下来就是GROUP BY语句了,这...
2019-08-05 11:36:00
76
转载 商品ABC分析
ABC分类法(Activity Based Classification) 又称帕累托分析法或巴雷托分析法、柏拉图分析、主次因分析法 、ABC分析法、分类管理法、重点管理法、ABC管理法、abc管理、巴雷特分析法,平常我们也称之为“80对20”规则。 它是根据事物在技术或经济方面的主要特征,进行分类排队,分清重点和一般,从而有区别地确定管理方式的一种分析方法。由于它把被分析的对象分成...
2019-08-04 20:25:00
1976
转载 子查询 关联查询 效率问题 [转载]
子查询就是查询中又嵌套的查询,表连接都可以用子查询,但不是所有子查询都能用表连接替换,子查询比较灵活,方便,形式多样,适合用于作为查询的筛选条件,而表连接更适合与查看多表的数据。子查询不一定需要两个表有关联字段,而连接查询必须有字段关联(所谓的主外键关系)表关联的效率要高于子查询,因为子查询走的是笛卡尔积表关联可能有多条记录,子查询只有一条记录,如果需要唯一的列,最好...
2019-08-04 12:37:00
1545
转载 时间-数据类型和函数类型by MySQL
MySQL 使用下列数据类型在数据库中存储日期或日期/时间值:DATE - 格式 YYYY-MM-DDDATETIME - 格式: YYYY-MM-DD HH:MM:SSTIMESTAMP - 格式: YYYY-MM-DD HH:MM:SSYEAR - 格式 YYYY 或 YYMySQL Date 函数下面的表格列出了 MySQL 中最重要的内建日期...
2019-07-31 17:44:00
107
转载 date_format() 函数
定义和用法DATE_FORMAT() 函数用于以不同的格式显示日期/时间数据。语法DATE_FORMAT(date,format)date参数是合法的日期。format规定日期/时间的输出格式。可以使用的格式有:格式描述%a缩写星期名%b缩写月名...
2019-07-31 17:42:00
1786
转载 电商指标术语
客单价: 指每一位顾客平均购买商品的金额 转化率:指在一个统计周期内,完成转化行为的次数占推广信息总点击次数的比率。公式:转化率=(转化次数/点击量)×100%。举例:某店当天的访客数(UV)为5000,其中50名用户有了后续转化的行为。那么,其转化率就是(50/5000)×100%=1%。转化率是网站最终能否盈利的核心,提升网站转化率是网站综合运营实力的结果。...
2019-07-31 17:41:00
464
转载 窗口/分析函数
业务场景:某个上次购买距现在的时间?? 每次购买时间间隔?周环比如何计算?怎样得到各区域销售排名前N名商品列表?怎样得到各商品销售占品类总销售百分比?如何计算个商品累计销售占比?如何把销售分成N等份大于等于当前订单金额的订单比例有多少?每个会员某段时间内最大,最小的订单金额?转载于:https://www.cnblogs.com/liuyu...
2019-07-31 17:40:00
154
转载 mysql实战练习
-- SELECT count(*) FROM fct_sales_item;-- -- SELECT * FROM fct_sales_item-- WHERE id<10;-- -- SELECT DATE_FORMAT(dimDateID,'%Y-%m-%d') as 'date'-- FROM dim_date-- ORDER B...
2019-07-27 18:14:00
552
转载 MySQL之day6
集合运算表的加减法1. 加法 union (并集) , 去除重复记录!mysql> select product_id,product_name -> from product -> union -> select product_id , product_name -&...
2019-07-09 10:43:00
77
转载 MySQL之day5
函数函数种类: 算术函数字符串函数日期函数转换函数聚合函数1. 算术函数 + - * / abs --绝对值 mod(被除数,除数) --求余 round(对象数值, 保留小数位数) --四舍五入2. 字符串函数 concat(str, str2 ,...) -- 字符串拼接 l...
2019-07-08 11:31:00
75
转载 anaconda3 notebook for python数据分析-环境搭建
这里坑巨多!!!anaconda31.下载安装 ,安装前关闭安全软件 卸载原来的Python https://mirrors.tuna.tsinghua.edu.cn/help/anaconda/https://www.jianshu.com/p/62f155eb6ac5 以打开EXE安装文件 安装时不选 path 环境2. 测试是否安装成...
2019-07-07 21:23:00
113
转载 MySQL之day4
1.视图, 就是保存好的select 语句 创建视图 create view <视图名> (<视图列>, ....) as select 语句.....mysql> create view prdtsum (product_type,cnt_product) -> as -> select prod...
2019-07-06 11:21:00
67
转载 MySQL之day3
数据的插入 插入一行(可以 省略 列名)且要求 行列数严格一致 插入格式: insert into <表名> (列,...) values (值,...)mysql> insert into product values ('0009','电视机','家具',4000,3000,'2019-07-04',NULL...
2019-07-06 10:52:00
72
转载 MySQL之day2
参考:https://www.cnblogs.com/programmer-tlh/p/5782418.html1.建立数据给 product 表格table 1 mysql> show databases; 2 +--------------------+ 3 | Database | 4 +------------------...
2019-07-04 19:59:00
106
转载 MySQL之day1
登录loginmysql -h localhost -u root -p创建数据库databasecreate <database_name>;show 库sshow databases;进入/使用数据库use <database_name>;创建表table->create table &...
2019-07-03 23:47:00
51
转载 Excel 绘制正态概率图-正态性检验
转载于:https://www.cnblogs.com/liuyuanq/p/11051490.html
2019-06-19 15:17:00
4874
转载 优化yum下载安装慢,不断换mirror
https://zhuanlan.zhihu.com/p/78471090不停地换mirror,为了解决这个问题,在网上搜了好多资料,总结出一个基于aliyun的mirror源先检查:是否能正常上网,DNS是否正常,网关gw是否正常,若通过ping 不正常,则解决好网络,再进行下面操作.1. 清除缓存[root@centos7 ~]# yum clean al...
2018-12-02 18:09:00
832
转载 centos网络配置
Linux网络属性管理(1) 局域网:以太网,令牌环网 Ethernet: CSMA/CD 冲突域 广播域 MAC:Media Access Control 48bits: 24bits: 24bits: IP: Internet Protocol Rout...
2018-11-30 23:27:00
128
转载 进程管理工具及任务计划
Linux任务计划、周期性任务执行 未来的某时间点执行一次任务:at, batch 周期性运行某任务: cron 电子邮件服务: smtp: simple mail transmission protocol, 用于传送邮件; pop3: Post Office Protocol imap4:Internet Mail Access Protoc...
2018-11-25 12:50:00
122
转载 压缩,解压缩及归档工具
压缩、解压缩及归档工具 压缩比 目的: 时间 换 空间 CPU的时间-->磁盘空间 compress/uncompress: .Z gzip/gunzip: .gz bzip2/bunzip2: .bz2 xz/unxz: .xz //常用 lzma/unlzma/zcat: .lz zip/unzip tar, cpio ...
2018-11-25 10:52:00
98
转载 LVM和RAID
RAID: Redundant Arrays of Inexpensive Disks Independent Berkeley: A case for Redundent Arrays of Inexpensive Disks RAID 提高IO能力: 磁盘并行读写; 提高耐用性; 磁盘冗余来...
2018-11-25 10:47:00
129
转载 find命令
文件查找: 在文件系统上查找符合条件的文件; 实现工具:locate, findlocate: 依赖于事先构建好的搜引库; 系统自动实现(周期性任务); 手动更新数据库(updatedb); 工作特性: 查找速度快; 模糊查找; 非实时查找(数据库里的内容可能是旧的) 使用方式:locate [OPTION]... PA...
2018-11-25 10:32:00
68
转载 grep,cut,wc,sort,diff,uniq,patch命令
文本处理工具: Linux上文本处理三剑客: grep,egrep,fgrep: 文本过滤工具(模式: pattern)工具; grep:基本正则表达式,-E,-F egrep:扩展正则表达式,-G,-F fgrep:不支持正则表达式, sed: stream editor,流编辑器;文本编辑工具; awk: Linux上实现为ga...
2018-11-25 10:25:00
180
转载 sed命令
sed: Stream EDitor, 行编辑器; 用法: sed [option]... 'script' inputfile... script: '地址命令' 常用选项: -n:不输出模式中的内容至屏幕; -e: 多点编辑; -f /PATH/TO/SCRIPT_FILE: 从指定文件中读取编辑脚本; -r: 支...
2018-11-25 10:21:00
49
转载 程序包管理rpm和yum
Linux程序包管理: API:Application Programming Interface源码包 POSIX:Portable OS 程序源代码 --> 预处理 --> 编译 --> 汇编 --> 链接 静态编译: 共享编译:.so ABI:Application Binary Interface二进...
2018-11-22 12:42:00
112
转载 centos最小化系统安装VMware tool
1.先执行命令创建环境yum -y install updateyum -y install gcc kernel-headers kernel-devel2.然后重启reboot3.挂载,解压,运行[root@study ~]# mount /dev/cdrom /mntmount: block device /dev/sr0 is write-...
2018-11-20 14:00:00
455
转载 磁盘及文件系统管理(以及btrfs)
Linux系统管理 磁盘分区及文件系统管理 raid lvm 网络属性管理 程序包管理 sed及awk 进程查看和管理 内核管理(内核的编译和安装) 系统启动流程 定制,编译内核,busybox 系统安装:kickstart,DHCP,pxe shell脚本编程(敲黑板!!!)Linux磁盘及文件系统管理 CPU,memor...
2018-11-06 15:37:00
298
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人