自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 资源 (4)
  • 收藏
  • 关注

原创 trino学习日志

学习日志

2023-12-04 15:10:57 828

原创 Python 报错集合

Python 报错:UnicodeDecodeError: 'gbk' codec can't decode byte 0xac in position 43: illegal multibyte sequence源码:with open('a.csv', 'r') as f: for line in f.readlines(): print(line)报错:UnicodeDecodeError: 'gbk' codec can't decode byte 0xac in

2021-10-23 16:44:01 201

原创 某在线教育机构经营分析

文章目录1. 案例背景2. 问题确认与指标拆解(业务逻辑图)3. 问题解决思路4. 实际方法应用5. 渠道排名---综合分析6. 产品用户行为分析(漏斗分析)7. 学员价值分析---RFM建模8. 结论分析报告1. 案例背景某教育公司成立于1999年,早年发展线下职业教育,已做到一定规模,有一定的群众基础。近年,互联网教育火热,公司积极互联网转型。如今,已开设9个方向的大专业,覆盖如今互联网企业的多个热门职业。其主打的大数据开发教育、Java教育、数据分析教育课程销售数量逐年上升,已经开始转亏为盈。该

2021-06-13 20:54:37 711

原创 线下连锁水果店销售数据分析

文章目录1. 案例背景2. 目标3. 问题确认与指标拆解(业务逻辑图)4. 问题解决思路(流程图)5. 整体知识点6. 利用分组分析找到亏损店铺做营销优化,实验验证结论7. 运用对比分析法解决哪类产品销售好的问题8. 利用矩阵关联法找到销量好和利润高的品类1. 案例背景果多吃水果连锁超市是华北地区的热门线下水果超市。该超市覆盖华北5个省份,且在京津冀地区门店超过90家;与其他动辄SKU过百的水果连锁超市相比,公司专供60种热门水果,其中由果多吃自建供应链的具有自主商标的高品质产品在数量上逐年增加,为企业

2021-06-13 20:37:58 5034 3

原创 基于MySQL的电商用户、商品、平台价值分析

文章目录1.项⽬背景2.分析流程3.确认问题4.数据说明5.指标体系建设5.1用户指标体系5.2 商品指标体系5.3 平台指标体系6. 结论6.1 ⽤户分析6.2 ⽤户精细化运营6.3 商品分析6.4 产品功能路径分析附录代码1.项⽬背景随着电商⾏业近⼏年的迅猛发展,电⼦商务从早些年的粗放式经营,逐步转化为精细化运营。随着平台数据量的不断积累,通过数据分析挖掘消费者的潜在需求,消费偏好成为平台运营过程中的重要环节。本项⽬基于某电商平台⽤户⾏为数据,在MySQL关系型数据库,探索⽤户⾏为规律,寻找⾼价值⽤

2021-06-11 16:58:09 505

原创 业务线的各渠道用户、新增用户数据,部分SQL语句代码

-- 本语句为某视频网站公司对于k-pop业务线的各渠道用户、新增用户数据抽取语句with temp_active_hour_table_kps as (select a0.dt ,product_id ,mkey ,substr(FROM_UNIXTIME(st_time),12,2) as hour ,a0.device_idfrom ( select dt ,product_id ,st_time ,device_id from

2021-06-09 10:42:16 336

原创 点线面数据异常分析,鱼骨图找原因

某超市本月付费用户较上月下降了 10%,老板非常担心,希望数据分析团队能够针对该问题进行深入分析,定位到问题所在,如果你是该团队中的一员,接下来你该如何进行分析,请把分析思路及拆解指标进行详细描述和展示。首先,排查数据准确性,确认是否是因为数据错误导致,对容易出现错误的数据进行排查,确认是否取数错误、指标口径不一致等,若没有问题初步可以确认属于数据异常;拉长时间周期,进行纵向分析,判断是否属于周期性或季节性波动,确认是否受季节或淡旺季影响;结合时间周期以及上下游指标进行交叉分析,综合来看数据异常的原

2021-06-09 10:22:43 613

原创 Hadoop环境中使用Hive工具实现电商网站用户运营分析

文章目录一、分析目标二、数据说明三、实现步骤1.建立用户指标体系2.建立分阶段用户标签2.1 按用户行为统计每日的不同阶段用户规模2.2 按周为单位分析最近两周的不同阶段用户的变化2.3 对比分析新用户群体与激活用户群体的人群画像、行为数据特点3、用户复购分析3.1 计算2月1日至4月30日用户的复购情况3.2 对比复购用户和非复购用户的用户画像、行为特点3.3 结合最后一周的分阶段用户标签,分析近期复购用户的用户激活、用户流失的情况4、报告一、分析目标1.搭建日常运营指标体系;2.分析现有用户构成,

2021-06-09 09:41:46 903 1

原创 Hadoop环境中使用Hive实现对产品和用户的数据分析

一、背景某电商平台为了合理的投入人力物力创造更大的销售利润,现对已有的销售数据进行用户分析,提出合理的促销计划。围绕产品和用户两大方面展开为电商平台制定策略提供分析及建议。二、需求用户分析:从性别、年龄、 职业、城市、居住年限,婚姻状况等维度找到高质量用户,并查看高质量用户人群的占比,为其提供高价值消费品 (定位高价值消费品以销售金额评估)。针对其他的用户,主要引导用户进行购买,多推荐一些热销的商品(定位热销产品)产品分析:从销量、销售额都高的产品并以二八法则找到高贡献的一级产品类目三、数据介绍

2021-06-09 09:41:01 1492 18

原创 XPath_爬虫

通过XPath,提取小节名称与以及小节名称对应的链接地址。然后将其保存为excel文件。https://www.runoob.com/html/html-tutorial.htmlimport requestsimport lxml.etree as leimport pandas as pdurl = 'https://www.runoob.com/html/html-tutorial.html'x = '//div[@id="leftcolumn"]/a/text()'y = '//d

2021-06-09 09:39:29 231

原创 pandas_数据分析师招聘数据分析可视化

分析⽬标各城市对数据分析岗位的需求情况不同细分领域对数据分析岗的需求情况数据分析岗位的薪资状况⼯作经验与薪⽔的关系公司都要求什么掌握什么技能岗位的学历要求⾼吗不同规模的企业对⼯资经验的要求以及提供的薪资⽔平数据加载import numpy as npimport pandas as pdjob = pd.read_csv('D:\WORK\STUDY\数据分析\课程资料\阶段五\Pandas数据分析库/lagou2020.csv')job.drop_duplicates(inpl.

2021-06-08 13:08:55 543 1

原创 pandas-体侧成绩数据可视化

高中体测数据转换1、数据加载, pd.read_excel(’./18级高一体测成绩汇总.xls’)默认加载第一个工作表2、数据加载, pd.read_excel(’./18级高一体测成绩汇总.xls’,sheet_name = 1)指定加载第二个工作表import numpy as npimport pandas as pdmale = pd.read_excel('D:\WORK\STUDY\数据分析\作业\阶段五/18级高一体测成绩汇总.xls')female = pd.read_exce

2021-06-08 12:46:04 1934 1

原创 随机数生成6个班3门考试成绩

1 随机数生成六个班的考试成绩,3门考试:Python、数学、语文。每个班50人import numpy as npclbum1 = np.random.randint(0,100,size = (50,3))clbum2 = np.random.randint(0,100,size = (50,3))clbum3 = np.random.randint(0,100,size = (50,3))clbum4 = np.random.randint(0,100,size = (50,3))clb

2021-06-08 12:30:02 1551

原创 便宜蜂销售额SPSS预测

背景介绍:一家新零售连锁便利店“便宜蜂”,凭借其出色的选址分析和精准的算法推荐,通过数据高效驱动门店经营,已经成为近几年营业额增长最快的便利店。便宜蜂为了确定整个集团未来的额增长计划,需要建立一个数据平台,这个平台能够使它可以提前一年预测今后每个月的销售额。数据分析如下: 1:绘制时间序列图 2:观察过去三年销售额时间序列图,总结销售额变化特点和规律过去三年销售额呈季节性变化,秋冬季的销售额普遍高于春夏季的销售额,其中1月份销售额最高、9月份销售额最低。

2021-06-08 11:45:38 1938

原创 半导体封装种类

SO-8TO-3P/247:中高压、大电流MOS常用,产品耐压高,抗击穿能力强。TO-220/220F:F全塑封装,装到散热器上时不必加绝缘垫;220带金属片与中间脚相连,需要加绝缘垫。TO-251:中压、大电流60A以下,高压7N以下环境。TO-92:只有低压MOS(10A以下,耐压60V以下)和高压1N60/65在用,目的是降低成本。TO-252(D-PAK),TO-263(D2PAK):表面贴装。D-PAK:塑封贴片,常用于功率晶体管、稳压芯片的封装。漏极(D)的引脚被剪断不用,而是使用.

2021-06-08 09:02:40 2693

原创 显卡命名规则

N卡命名规则及含义例如:(MSI) GeForce GTX 1050 TiMSI:品牌名GeForce:英伟达核心1050:10表示第十代显卡;5表示市场定位为中端显卡,这个数字越大,显卡越高端;0表示常规显卡,如果为5,则代表升级版Ti:表示加强版,没有Ti的,表示非加强版A卡命名规则及含义例如:RX 570RX:表示高规则系列570:5表示第五代;7表示市场定位,数字越大,显卡越高端;0表示常规版本,如果有其他数字,比如5,则代表升级版从显卡芯片型号中,通常第一个数字代表第几代,第二

2021-06-08 09:02:25 4384

原创 各种符号的英语读法

.period 句号,comma 逗号:colon 冒号;semicolon 分号!exclamation 惊叹号?question mark 问号 ̄hyphen 连字符'apostrophe 省略号;所有格符号dash 破折号‘ ’single quotation marks 单引号“ ”double quotation marks 双引号( )parentheses 圆括号[ ]square brackets 方括号《 》French quotes 法文引号;书名号…elli

2021-06-08 09:00:37 1128

原创 尝试搭建抖音APP指标体系

产品介绍抖音,是一款可以拍短视频的音乐创意短视频社交软件,该软件于2016年9月上线,是一个专注年轻人音乐短视频社区。用户可以通过这款软件选择歌曲,拍摄音乐短视频,形成自己的作品。在2019.01-2020.01这一年间,抖音日活从2.5亿上涨4亿,涨幅达60%。用户类型 与 商业模式用户类型OGC(品牌企业生产内容,可以理解为品牌的官方视频账号):主要发布企业广告(植发,化妆品公司广告)PGC(专业生产内容,主要为名星,网红名人):主要制作专业视频、打造IP、提高影响力UGC(用户生

2021-06-08 08:59:50 2386

原创 某网站首页双12 活动 banner主色调选择

文章目录案例背景1 检验指标的确定2 确定检验统计量3 埋点收集数据4 确定H0,H15 确定显著性水平6 计算样本量7 利用统计工具实现检验案例背景某网站首页双12 活动 banner主色调选择(现提供两个版本的banner),banner 为网站PC端或App 的顶部或底部横向贯穿整个界面的广告条。现需要数据分析师通过ABTest实现对A、B两个不同色调的banner进行择优选择1 检验指标的确定一类指标:人均停留时长二类指标:广告点击率=点击用户数/曝光用户数2 确定

2021-06-08 08:59:26 691

原创 APP线上用户预测

APP线上用户预测现给到北京线上某款视频APP在2018年1月-2018年7月的实际用户数据,需要预测2018年8月-2019年12月的数据,请基于课程中的案例分析,建立分析方案并给到预测的数据结果。*日期**当月实际户数(户)**2018.1*179*2018.2*199*2018.3*330*2018.4*450*2018.5*770*2018.6*821*2018.7*863目标:预测2018年8月-2019年12月的数据

2021-06-08 08:58:50 720 1

转载 Hive装载数据错误

–装载数据load data local inpath ‘/home/hadoop/datas/model2_datas.csv’ overwrite intotable model2_datas装载数据时,出现“指定文件夹目录下没有文件”错误时,就是‘/home/hadoop/datas/’文件中需要上传文件。解决方案:用Xftp方式将本地文件上传至虚拟机中点击如图图标可下载Xftp安装包:连接虚拟机地址并登录,显示如下页面,即可将文件传至对应目录下。Linux使用sz、rz命

2021-06-07 14:46:51 420

转载 Linux简介及常用命令介绍

Linux简介及常用命令介绍

2021-06-07 14:37:54 46

原创 Python规则技巧

变量:字母:a-z,A-Z数字:0-9符号:_数字不能作为变量名的开头,变量名区分大小写四个空格为一个缩进,tap键亦可0,None,空字符串转换成布尔值后为False命名:下划线连接:person_age=25驼峰式:newUserName避免使用关键字命名命名技巧:1) a=b=c=12) a,b,c=1,2,33) a=1,b=2 >>>a,b=b,a >>>print(a,b)>>2,1删除变量:del 变量数据类型(

2021-06-07 14:27:12 86 1

原创 Python初学代码小例子

文章目录实例001:数字组合实例002:“个税计算”实例003:完全平方数实例004:这天第几天实例005:三数排序实例006:斐波那契数列实例007:copy实例008:九九乘法表实例009:暂停一秒输出实例010:给人看的时间实例011:养兔子实例012:100到200的素数实例013:所有水仙花数实例014:分解质因数实例015:分数归档实例016:输出日期实例017:字符串构成实例018:复读机相加实例019:完数实例020:高空抛物实例021:猴子偷桃实例022:比赛对手实例023:画菱形实例02

2021-06-07 14:21:21 634

原创 Python代码书写规范与基本使用

Q:代码等于号两边要不要空格,有影响吗A:没有影响,要习惯空格,这样更加规范美观,有辨识度,如:a = 0b = input(‘输入你的问题’)Q:单引号、双引号、三引号的区别A:正常使用单引号和双引号都是可以的,三引号表达的是换行字符串,会将引号内的所有内容打印出来,如:print(’’‘你好啊天气真好’’’)Q:直接输入了内容不能够运行,如直接输入 你好啊,天气真好,点击运行,结果报错A:python代码是需要有执行的,你好啊,天气真好并不是一个执行操作Q:代码一直运行中A:检查一

2021-06-07 13:40:33 122

原创 Excel文件tips

创建多级目录:按[WIN+R],输入CMD,回车. 输入[MD 目录1\目录2\目录3\目录4],回车。后缀.bat属于批处理文件隐藏文件选中文件–右键属性–勾选隐藏–确定–组织–文件夹和搜索选项–查看–勾选“不显示隐藏文件、文件夹、或驱动”聚光灯效果• 第一步:选取区域 - 开始 - 条件格式 - 新建规则 - 使用公式… - 输入以下公式:=OR(CELL(“row”)=ROW(),CELL(“col”)=COLUMN())再点击格式按钮,设置字体颜色为白色,填充色为绿色• ..

2021-06-07 13:34:50 648

原创 Excel日期tips

拆分日期:A2=B2+C2B2公式=int(A2) C2公式=A2-B2计算间隔时间:小时=(结束时间-开始时间)*24;分钟=(结束时间-开始时间)*1440将不规范的日期转换=–TEXT(B2,"#-00-00")或=TEXT(B2,"#-00-00)*1=–SUBSTITUTE(A2,".","/") 并将单元格设为日期...

2021-06-07 11:30:17 107

原创 Excel行列tips

快速填充行列列=CHAR(ROW(A65))行=CHAR(65+COLUMN(A1)-1) # 字母A的数字代码是65; # CHAR()将代码返回对应的字符;隔行填充=MOD(ROW(),2)=1隐藏行列隐藏行 Ctrl+9 隐藏列 Ctrl+0显示行 Ctrl+Shift+9 显示列 Ctrl+shift+0固定行数a. =INT(ROW(A7)/7)将以上数据粘贴为数值,再分类汇总,选中每组数据分页...

2021-06-07 11:28:54 134

原创 Excel数据tips

有错误值的求和a. =SUM(IFERROR(待处理数据,数据为错误时返回的结果)) # 第一参数引用的是单元格区域,就会得到一组数字,所以在使用SUM函数进行求和时需同时按住Ctrl+Shift+回车。b. =SUMIF(条件区域,条件,求和区域) # 当条件区域与求和区域一致时,求和区域可不写,例如:=SUMIF(C2:C18,">0");当数据不全是>0的数,要用=SUMIF(C2:C18,"<9e307) 注:9e307几乎是Excel能接受的最大值了。c. ..

2021-06-07 11:26:42 94

原创 Excel单元格tips

字符提取=TRIM(MID(SUBSTITUTE($A2,",",REPT(" ",99)),COLUMN(B1)*99,99))# SUBSTITUTE(在哪替换,替换什么,换成什么,换第几个),例如:SUBSTITUTE($A2,",","-",3)把A2单元格的第三个逗号换成“-”;# REPT(要重复的字符,重复次数);# MID(要提取的数据,从什么位置开始取,取第几个字);# COLUMN(B1)*99作为提取位置;# TRIM()去掉字符串中多余的空格。自定义单元格格式..

2021-06-07 11:23:25 220

sql查询左连接on与where的区别(2).pdf

sql查询左连接on与where的区别(2).pdf

2021-06-07

linux服务器常规教程.pdf

linux服务器常规教程.pdf

2021-06-07

PPT办公模板.rar

PPT办公模板.rar

2021-06-07

Excel图表模板(共计230+).rar

Excel图表模板(共计230+).rar

2021-06-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除