自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 根据业务需求建立数据指标(案例)

背景以下案例是在真实产品的基础上进行的虚构,仅提供思路。最近某公司近期发布了一款为营销工作者提供行业数据的新产品,主要面向企业的市场部门进行销售。这款产品内测的口碑十分不错,但是实际的销量却一直很不理想。所以产品部与销售部找到数据分析组,希望能帮助公司分析出销量不达预期的原因呢。销量不理想是一个复杂的命题。因为产品从被曝光到最终被购买,需要经历很长的路径。例如我们需要思考,他们到底要解决什么问题?这个问题涉及哪一类的业务板块?业务的流程是什么?为什么这些指标对解决这个问题有用?是否有判断问题是否被解

2021-01-18 12:42:40 873

原创 A/B test 的设计与分析(1)

背景介绍A/B test可以帮助你,通过不断尝试对产品采取一些改变,判断分析哪些改变更受用户青睐,以此来科学地决策如何优化你的网页或者APP。 A/B testing is a general methodology used online when you want to test out a product or a feature. 互联网常用的测试产品的方法 You are gonna take 2 sets of users. Show one set, your contro

2021-01-03 13:37:24 953

转载 如何建立一套指标分析体系,满足各个业务线的需求

目录背景如何使用该增长策略呢背景对于一个数据分析师而言,业务面试中经常会被问到,你会如何建立一套指标分析体系,从而满足各个业务线的需求。这个问题其实是考察你是否熟悉著名的增长黑客式产品营销和管理的方法,名叫AARRR模型,它已成为互联网行业的增长利器。本文仅仅是将以下内容做了一个总结与转述,权当做了一次记忆练习。参考链接但在现在看来,AARRR已是过去式,而RARRA才是更好的增长黑客模型。但在了解RARRA模型前,我们也需要了解最基础的AARRR模型是什么。AARRR代表:用户拉新 Acqui

2020-10-08 11:05:14 423

原创 作为数据分析师,如何评估活动效果

目录背景如何定义评判二字活动评估关键问题从0建立评估模型的做法第一步 梳理活动流程第二步 筛选主指标第三步 设定判定标准第四步 找到影响结果的过程背景正式工作已经十个月了,相较于现在的工作,我个人还是比较喜欢产品线下的数据分析岗,与业务较为贴近,所以近期也计划抽时间看看美国这边比较著名的StellarPeers专门为产品经理建立的面经网站和人人都是产品经理,补充一下跟业务相关的产品分析知识。本篇这片文章的主题是:如何评估活动效果?这一类型的问题是数据分析师面试中常见的case study。从目标到活

2020-10-07 12:30:16 1653 2

原创 将Excel文档导入MySQL数据库,以及所遇到的导入权限问题

目录背景准备工作 - 启动MySQL问题 - 无法使用LOAD DATA (LOCAL) INFILE 语句问题 - 解决:卸载MySQL,重新安装MySQL installer背景大概已经有半年没用SQL了,最近因为一些契机又重新下载了MySQL Server并且第一次接触到需要将Excel文档导入MySQL数据库的需求。但在实施的过程中,总是遇到各种各样导入失败的问题,折腾了一个晚上才得以解决,也想趁机总结下我所遇到的主要问题以及解决方法,希望可以帮助到拥有同样困惑的小伙伴们。(以下代码版本为WIN

2020-06-04 12:27:48 1193

原创 多元线性回归和广义线性回归 (2)— 广告投放金额预估

目录背景实例介绍建模流程背景在博文 多元线性回归和广义线性回归 (1)中我们有聊到多元线性回归模型的拟合思路以及模型求解的过程。但上一篇博文还未解答如何评估模型的好坏。在这篇博文中,我将通过一个简单的实例记录一下回归模型的建立流程以及常用的模型评估方法。实例介绍如今许多广告运营的团队每年都会向公司申请定额的营销预算,这些预算一部分会分配给传统营销渠道,例如电视,商业广告等,也有一部分资金会...

2020-05-18 13:25:58 1573

原创 利用python的交叉表功能展现用户调研结果

目录背景调查问卷的目的交叉表的使用展现形式重要指标的细分假设检验的引入利用Python生成交叉表获得原始数据表格生成逻辑图代码示例结果分析小结背景现如今,社交媒体已成为各大品牌商公认的重要营销渠道。品牌商们除了在各类社交平台建立自己的营销账号外,每年还会花费数以亿计的资金与知名的媒体节目,明星,自媒体们合作。虽然相较于传统营销渠道,社交媒体透过流量的红利有着低成本高触达的优点,但高度密集的营销...

2020-04-27 13:03:24 934

原创 多元线性回归和广义线性回归 (1)

目录背景多元线性回归常规公式拟合思路最小二乘法的推导将自变量系数与自变量整合为矩阵模拟过程存在误差项误差项符合高斯分布最大似然函数的引入自变量系数的估值求解评估β的估值是否合理背景线性回归模型的建立是为了探究因变量与多个自变量间的关系。举个例子,你想去银行贷款,在贷款前你想知道你大概能贷到多少钱,以便为后期经济开销做进一步规划。那如果此刻有一个贷款预测模型可以使用,这个问题就可以得到快速的解决...

2020-04-21 00:05:51 4500

原创 如何使用API爬取数据,它和网页爬虫有什么区别?

目录背景API简介库API数据API简单的API爬虫实例Facebook Graph API 介绍文档代码示例背景很多互联网公司往往都有着存储自己用户信息的数据库,数据库里的数据也基本被工程部门解析得很干净了(爬虫技术的使用或底层数据解析主要是开发部门或者数据采集工程部的工作),所以许多业务类的数据分析师们仅使用HSQL等工具就能较轻松地获得所需的海量数据。但市面上还有一些中小型B2B公司,...

2020-04-14 09:51:28 14333 1

原创 python词云分析--媒体近期的讨论热点

目录背景词云的定义词云的创建词云分析背景中国,美国,欧洲乃至全世界,近期都在经历一场紧张的战役,经济和民众的身体健康都被疫情至于危险之中。为了缓解疫情的冲击,越来越多的人加入了“ I quarantine for my family” 的行列,社交媒体也展现了其前所未有的潜力。据社交媒体研究机构Shareablee统计的数据显示,在美国,社交媒体已经超过网络搜索,成为人们消遣和了解疫情的首要...

2020-04-06 10:25:53 5217

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除