自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 销售数据用户行为分析及RFM模型

在这里插入图片描述在这里插入图片描述![在这里插入图片描述](https://img-blog.csdnimg.cn/20200727223344131.JPG?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2phY2t3YW5nMTc4MA==,size_16,color_FFF...

2020-07-27 22:38:44 444

原创 流量分析:如何分析数据的波动?

流量分析。内容分为四部分:背景;渠道分析;转化与价值分析;流量波动逻辑性分析。背景建立产品指标体系和报表之后,分析师和业务方最重要的事情就是每天看各种数据,而这个看数据的过程就是流量分析。这里的流量指广义的流量,并不一定单指日活。它是指所有的流量,比如用户从哪儿来,经过什么过程,产生什么价值,如果流量波动了,为何波动。从流量分析的定义来看,可以分为以下四部分:渠道分析——从哪来;转化分析——经过什么过程;价值分析——产生什么价值;波动分析——日常的监控分析。

2020-08-02 16:00:08 5832

原创 爬取Python100例

#------------------------爬取python100例-方法一-函数式编程-----------------# # http://www.runoob.com/python/python-100-examples.html# import requests# import re# from lxml import etree# def get_html(url):# try:# headers = {'User-Agent': 'Mozilla/5.

2020-08-01 21:12:28 659

原创 爬取博客园帖子名和对应内容

#博客园:https://www.cnblogs.com/爬取帖子名 和 对应内容(图片可以跳过)#获取每页链接的模块n=1headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.87 Safari/537.36'}for k in range(200): try: print('正在爬取第%s

2020-08-01 21:10:00 333

原创 指标体系搭建:指标体系的经典四步

指标体系的定义及选取原则实际工作过程会出现令人不悦的两种情况。第一种是对于某核心数据,如日活,只知道数据在变化,但是不知道为何变化,特别是处于一个较大跌幅时,产品为了解释这种现象,就会向数据分析师要各种维度的数据。比如,年底汇报时,产品跟数据要各种各样的数据,要了之后发现跟现有数据对不上,数据内部要花费大量时间对各种各样的口径。第二种情况是每隔一段时间,产品都会拉上数据、研发一起对埋点,总是觉得当前的字段不够用,底层日志越来越大,数仓修改的也越来越多,取数越来越慢,错误越来越多。这两种情况的根本原因都

2020-08-01 15:23:11 5629

转载 在线教育行业和产品数据分析报告

本篇文章分为两大部分:第一部分为行业分析,简单介绍了K12在线教育行业的整体情况,有助于了解K12在线教育的背景(包括:K12行业背景、K12在线教育概况、目标人群和场景分析);第二部分为产品分析,包括答疑类、工具类、家教类、辅导类、题库类五类产品。目录:第一部分:行业报告一、K12教...

2020-07-31 13:51:05 4657 1

转载 在线教育网站数据分析——搭建指标体系

接触了很多的在线教育的客户之后发现,在线这个领域市场竞争已经呈现白热化的态势。在线教育的品牌方数字化发展没那么快,但是他们都意识到了互联网战场必须占领,所以医疗和在线教育每年在线上投入的营销费用很高,一个中型的公司,上千万级比较平常,获客成本已经上万,光注册成本就可能几百元,不过市场空间也的确是足够大。为什么在线教育获客成本会这么高?客单价和用户生命周期价值越高,企业越愿意付出市场成本来获客,在线教育的客单价相对而言是常见行业里较高的,而且一旦成为客户就会产生很高的生命周期总价值,产品连续售卖要相对简单

2020-07-31 13:47:20 1502

原创 数据分析AB-Test

import pandas as pdimport numpy as npimport randomimport matplotlib.pyplot as plt%matplotlib inline#We are setting the seed to assure you get the same answers on quizzes as we set uprandom.seed(42)df=pd.read_csv(r'D:\数据分析\ABTEST\ab_data.csv')df.he

2020-07-30 22:27:10 498

原创 机器学习:预测功率和电流之间的关系,并画图展示

导入模块 最小二乘法线性回归from sklearn.model_selection import train_test_split #划分数据集from sklearn.linear_model import LinearRegression #最小二乘法from sklearn.preprocessing import StandardScaler #标准化import numpy as npimport matplotlib as mplimport matplotlib

2020-07-30 22:19:45 651

原创 百度贴吧图片批量爬取

函数式编程import requestsimport reimport timedef get_html(url): # 请求网页,获得服务器响应内容 headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:75.0) Gecko/20100101 Firefox/75.0'} response = requests.get(url, headers=headers) return re

2020-07-30 22:13:27 205

原创 爬取百思不得姐段子图片

#爬虫http://www.budejie.com/需求: 得到的段子的图片(图片的名字用段子的标题)headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.87 Safari/537.36'}url = 'http://www.budejie.com/'response=requests.get(url,header

2020-07-30 22:11:22 779

原创 笑话大全内容爬取

完成对笑话大全http://xiaohua.zol.com.cn中所有笑话内容的爬取,并保存在mysql或mongodb中#要求字段至少包括笑话分类,笑话来源,笑话标题,笑话内容,笑话urlimport re,time,randomimport requestsimport pymysqlfrom lxml import etreeheaders={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KH

2020-07-30 22:07:35 381

原创 网易云音乐批量下载python

# #批量下载import requestsfrom lxml import etreeurl='https://music.163.com/discover/toplist?id=3779629' #注意要去掉#headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.87 Safari/537.36'}respon

2020-07-30 22:05:08 485 1

原创 51job岗位信息爬虫及词云技能图

爬取51job职位名称,公司名称,公司地址,最低工资,最高工资,发布时间import re,time,randomimport requestsimport pymysqlfrom lxml import etreeimport pandas as pdimport numpy as npfrom multiprocessing import Pooldef get_html(url): try: headers = {'User-Agent': 'Mozilla/5

2020-07-30 22:02:12 942

原创 电信客户流失分析与预测

一、项目背景近年来,不论是传统行业还是互联网行业,都面临着用户流失问题。研究表明,企业可以在一周内失去100个用户,而同时又得到另外一个用户,从表明上来看业绩没有受到任何影响,而实际上争取这些新用户所花费的宣传、促销等成本显然要比保持老用户昂贵的多,从企业投资回报程度的角度来看是非常不经济的。维护好老用户的重要性主要体现在以下四个方面:留住老用户可使企业的竞争更长久。留住老用户还会使成本大幅度降低。留住老用户,还会大大有利于发展新用户。用户口碑效应,如果1个满意的用户引发8笔潜在的生意,那么其中至

2020-07-29 22:52:06 7762 3

原创 泰坦尼克号生存情况预测

kaggle链接:https://www.kaggle.com/c/titanic一、比赛描述RMS泰坦尼克号沉没是历史上最臭名昭着的沉船之一。1912年4月15日,在她的处女航中,泰坦尼克号在与冰山相撞后沉没,在2224名乘客和机组人员中造成1502人死亡。这场耸人听闻的悲剧震惊了国际社会,并为船舶制定了更好的安全规定。造成海难失事的原因之一是乘客和机组人员没有足够的救生艇。尽管幸存下沉有一些幸运因素,但有些人比其他人更容易生存,例如妇女,儿童和上流社会。在这个挑战中,我们要求您完成对哪些人可能存

2020-07-28 19:56:01 941

转载 数据分析之埋点方案

一、前言 大数据应用一般会有采集、加工、存储、计算及可视化这几个环节。其中采集做为源头,在确保全面、准确、及时的前提下,最终加工出来的指标结果才是有价值的。而埋点作为一种重要的采集手段,可以将用户行为信息转化为数据资产,为产品分析、业务决策、广告推荐等提供可靠的流量数据支持。在业务需求少的情况下,可以运用一些简单的方法...

2020-07-28 19:20:48 3757

转载 数据分析师之路-数据埋点

作为一名数据分析师,数据分析是一个基本能力,在各大学习社群和论坛,经常会遇到各种各样类似的问题和数据分析的教程贴。数据分析是一个很复杂的工作,很多人在谈如何挖掘数据,做用户画像,设计数据漏斗,如何负责用户生命周期管理,但发现很多人却卡在了数据分析的第一步,那就是如何做数据埋点。通过学习,我了解到一些关于数据埋点的知识,以APP为例。...

2020-07-28 19:17:05 765

转载 手把手教你进行APP数据埋点

经过大半年的努力,产品终于开始趋向稳定,之前的版本一直在探索,需求经常改动,没时间系统进行埋点。随着产品的稳定以及工作的深入,越发认识到数据的重要性,所以开始着手数据埋点相关事项。这次亲历了产品(APP)从零开始进行数据埋点的过程,分享出来给大家,看看一个完整的APP数据埋点流程是怎样的。接下来将从这几个方面进行阐述一、什么是数据埋点二、数据埋点具体应用三、数据埋点的步骤四、注意事项一、什么是数据埋点数据埋点让产品或运营等相关人员能按照具体的需求,定制性地统计较为复杂的用户数据。例如想要追...

2020-07-28 18:59:18 4093 1

原创 员工离职率建模分析

2020-07-28 08:02:14 2134

原创 淘宝网站用户行为分析

2020-07-28 07:55:02 195

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除