自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 阿里天池:淘宝用户行为分析项目

数据来源:阿里天池 - 淘宝用户商品行为数据(在这里仅选用表名为 “tianchi_mobile_recommend_train_user” 中的数据,用作淘宝用户行为分析)一、项目背景本数据分析报告,以阿里天池的淘宝平台交易数据集为基础,通过行业指标对淘宝用户行为进行分析,从而探索电商行业用户行为模式,并提出优化建议。具体指标包括:PV、UV、付费率、复购率、漏斗流失分析、用户价值RFM分析等。具体分析方法:多维度拆解分析、对比分析、假设检验、复合指标分析等。二、数据概览表名:tianc

2020-06-28 14:44:08 6872 2

原创 机器学习实战02:Kaggle - House Price Prediction Top 4%

一、模块导入import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsimport warningsimport oswarnings.filterwarnings('ignore')%matplotlib inlineplt.style.use('ggplot')from sklearn.base import BaseEstimator, TransformerMi

2020-08-06 16:43:35 1091

原创 数据、运营相关案例问答题(一)【牛客网:数据分析试题广场】

试题来源:牛客网回答仅代表个人看法,欢迎交流评论留言,有不正确的地方请多指教~~1、某APP 7月份DAU比同年5月份上涨了10%,作为数据分析师,你会从哪些方面分析DAU增长的原因? 请列举至少两种以上拆分思路。step1:确定数据是否存在异常:基于历史数据,利用移动平均等预测方法,预测7月DAU数值,与2-3倍标准差做对比,判断实际数值是否处于正常范围。(也就是判断DAU上涨10%这是一个趋势,还是一个问题,是长期因素导致的,还是短期内社会事件等因素导致的。)step2:拆分数据维度:人群拆分

2020-07-06 18:46:50 3543 1

原创 数据、运营相关试题(三)【牛客网:数据运营试题广场】

试题来源:牛客网(三)比先前的(一)和(二)更接近数据、运营相关试题嗷~1、一个新的产品在推广中最关注的的推广数据指标是哪个( )选项:A.注册量;B.购买率;C.复购率;D.客单价答案:A解析:新的产品,推广初期,最关注的是“获取用户”2、降低采购成本的最高境界是( )选项:A.通过谈判降低采购成本;B.通过价格折扣降低采购成本;C.通过供应商早期参与产品开发降低成本;D.通过招标的方式降低成本答案:C解析:三流采购杀价(外部压榨)、二流采购议价(内部降低)、一流采购算成本(供应链)

2020-07-06 18:39:21 3099

原创 数据、运营相关试题(二)【牛客网:京东2019春招产品运营类试卷】

试题来源:牛客网试题答案仅供参考。其中前半部分偏向产品运营类试题,后半部分偏向综合测试类试题。1、以下属于互联网产品运营的范畴的是()选项:A.内容运营;B.用户运营;C.社区运营;D.其他选项都是答案:D2、产品运营时,可以按照标签记录,把体验产品按照大类进行划分的工具是 ()选项:A.Evernote;B.OmniPlan;C.PhotoShop;D.OmniOutliner答案:A解析:Evernote 印象笔记,可以按照标签进行分类;OmniPlan 项目管理工具;Photosh

2020-07-06 18:35:14 11789

原创 数据、运营相关试题(一)【牛客网:京东2019春招商务与运营类试卷】

试题来源:牛客网试题答案仅供参考。其中前半部分偏向商务类试题,后半部分偏向运营类试题。1、京东大规模建设物流体系使得易迅、苏宁易购等其他竞争对手跟进投入,这充分表明( )是电商企业的核心竞争力之一,同时也是消费者能直接感受到的体验。选项:A. 仓储管理;B.流通加工;C.信息处理;D.物流配送答案:D2、下列( )使得电子商务的表现形式和商业路径发生根本性的转变,将线上和线下从原来的相对独立、相互冲突逐渐转化为互为促进、彼此融合,依托互联网,通过运用大数据、人工智能等先进技术手段实现商品的销售。

2020-07-06 18:30:34 5205

原创 用户画像体系与构建方法概述

既是概述,也是笔记,持续更新 ~参考文章:1、用户画像的技术和方法论2、用户画像是怎么生成出来的?3、用户画像:User persona 和 User profile4、 终于有人把用户画像(客户画像和市场细分)的流程、方法讲明白了5、用户行为分析与用户画像(下)一、用户画像的诞生背景1.1 行业背景?在互联网逐渐步入大数据时代后,用户的所有行为在企业面前几乎都是可视的。深入挖掘用户数据的潜在商业价值,利用大数据为企业进行人、货、场的精准布局,用户画像的概念也就应运而生。1.2 互联网公

2020-06-21 15:39:14 2431

原创 阿里天池:母婴用品电商数据分析(Power BI 可视化)

本项目数据来源:阿里天池数据集数据概览: 本数据为2012年7月2日至2015年2月5日发生在淘宝天猫交易平台关于婴幼儿商品的交易数据,数据集包含两个表格:(sample)sam_tianchi_mum_baby(base 表):包含用户ID、儿童出生日期、儿童性别的基本信息(sample)sam_tianchi_mum_baby_trade_history(trade 表):包含用户ID、类别ID、购买数量、购买时间、商品ID及属性等信息分析目的: 分析既往数据表现,寻找优化切入点,并针

2020-06-17 21:42:38 4071 1

原创 三种数据标准化方法的对比:StandardScaler、MinMaxScaler、RobustScaler

一、数据标准化 / 归一化的作用提升模型精度:标准化 / 归一化使不同维度的特征在数值上更具比较性,提高分类器的准确性。提升收敛速度:对于线性模型,数据归一化使梯度下降过程更加平缓,更易正确的收敛到最优解。二、标准差标准化 StandardScalerfrom sklearn.preprocessing import StandardScaler使用均值与方差,对服从正态分布的数据处理,得到符合标准正态分布的数据处理方法:标准化数据减去均值,然后除以标准差,经过处理后数据符合标准正态分

2020-05-28 14:56:03 24400 1

原创 pd.cut() 与 pd.qcut() 的对比及示例

1、pd.cut()用于将数据值按照值本身进行分段并排序到 bins 中。参数包含:x, bins, right, include_lowest, labels, retbins, precisionx :被划分的数组bins :被划分的区间/区间数- ① 当 bins 为整数时,表示数组 x 被划分为多少个等间距的区间;- ② 当 bins 为序列时,表示数组 x 将被划分在该指定序列中,若不在则输出 NaN;# x = [1,2,3,5,3,4,1], bins = 3[In ]

2020-05-27 17:40:05 3313

原创 集成学习:对比 Boosting & Bagging、Stacking

1、集成学习(Emsemble Learning)通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统(Multi-classifier System)通俗说法:先产生一组“个体学习器”,再用某种策略将它们结合。作用:通过结合多个学习器,通常可获得比单一学习器显著优越的泛化性能。分类:① 侧重于得到个体学习器(Boosting & Bagging) ② 侧重于结合个体学习器(Stacking)2、Boosting & BaggingBoosting &

2020-05-25 20:12:11 970

原创 机器学习实战01:Kaggle - Titanic: Machine Learning from Disaster Top 9%

1. 数据导入import numpy as npimport pandas as pdimport matplotlib.pyplot as plttrain = pd.read_csv('train.csv',index_col = 'PassengerId')test = pd.read_csv('test.csv',index_col = 'PassengerId')combined_train_test = pd.concat([train,test],axis=0)2. 缺失值

2020-05-20 20:14:04 614

原创 吴恩达机器学习入门课程练习题1 的 Python实现注意事项

使用 Jupyter Notebook 作为 Python 编辑与实现环境使用 Jupyter Notebook 作为 Python 编辑与实现环境01 安装包下载功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTe...

2020-05-06 18:23:17 581

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除