Ancky_W
码龄5年
关注
提问 私信
  • 博客:70,434
    70,434
    总访问量
  • 13
    原创
  • 653,860
    排名
  • 28
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2020-04-30
博客简介:

m0_47478595的博客

查看详细资料
个人成就
  • 获得61次点赞
  • 内容获得5次评论
  • 获得458次收藏
  • 代码片获得218次分享
创作历程
  • 13篇
    2020年
成就勋章
TA的专栏
  • 笔记
    3篇
  • 数据、运营
    4篇
创作活动更多

HarmonyOS开发者社区有奖征文来啦!

用文字记录下您与HarmonyOS的故事。参与活动,还有机会赢奖,快来加入我们吧!

0人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

机器学习实战02:Kaggle - House Price Prediction Top 4%

一、模块导入import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as snsimport warningsimport oswarnings.filterwarnings('ignore')%matplotlib inlineplt.style.use('ggplot')from sklearn.base import BaseEstimator, TransformerMi
原创
发布博客 2020.08.06 ·
1130 阅读 ·
0 点赞 ·
0 评论 ·
6 收藏

数据、运营相关案例问答题(一)【牛客网:数据分析试题广场】

试题来源:牛客网回答仅代表个人看法,欢迎交流评论留言,有不正确的地方请多指教~~1、某APP 7月份DAU比同年5月份上涨了10%,作为数据分析师,你会从哪些方面分析DAU增长的原因? 请列举至少两种以上拆分思路。step1:确定数据是否存在异常:基于历史数据,利用移动平均等预测方法,预测7月DAU数值,与2-3倍标准差做对比,判断实际数值是否处于正常范围。(也就是判断DAU上涨10%这是一个趋势,还是一个问题,是长期因素导致的,还是短期内社会事件等因素导致的。)step2:拆分数据维度:人群拆分
原创
发布博客 2020.07.06 ·
3672 阅读 ·
3 点赞 ·
1 评论 ·
43 收藏

数据、运营相关试题(三)【牛客网:数据运营试题广场】

试题来源:牛客网(三)比先前的(一)和(二)更接近数据、运营相关试题嗷~1、一个新的产品在推广中最关注的的推广数据指标是哪个( )选项:A.注册量;B.购买率;C.复购率;D.客单价答案:A解析:新的产品,推广初期,最关注的是“获取用户”2、降低采购成本的最高境界是( )选项:A.通过谈判降低采购成本;B.通过价格折扣降低采购成本;C.通过供应商早期参与产品开发降低成本;D.通过招标的方式降低成本答案:C解析:三流采购杀价(外部压榨)、二流采购议价(内部降低)、一流采购算成本(供应链)
原创
发布博客 2020.07.06 ·
3152 阅读 ·
1 点赞 ·
0 评论 ·
9 收藏

数据、运营相关试题(二)【牛客网:京东2019春招产品运营类试卷】

试题来源:牛客网试题答案仅供参考。其中前半部分偏向产品运营类试题,后半部分偏向综合测试类试题。1、以下属于互联网产品运营的范畴的是()选项:A.内容运营;B.用户运营;C.社区运营;D.其他选项都是答案:D2、产品运营时,可以按照标签记录,把体验产品按照大类进行划分的工具是 ()选项:A.Evernote;B.OmniPlan;C.PhotoShop;D.OmniOutliner答案:A解析:Evernote 印象笔记,可以按照标签进行分类;OmniPlan 项目管理工具;Photosh
原创
发布博客 2020.07.06 ·
11894 阅读 ·
6 点赞 ·
0 评论 ·
25 收藏

数据、运营相关试题(一)【牛客网:京东2019春招商务与运营类试卷】

试题来源:牛客网试题答案仅供参考。其中前半部分偏向商务类试题,后半部分偏向运营类试题。1、京东大规模建设物流体系使得易迅、苏宁易购等其他竞争对手跟进投入,这充分表明( )是电商企业的核心竞争力之一,同时也是消费者能直接感受到的体验。选项:A. 仓储管理;B.流通加工;C.信息处理;D.物流配送答案:D2、下列( )使得电子商务的表现形式和商业路径发生根本性的转变,将线上和线下从原来的相对独立、相互冲突逐渐转化为互为促进、彼此融合,依托互联网,通过运用大数据、人工智能等先进技术手段实现商品的销售。
原创
发布博客 2020.07.06 ·
5360 阅读 ·
0 点赞 ·
0 评论 ·
5 收藏

阿里天池:淘宝用户行为分析项目

数据来源:阿里天池 - 淘宝用户商品行为数据(在这里仅选用表名为 “tianchi_mobile_recommend_train_user” 中的数据,用作淘宝用户行为分析)一、项目背景本数据分析报告,以阿里天池的淘宝平台交易数据集为基础,通过行业指标对淘宝用户行为进行分析,从而探索电商行业用户行为模式,并提出优化建议。具体指标包括:PV、UV、付费率、复购率、漏斗流失分析、用户价值RFM分析等。具体分析方法:多维度拆解分析、对比分析、假设检验、复合指标分析等。二、数据概览表名:tianc
原创
发布博客 2020.06.28 ·
6961 阅读 ·
4 点赞 ·
2 评论 ·
51 收藏

用户画像体系与构建方法概述

既是概述,也是笔记,持续更新 ~参考文章:1、用户画像的技术和方法论2、用户画像是怎么生成出来的?3、用户画像:User persona 和 User profile4、 终于有人把用户画像(客户画像和市场细分)的流程、方法讲明白了5、用户行为分析与用户画像(下)一、用户画像的诞生背景1.1 行业背景?在互联网逐渐步入大数据时代后,用户的所有行为在企业面前几乎都是可视的。深入挖掘用户数据的潜在商业价值,利用大数据为企业进行人、货、场的精准布局,用户画像的概念也就应运而生。1.2 互联网公
原创
发布博客 2020.06.21 ·
2559 阅读 ·
1 点赞 ·
0 评论 ·
13 收藏

阿里天池:母婴用品电商数据分析(Power BI 可视化)

本项目数据来源:阿里天池数据集数据概览: 本数据为2012年7月2日至2015年2月5日发生在淘宝天猫交易平台关于婴幼儿商品的交易数据,数据集包含两个表格:(sample)sam_tianchi_mum_baby(base 表):包含用户ID、儿童出生日期、儿童性别的基本信息(sample)sam_tianchi_mum_baby_trade_history(trade 表):包含用户ID、类别ID、购买数量、购买时间、商品ID及属性等信息分析目的: 分析既往数据表现,寻找优化切入点,并针
原创
发布博客 2020.06.17 ·
4227 阅读 ·
8 点赞 ·
1 评论 ·
80 收藏

三种数据标准化方法的对比:StandardScaler、MinMaxScaler、RobustScaler

一、数据标准化 / 归一化的作用提升模型精度:标准化 / 归一化使不同维度的特征在数值上更具比较性,提高分类器的准确性。提升收敛速度:对于线性模型,数据归一化使梯度下降过程更加平缓,更易正确的收敛到最优解。二、标准差标准化 StandardScalerfrom sklearn.preprocessing import StandardScaler使用均值与方差,对服从正态分布的数据处理,得到符合标准正态分布的数据处理方法:标准化数据减去均值,然后除以标准差,经过处理后数据符合标准正态分
原创
发布博客 2020.05.28 ·
24988 阅读 ·
29 点赞 ·
1 评论 ·
179 收藏

pd.cut() 与 pd.qcut() 的对比及示例

1、pd.cut()用于将数据值按照值本身进行分段并排序到 bins 中。参数包含:x, bins, right, include_lowest, labels, retbins, precisionx :被划分的数组bins :被划分的区间/区间数- ① 当 bins 为整数时,表示数组 x 被划分为多少个等间距的区间;- ② 当 bins 为序列时,表示数组 x 将被划分在该指定序列中,若不在则输出 NaN;# x = [1,2,3,5,3,4,1], bins = 3[In ]
原创
发布博客 2020.05.27 ·
3420 阅读 ·
6 点赞 ·
0 评论 ·
34 收藏

集成学习:对比 Boosting & Bagging、Stacking

1、集成学习(Emsemble Learning)通过构建并结合多个学习器来完成学习任务,有时也被称为多分类器系统(Multi-classifier System)通俗说法:先产生一组“个体学习器”,再用某种策略将它们结合。作用:通过结合多个学习器,通常可获得比单一学习器显著优越的泛化性能。分类:① 侧重于得到个体学习器(Boosting & Bagging) ② 侧重于结合个体学习器(Stacking)2、Boosting & BaggingBoosting &
原创
发布博客 2020.05.25 ·
1017 阅读 ·
1 点赞 ·
0 评论 ·
8 收藏

机器学习实战01:Kaggle - Titanic: Machine Learning from Disaster Top 9%

1. 数据导入import numpy as npimport pandas as pdimport matplotlib.pyplot as plttrain = pd.read_csv('train.csv',index_col = 'PassengerId')test = pd.read_csv('test.csv',index_col = 'PassengerId')combined_train_test = pd.concat([train,test],axis=0)2. 缺失值
原创
发布博客 2020.05.20 ·
640 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

吴恩达机器学习入门课程练习题1 的 Python实现注意事项

使用 Jupyter Notebook 作为 Python 编辑与实现环境使用 Jupyter Notebook 作为 Python 编辑与实现环境01 安装包下载功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTe...
原创
发布博客 2020.05.06 ·
604 阅读 ·
2 点赞 ·
0 评论 ·
6 收藏