自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

YYIverson的博客

每天都要进步一点点!

  • 博客(80)
  • 资源 (1)
  • 收藏
  • 关注

原创 【数据分析】指标相关

数据指标体系客户画像维度

2020-07-08 15:02:14 713

转载 【数据分析】费米问题

转载自:https://mp.weixin.qq.com/s/gEHs2MWgBFn70StSmJD2tQ怎样估算北京市餐馆的数量?怎样估算深圳市学生的数量?怎样估算上海市理发师的数量?这类面试题也叫费米问题,常见于校招产品经理、数据分析师等岗位招聘面试中当面试官考察这类问题时,并不是希望获得一个准确的数字(其实面试官也不知道真实答案是多少),那么面试官究竟在考察哪些...

2020-04-14 21:07:06 2119

转载 SQL窗口函数篇

转载出处:https://zhuanlan.zhihu.com/p/116012207一.SQL中的进阶函数1.窗口函数窗口函数和普通聚合函数的区别:①聚合函数是将多条记录聚合为一条;窗口函数是每条记录都会执行,有几条记录执行完还是几条。②聚合函数也可以用于窗口函数。原因就在于窗口函数的执行顺序(逻辑上的)是在FROM,JOIN,WHERE,GROUP BY,HAVI...

2020-03-25 22:44:53 2259

原创 【数据分析】学习模块笔记

???? 了解数据分析⭐重要环节--缺失值怎么处理⭐特征工程中的特征构造、特征提取、特征选择⭐数据预处理中的数据清洗????业务理解与学习⭐产品日活DAU下降,怎么分析⭐数据指标体系⭐客户分析--客户画像分析???? 分析基础:统计学、机器学习???? 数据库技能:Sql、大数据Hadoop、Hive等???? 分析工具运用:Python、Excel...

2020-03-24 21:42:57 647 1

转载 【数据分析】一边吃粽子,一边思考流量数据分析!

转载出处:https://mp.weixin.qq.com/s/6KdKczONYngcFg8qZuV-Kg前戏粽子节了嘛,突然想吃粽子了,咋办,买粽子呗!现在情景转换一下,假设你是某饮食网的数据分析师,现在某粽子界大亨想拿钱砸你老板(打广告)。老板:“宝器过来一下“宝器:“好的老板”老板:“有个粽子界土豪要砸我们”宝器:“谁敢砸你?老板等着我叫人”老板:“我问的...

2020-03-24 18:58:35 534

转载 【数据分析】AB test

转载出处:https://mp.weixin.qq.com/s/PQqPghR2-5GsL8px9Y9WDg前言关于AB test的重要性无需多言,数据、产品等从业人员几乎必知,好的数据科学家我想一定是知道理解业务比模型更为重要,而AB test就是伴随着业务增长的利器。如果你心中的AB test几乎都没有用到中心极限定理、假设检验、z分布、t分布等知识,建议详细阅读本文。本...

2020-03-24 18:54:52 2470 1

转载 【sql】解一下TMD几道热门数据分析面试题

转载出处:https://mp.weixin.qq.com/s/Qg1Bacw5ta9Jnbs6ImqAZw背景Sql中有一类函数叫聚合函数,比如count、sum、avg、min、max等,这些函数的可以将多行数据按照规整聚集为一行,一般聚集前的数据行要大于聚集后的数据行。而有时候我们不仅想要聚集前的数据,又想要聚集后的数据,这时候便引入了窗口函数。下面通过几道TMD面试...

2020-03-24 18:50:52 419

转载 【Sql】数据分析招聘要求:熟练SQL!| 精简版复习大纲送给大家!

转载出处:https://mp.weixin.qq.com/s/DbFstSDeL5M5mNy_yLq1PQ摘要经常看到一份数据分析岗位的招聘要求:“熟练使用SQL”。那你真的熟练吗?最基本的几个问题,SQL是什么?数据库是什么?RDBMS又是什么?什么叫表?数据库(Database):按照数据结构来组织、存储和管理数据的仓库RDBMS:(Relational Datab...

2020-03-24 18:48:47 406

转载 【数据分析】移动互联网运营推广专业名词大全(in)

转载出处:http://www.niaogebiji.com/article-14256-1.htmlAAARRR,AARRR模型具体分为获取(acquisition)、激活(activation)、留存(retention)、收入(revenue)、传播(refer)分别对应这一款移动应用生命周期中的5个重要环节:获取用户(Acquisition)、提高活跃度(Ac...

2020-03-24 18:43:39 1012

转载 【数据分析】抖音为例:拆解数据分析常见的业务指标(in)

转载出处:https://mp.weixin.qq.com/s/iwM69Snwnt4obzrm94ypWw1.1 用户数据指标用户数据 [性别 年龄 地区]行为数据 [点击某个菜单的次数 分享量 收藏数]产品数据 [文章标题 日期 阅读量]1.2 行为数据指标1.3 产品数据指标1.4 付费推广指标:1.展示...

2020-03-24 18:39:55 2378

转载 【数据分析】数据监控体系是什么?该怎么搭建?(in)

转载出处:https://mp.weixin.qq.com/s/XTnjVI1m1QPzHyeMbGEjIw做数据的同学们都经常听到一句话:“建立销售/运营/商品数据监控体系”。这玩意拆开看每个字都认识,合起来听得一脸蒙懵圈,时常发问: 啥是数据监控体系? 这玩意和数据指标体系有啥区别? 我做的这些个报表,到底算不算体系? 为啥没感觉谁被我“监控”了?...

2020-03-24 18:37:17 1187 1

转载 【数据分析】新手必看:数据分析10大方法!(in)

转载出处:https://mp.weixin.qq.com/s/UthAvryFKePm1xU3Lom8bA数据分析方法是数据分析和产品、运营优化的核心,下文提供的十种常用方法能帮助避免逻辑混乱和判断失误,进行有效的数据分析。随着互联网的发展、业务逻辑越来越复杂,数据的分析也就变的越来越重要。对数据的分析可有效避免逻辑的混乱,防止在繁杂的业务理解上逻辑不清、判断错误。道家曾强调四个字...

2020-03-24 18:32:09 605

转载 【Python3机器学习】sklearn中的CountVectorizer和TfidfTransformer

原文链接:https://blog.csdn.net/qq_36134437/article/details/103057909CountVectorizer会将文本中的词语转换为词频矩阵,它通过fit_transform函数计算各个词语出现的次数。CountVectorizer(input='content', encoding='utf-8', decode_error='stric...

2020-02-12 16:45:04 1678 1

转载 【机器学习之路】(转载)

【我的机器学习入门之路(上)——传统机器学习】这篇博客主要记录了我自己的学习路线及相应的资料汇总。总时间跨度约为6个月,主要是利用了晚上的时间和周末的时间,每天坚持下来,日积月累,回过头来,可能会惊讶于自己的进步。对于一个机器学习的小白来说,往往不知道如何入门机器学习,毕竟机器学习的知识点非常多,方向也比较多,所以,在我们进行学习之前,有必要对机器学习的大方向做一个汇总比较与选择。机器学习的应...

2020-02-12 16:34:16 1193

转载 word2vec (转载)

word2vec前世今生2013年,Google开源了一款用于词向量计算的工具——word2vec,引起了工业界和学术界的关注。首先,word2vec可以在百万数量级的词典和上亿的数据集上进行高效地训练;其次,该工具得到的训练结果——词向量(word embedding),可以很好地度量词与词之间的相似性。随着深度学习(Deep Learning)在自然语言处理中应用的普及,很多人误以为wor...

2020-02-12 16:31:01 298

转载 【数据库】PLSQL

转载出处:https://blog.csdn.net/weixin_43485671/article/details/102720068目录????PLSQL是什么????PLSQL语法????PLSQL变量????判断体????循环????例外、异常????存储过程和函数????PLSQL是什么 是专用于Oracle服务器,在SQL基础之上,添加了一些过程化控制语句,叫PLSQL,...

2020-01-09 17:27:47 590

转载 【数据分析】洞察业务指标体系(in)

转载出处:https://www.yunyingpai.com/data/446818.html业务是一个复杂体系,数据分析也从来不简单,两者结合都是充满挑战的。作者总结了一份全面的运营数据指标,希望给大家的工作带来帮助与启发。运营和数据分析脱离不开关系。业务的洞悉决定了数据分析结果的上限,数据技巧只是逼近它。每个产品和运营都应该洞察业务指标,希望通过本文,让新人对业务指标的分析有...

2020-01-05 17:20:22 2814

转载 【数据分析】APP活动运营:应关注哪些数据指标(in)

活动策划是APP运营比较常见的方法,也是快速拉新、活跃用户的方法之一;一个好的活动通过正确的渠道投放,带来的传播效应是非常强大的!而现在讲究的是精细化运营,任何事情都是需要用数据说话;因此每一次活动,在活动前期、活动上线期间、活动结束后复盘都应该关注各种数据指标。活动策划(准备阶段)需要思考哪些数据指标策划一个活动,肯定要明确自己做活动的一个目的是什么?更偏重的是品牌传播、拉新?...

2020-01-05 17:09:29 1925

转载 【数据分析】产品日活DAU下降,怎么分析

本文我选择了一个具体的问题着手写。产品核心数据异常是在工作中经常会遇到的问题,也是常见的互联网面试问题。在此我结合网上的一些分享以及自己的经验,总结一些思考分析框架,让大家在遇到此类问题的时候有一个明确的着力点。案例简介一款信息流APP平时日活稳定在79w-80w之间,但是在6月13日起突然掉到了78.8w,到6月15日已经掉到78.5w,这时产品负责人着急了,让你尽快排查一下数据下...

2020-01-05 17:02:42 9638 1

转载 【数据分析】APP数据指标体系详解

转载出处:https://blog.csdn.net/qq_35495339/article/details/96203751在移动互联网公司,任何一个APP都应该事先规划好数据体系,才允许上线运营,有了数据才可以更科学、更省力地运营。今天我们来说说如何做APP的数据分析。一、为什么要做APP数据分析1.搭建数据运营分析框架一个APP的构建与运营工作通常由多个角色分工实现,由于大家...

2020-01-05 16:59:47 2088

转载 【机器学习】样本不均衡问题的处理方法

转载出处:https://blog.csdn.net/weixin_42462804/article/details/99821091文章目录一瞥 什么是样本类别分布不均衡? 样本类别分布不均衡导致的危害? 解决方法: 1.通过过抽样和欠抽样解决样本不均衡 (1)过抽样(over-sampling):通过增加分类中少数类样本的数量来实现样本均衡,比较...

2020-01-05 16:46:23 2647

原创 【数据分析】面经(搬运)

来源:牛客网copy来的,没事看看【字节跳动】字节 数据分析面经 https://www.nowcoder.com/discuss/344423【阿里、腾讯、美团、拼多多、华为、网易游戏、滴滴、网易严选、小米、京东】面经分享 数据开发/数据研发/数据分析 https://www.nowcoder.com/discuss/338699【美团、经纬恒润、拼多多、京东、浦发】数据分析菜鸡...

2020-01-04 16:49:01 3754 1

原创 PLSQL Developer的安装与连接使用

安装过程参考来源:https://blog.csdn.net/qq_28867949/article/details/77775918目录一、下载PLSQL Developer二、下载Oracle客户端三、配置变量四、配置连接Oracle的配置五、启动PLSQL Developer进行配置我的下载资源打包了PLSQL Developer和Oracle客户端和相关配...

2019-12-27 16:46:57 265

转载 【数据仓库】全量表、快照表、增量表、拉链表、维度表、实体表、事实表

原文链接:https://blog.csdn.net/a6822342/article/details/100050548https://blog.csdn.net/PTtaoge/article/details/80880494https://blog.csdn.net/bjweimengshu/article/details/79256504全量表全量表没有分区,表中的数据...

2019-12-26 15:19:19 4769 2

转载 【Mysql】oracle与mysql的语法区别

参考出处:https://blog.csdn.net/lovecuidong/article/details/881871021、mysql可以没有from,oracle必须有,可以写成from dual;2、mysql使用concat()函数连接字符串,oracle不仅有concat()函数,还可以使用||;3、mysql没有全外连接,使用集合连接代替,oracle有全外连接(...

2019-12-16 15:27:40 486

转载 【数据分析】方法论(in)

转载出处1:https://blog.csdn.net/qq_41455420/article/details/79200553转载出处2:https://blog.csdn.net/weixin_44530236/article/details/89956447目录1.数据分析方法论与数据分析区别2.数据分析方法论的重要性3.常用的数据分析方法论3.1 PE...

2019-12-08 16:18:47 1223 1

转载 【数据分析】重要环节--缺失值怎么处理

转载出处:https://blog.csdn.net/Q2605894893/article/details/81327027目录1 数据缺失的原因2 数据缺失的类型3 数据缺失的处理方法1. 删除记录2. 数据填补3. 不处理4 总结1 数据缺失的原因首先我们应该知道:数据为什么缺失?数据的缺失是我们无法避免的,可能的原因有很多种,博主总结有以下三大...

2019-12-04 16:17:42 6394 1

转载 【机器学习】分类问题指标总结

转载出处:https://blog.csdn.net/wf592523813/article/details/95202448目录1、二分类评价指标1.1 准确率(Accuracy)1.2 精确率(Precision)1.3 查全率(召回率 Recall)1.4 F1-Score1.5 ROC曲线和AUC1.6 ROC 与 P, R对比2、多分类评价指标...

2019-12-03 16:18:00 737

转载 【机器学习】【线性代数】之矩阵求导

转载出处:https://blog.csdn.net/u010976453/article/details/54381248目录1、X是标量时1.1 标量Y对标量X求导1.2 向量Y对标量X求导1.3 矩阵Y对标量X求导2、X是向量时2.1 标量Y对向量X求导2.2 向量Y对向量X求导2.3 矩阵Y对向量X求导3、X是矩阵时4、常用公式...

2019-10-03 10:48:26 802 1

原创 【Python机器学习】Python pandas快速自实现ID3算法构建决策树 + sklearn调包的使用

参考博客:https://blog.csdn.net/c406495762/article/details/76262487目录1、ID3算法原理2、算法实现代码(利用pandas)2.1 构建训练集2.2 算法实现2.3 全部代码3、决策树调包使用3.1 代码3.2 参数设置相关4、决策树的优缺点1、ID3算法原理I...

2019-09-30 14:16:55 2271

原创 【Python机器学习】Python pandas不到50行自实现KNN海伦约会对象识别(包括数据读取、画图、标准化,算法实现等流程) + 60行实现手写数字识别

目录1、KNN原理2、海伦对象训练数据集3、单条测试输入代码4、单条测试输入结果与图示5、多条测试输入正确率计算代码及结果6、手写数据识别代码及结果1、KNN原理计算已知类别数据集中的点与当前点之间的距离; 按照距离递增次序排序; 选取与当前点距离最小的k个点; 确定前k个点所在类别的出现频率; 返回前k个点所出现频率最高的类别作为当前点的预测分类。...

2019-09-27 14:10:42 671 1

原创 【MySQL】基础学习全解(四)

目录1、导入导出、备份恢复1.1导入一个纯数据文件1.2 导出1.3 备份1.4 恢复1.5 使用用户变量2、mysql语言结构2.1 文字值字符串数值型日期类型十六进制布尔值NULL值2.2 识别符识别符限制条件识别符大小写敏感用户自定义变量注释语句3、mysql数据类型3.1 数值类型3.2...

2019-09-18 11:13:36 442

转载 【Mysql】面试常见问题~待续

转载出处:可能是全网最好的MySQL重要知识点/面试题总结目录1、关系型数据库和非关系型数据库的区别2、事务相关2.1 事务的四大特性(ACID)2.2 并发事务带来哪些问题?2.3 不可重复度和幻读区别2.4 事务隔离级别有哪些?2.5 MySQL的默认隔离级别3、索引相关3.1 什么索引能提高查询速度3.2 什么是最左前缀原则?3.3 My...

2019-09-17 21:42:18 176

原创 【Mysql】选择填空题笔记

数据库的基本特点 数据可以共享; 数据独立性; 数据冗余小; 统一管理和控制 数据库的概念模型独立于 具体机器和DBMS 数据库三级模式体系结构的划分,有利于保持数据库的 数据独立性 数据库系统的三级模式结构是指外模式、模式、内模式。 内模式也称物理模式或存储模式。 一个数据库只有一个内模式。用户级对应外模式, 概念级对应概念模式, 物理级对应内模式. ...

2019-09-17 20:40:22 909

原创 【Python】二叉树前序遍历、中序遍历、后序遍历的递归与非递归版本实现+测试用例

算法详解参考:https://blog.csdn.net/Monster_ii/article/details/82115772测试用例二叉树:前序遍历结果:5 3 2 4 76 8中序遍历结果:2 3 4 5 6 7 8后序遍历结果:2 4 3 6 8 7 5层序遍历结果:5 3 7 2 4 6 8代码1、前序遍历(递归与非递归)2、中序遍历(递...

2019-09-16 15:05:21 535

转载 【Python】大话字符编码

2018年7月6日12:45:30Python:字符编码的前世今生转载出处:https://cuijiahua.com/blog/2018/07/trick-6.html

2019-09-14 12:46:56 135

原创 【爬虫】牛客网简易爬虫(二)用Selenium看看你投过简历的公司这个月哪些有笔试+笔试时间

在 牛客网--求职--笔试日历 可以笔试时间每天都有哪些公司有笔试,如下图一、需求1、看看这个有笔试的公司哪家你还没看过。2、看看自己投过的公司哪家这个月有笔试及笔试的时间。当然,你还是得把你投的记在excel中,把已笔试的也记下来!2、代码from selenium import webdriverfrom collections impor...

2019-09-06 00:30:44 694

原创 【爬虫】牛客网简易爬虫(一)看看哪些开始秋招的公司你还没看

目录一、需求二、简单网站分析三、代码四、代码输出在 牛客网--求职--校招日程可以看到秋招的互联网公司。不过里面有一些是亮的就是已开始,灰的就是还没开始或者已经结束。如下图。一、需求博主在看完一家公司后,都会把它记在excel中的“已看”列,代表这家公司我已经看过。如下图,只截取部分。注意添加在excel的时候要是公司全名不然后面会很难受哈哈。然后我...

2019-09-06 00:08:52 464 1

原创 【数据库】三级模式与范式

详情见我的有道云笔记,链接如下。数据库三级模式链接:数据库三级模式.note数据库范式链接:数据库范式.note

2019-09-05 14:21:05 202

转载 【Mysql】我的实践笔记之Sql优化手段

转载出处:https://blog.csdn.net/m0_37657725/article/details/98964611目录1 如何定位慢查询2 选择合适的数据库引擎3 选择合适的索引3.1 索引的使用场景3.2索引技巧4 数据库优化之分表5 数据库的读写分离6 数据库优化之缓存7 sql语句优化7.1 基本优化7.2 不要让引擎放弃使...

2019-09-04 11:09:59 239

PLSQL Developer 10版本与Oracle-client 19.5.0.0.0版本

PLSQL Developer 10版本与Oracle-client 19.5.0.0.0版本,相应配置详见我的博客

2019-12-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除