自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(24)
  • 收藏
  • 关注

原创 数据分析思考

1.1 界定问题-确定分析目标和范围1.2 数据驱动的解决方案-探索可能的分析方法。

2024-06-20 07:36:41 1052

原创 数据分析面试八股文--技能软件类

数据分析的“三板斧"指的是三个在 Python 数据分析领域广泛使用的库:NumPy,Pandas,和 Matplotlib。这三个库提供了处理和分析数据的强大工具。NumPyNumPy(Numerical Python)是一个开源 Python 库,用于支持大型多维数组和矩阵运算。此外,NumPy 还提供了大量的数学函数来操作这些数组。np.array():创建数组np.arange():返回一个有终点和起点的固定步长的排列。

2024-06-19 09:09:21 895

原创 数据分析-------面试相关

在寻找合适的数据分析师时,一般招聘方的目标是确保候选人的专业技能和工作经验与岗位要求紧密对应。关键在于两个方面:岗位的具体需求和数据分析师的职业素质。首先,招聘方要确保应聘者的专业背景和技能与职位需求相匹配。每个数据分析职位都可能针对特定业务或项目,因此理想的候选人应该具备相关领域的知识和经验,例如在互联网电商、游戏业或金融风控等具体方面有专长。其次,技术能力虽然重要,但不是首要条件。招聘方更注重候选人的分析能力,而非他们是否熟练掌握 SOL、Python 或Tableau 等具体工具。

2024-06-18 09:44:15 449

原创 数据分析面试八股文--业务场景类

核心目标确定:策略举措:流程梳理:场景化操作:数据准确性排查:周期性波动分析:异动定位:日活案例分析:确定活动目标:转化因子拆解:效果对比:项目调研:

2024-06-17 07:38:44 642

原创 数据分析------知识点(六)

如何写好数据分析报告中的确定问题部分数据分析报告是数据分析师展示工作成果、影响业务决策的重要工具。而确定问题是数据分析报告的第一个也是最关键的部分。只有正确地确定了问题,后续的分析才能有的放矢,产生真正的价值。

2024-06-16 09:34:04 1605 2

原创 数据分析------统计学知识点(五)

想象一下,你和朋友在讨论:大学生活中,每天学习的时间是否真的能影响期末成绩?这个问题看似简单,实则包含了一个潜在的关系:学习时间与成绩之间的联系。我们想要知道,增加学习时间是否会提高成绩,以及这种提高有多显著。

2024-06-14 07:59:06 979

原创 数据分析------统计学知识点(四)

当评估一个算法的性能时,通常首先考虑准确率(Accuracy),这是一个衡量模型整体预测准确性的指标。召回率衡量的是模型正确预测的正类样本(TP)占所有实际正类样本的比例,反映了模型对正类的检出能力。一个单一的高指标并不足以定义一个好的模型,而是需要同时考虑减少假正例和假负例的能力确定模型的优劣。其中真正例TP表示正确预测为正类的样本数,假正例FP表示错误预测为正类的负类样本数。精确率是衡量在所有模型预测为正类的样本中,实际为正类的样本的比例。假正例(FP):模型错误地将负类(类别B)预测为正类(类别A)

2024-06-11 20:14:49 767

原创 数据分析面试常问问题(二)(SQL、统计学、业务方面等)

(2)用户属性数据:年龄、性别、地域、学历、家庭组成、职业等;(3)视频属性数据:评分、播放量、评论数、出品方、导演、主演、国别、年代、语言、是否获奖、剧情等;(4)上下文数据:用户最近观看历史记录、最近偏好的演员明星、最近常看的视频类型等。假设食堂就餐时间为2h,则每小时需要为10000人提供就餐服务;假设每人就餐时间为15min,且人员到达食堂的时间点分布均匀,则1h可以服务4批就餐人员,平均每批2500人,意味着将会有这么多人同时就餐,就可以按照上述数据进行座位规划。1) 前期调研。

2024-06-06 10:34:14 1177

原创 数据分析------统计学知识点(三)

散点图可帮助我们发现和理解变量间的关系,可直观观察是否有相关性。(1)散点图定义及组成要素散点图是一种以点的形式在直角坐标系上表示两个数值变量间关系的图表横坐标(x轴):代表独立变量,如广告预算纵坐标(y轴):代表因变量,如销售额数据点:表示记录的坐标点,反映变量间的关系(2)散点图表意原则正相关:点呈现从左下到右上的趋势,意味着一个变量的增加通常伴随着另一变量的增加。负相关:点分布从左上到右下,一个变量的增加伴随着另一个变量的减少非线性相关:点分布呈曲线形状,表明变量间的关系更复杂。

2024-06-05 10:26:24 962

原创 数据分析------统计学知识点(二)

①收入分布:个人收入分布往往呈现右偏特征,少数人占据了大部分财富,了解收入分布的偏态性,有助于制定合理的税收政策和社会保障制度。例如:一个企业80%的利润可能来自于20%的顾客,80%的财富被20%的人口所拥有,20%的员工可能完成80%的工作。①误差分析:测量和实验中,误差分布有时服从拉普拉斯分布,用拉普拉斯分布刻画误差,可提高参数估计和假设检验的效率。指数据的大部分集中在左侧,而右侧的尾部更长,均值通常大于中位数,分布的峰值点位于中位数左侧。偏度系数的绝对值越大,分布的偏态程度越严重。

2024-06-04 10:46:01 1074

原创 数据分析——Excel篇

是指通过互联网访问、浏览这个网页的自然人。访问网站的一台电脑客户端为一个访客。00:00-24:00相同的客户端只被计算一次,一天内同个访客多次访问仅计算一个UV。:即页面浏览量或点击量,用户每一次对网站中的每个网页访问均被记录1个PV,用户对同一个页面的多次访问,PV会累计。:每产生一次点击所花费的成本可在数据透视表外的工作表去对数据透视表的内容进行筛选;只能在表内部使用。

2024-06-01 16:16:29 1172

原创 数据分析------统计学知识点(一)

例如:一枚公平的硬币正面朝上和反面朝上的概率都是50%。若你只抛一次,结果可能是正,也可能是反,无法预测。但若你抛100次,200次,甚至更多次,你会发现正面和反面各自出现的次数越来越接近一半。大数定律的直观展现:随着试验次数的增加,样本均值(在上例中即是正面出现的比例)越来越接近总体均值(50%)数据分析中,大数定律告诉我们,只要样本量足够大,就可以通过样本来估计整个群体的特性。(减少偶然性,更准确了解总体特性)虽然正反面概率各位50%,但是抛10次不一定正反各5次。

2024-05-31 10:55:04 1090

原创 项目四:AB实验实战

为优化落地页设计并提升转化率,某电商公司计划通过 A/B 测试验证新页面设计。该公司历年转化率平均为13%。目标将新页面的转化率提高2个百分点至15%。在全面推广前,公司将在一小部分用户群中进行测试,以确认新设计是否达到预期效果。

2024-05-30 10:23:16 1235

原创 SQL入门教程----基础知识

SQL是一个功能强大的工具,用于管理和操作关系数据库。通过学习SQL的基本操作和常用命令,您可以有效地管理和查询数据库中的数据。随着经验的增加,您可以进一步学习高级SQL功能和优化技巧,以提高数据库性能和效率。

2024-05-29 09:35:40 377

原创 简历可能会问的问题(学习笔记)

ANOVA。

2024-05-29 09:24:30 1402

原创 SQL常用函数总结(三)

常用的sql函数

2024-05-28 10:44:55 1309

原创 项目三:运营商客户流失分析

性别:男性 = 女性高龄用户:非高龄用户 > 高龄用户伴侣:无伴侣 > 有伴侣家属:无家属 > 有家属电话服务:有电话服务 > 无电话服务多线服务:有多线服务 > 无多线服务 > 无电话服务互联网服务:光纤 > DSL > 无互联网服务在线安全:无 > 有 > 无互联网服务在线备份:无 > 有 > 无互联网服务设备保护:无 > 有 > 无互联网服务技术支持:无 > 有 > 无互联网服务流媒体电视:无 > 有 > 无互联网服务。

2024-05-27 09:27:26 1688

原创 数据分析面试常问问题(一)(SQL、统计学、业务方面等)

数据分析面试常问的sql、统计学、场景、业务问题总结

2024-05-24 09:28:09 558

原创 某音短视频——SQL编程真题练习

窗口。

2024-05-23 19:30:00 1800 1

原创 SQL常用函数总结(二)

①ORDER BY可以使用列的别名进行排序,但是WHERE不能用列的别名进行过滤②强调格式:WHERE需要声明在FROM之后,ORDER BY之前③一般先是FROM指定表,WHERE过滤条件,SELECT查询对应信息,ORDER BY将对应信息排序,排序后若仍有相同的行,可在后面接着二级排序。

2024-05-22 11:08:01 948

原创 SQL常用函数总结(一)

基础的sql语句,基本运算规则、语法

2024-05-21 10:45:20 855

原创 系统认识数据分析

主要说明数据分析到底是要做什么,适合入门小白看,系统了解什么是数据分析

2024-05-20 10:47:03 361

原创 项目二:戴师兄自学课程2.0之——弹幕内容分析

对视频课程的弹幕内容进行数据分析,主要从时序、用户、内容三个方面进行数据分析,可得出一定的结论和猜想。

2024-05-20 10:02:11 1085

原创 项目一:python数据分析项目之办公自动化——Excel到Word文档的展示

使用python做的简单的数据分析项目-----办公自动化,将Excel数据转化到人人常用的Word里面,使得数据更直观、便于观看和分析。主要用到pandas、python-docx。

2024-05-19 11:33:19 358 1

项目四:AB实验实战,提升转化率,用户页面体验

数据和实现代码

2024-05-31

项目二:戴师兄自学课程2.0之-弹幕内容分析

数据来源和代码实现

2024-05-27

项目一:python数据分析项目之办公自动化-Excel到Word文档的展示

数据来源和代码实现

2024-05-27

项目三:运营商客户流失分析

数据表和完成代码

2024-05-27

特征脸算法的简要的步骤

主要介绍了有关特征脸算法的主要步骤,作为初学者可用大概了解和学习

2023-03-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除