自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 常用的数据分析方法(4)

RFM是3个指标的缩写: 最近1次消费时间间隔(Recency)、消费频率(Frequency)、消费金额(Monetary),通过这3个指标对用户分类的方法称为RFM分析方法。这里举个例子来说明这3个指标是什么意思。你有一家店铺,小明是这家店铺的用户,今天是这个月的30号。(1)最近1次消费时间间隔(R)是指用户最近一次消费距离现在多长时间了。小明最近1次在店铺买东西是这个月26号,上一次消费距离现在过去了4天,所以小明的最近1次消费时间间隔是4天。

2025-02-05 09:38:30 1930

原创 常用的数据分析方法(3)

相关分析在日常生活中随处可见,下面举几个例子。工作压力过大会致人死亡吗?答案是肯定的,有大量证据表明工作压力会导致早逝,尤其会增大心脏病猝死的概率。你认为什么样的工作更容易使职场人士猝死,是“权力大、责任也大”的工作,还是“缺乏控制力和话语权”的工作?其实最危险的一类工作,是对自己的工作任务“缺乏控制力”。

2025-02-03 16:47:26 626

原创 python中pandas库的使用---缺失值处理(5)

series调用字符串方法,必须先写.str。

2025-02-01 11:07:00 234

原创 常用的数据分析方法(2)

假设检验分析方法是一种使用数据来做决策的过程。

2025-01-31 10:27:56 1965

原创 python中pandas库的使用---新增数据列(4)

【代码】python中pandas库的使用---新增数据列(4)

2025-01-30 18:43:17 231

原创 python中pandas库的使用---pandas查询数据(3)

iloc: 根据索引查询: 更在意位置信息。pandas 查询数据。

2025-01-30 17:59:24 198

原创 python中pandas库的使用---pandas数据类型(2)

DataFrame: 表格型数据结构,拥有行列索引Series: 一维数据,只有索引。

2025-01-25 17:33:42 250

原创 python中pandas库的使用---pandas导入导出(1)

df.to_sql('表名',engine,schema='数据库名',if_exists='replace',index=True)说明: mysql+pymysql://用户名:密码@主机ip地址:端口号/数据库名称?会把该url下所有的表格 全部以DataFrame的格式读取进来,并且如果不止一个,会以列表包括df的形式返回。# read_excel(),默认只能读取分页表1,使用sheet_name来调整分页。# 详细参数介绍,会默认把第一行数据当作表名, names重置一个列名。

2025-01-25 11:57:46 312

原创 python中numpy库的使用---科学计算(5)

【代码】python中numpy库的使用---数组的操作(4)

2025-01-23 18:15:38 140

原创 python中numpy库的使用---数组的操作(4)

(先使用np.array转换为数组,然后使用np.unique进行去重.最后使用list转换为列表)练习: 请对列表进行去重,最终返回列表。

2025-01-22 22:09:28 154

原创 python中numpy库的使用---numpy 的运算和广播机制 (3)

广播机制:数组之间的运算数组与数值的运算[1 2 3]*3 = = [3 6 9]数组与数组[1 2 3]*[3 2 1] = [3 4 3]

2025-01-17 10:47:12 142

原创 python中numpy库的使用---numpy的索引和切片(2)

【代码】python中numpy库的使用---numpy的索引和切片。

2025-01-17 10:12:06 175

原创 python中numpy库的使用---numpy基础 (1)

NumPy是Python中科学计算的基础包。它是一个Python库,提供多维数组对象,以及用于数组快速操作的各种API,有包括数学、逻辑、形状操作、排序、选择、输入输出、离散傅立叶变换、基本线性代数、基本统计运算和随机模拟等。NumPy包的核心是ndarray对象。它封装了python原生的同数据类型的n维数组。NumPy数组和原生Python Array(数组)之间有几个重要的区别:(1)NumPy 数组在创建时具有固定的大小,与Python的原生数组对象(可以动态增长)不同。

2025-01-15 16:59:37 298

原创 常用的数据分析方法(1)

逻辑树分析方法是把复杂问题拆解成若干个简单的子问题,然后像树枝那样逐步展开。

2024-12-27 11:21:35 576

原创 跨境电商行业的业务模式及相关指标

使用广告漏斗模型来分析数据的好处是,可以量化各个环节的表现情况,发现是哪个环节出了问题,从而有针对性地解决问题。(2)点击数量是指一定时间范围内产品曝光后的点击次数。点击转化率是指一定时间范围内产品 点击数量除以曝光数量。跨境电商是指通过跨境物流送达商品、完成交易的一种国际商业活动。(1)曝光数量是指一定时间范围内产品在平台上出现的次数。(3)订单这一环节需要关注的指标是订单数量、购买转化率。(2)广告成本:指一定时间范围内的广告费除以销售额。(1)广告费:指一定时间范围内产品支付的广告费。

2024-12-25 22:02:51 515

原创 牛客网在线编程-sql篇 热题(2)

SQL226 将employees表的所有员工的last_name和first_name拼接起来作为Name。SQL224 使用子查询的方式找出属于Action分类的所有电影对应的title,description。SQL213 查找所有员工的last_name和first_name以及对应的dept_name。SQL219 获取员工其当前的薪水比其manager当前薪水还高的相关信息。SQL217 对所有员工的薪水按照salary降序进行1-N的排名。SQL215 查找在职员工自入职以来的薪水涨幅情况。

2024-12-24 22:31:37 149

原创 牛客网在线编程-sql篇 热题(1)

SQL198 查找所有已经分配部门的员工的last_name和first_name以及dept_no。SQL199 查找所有员工的last_name和first_name以及对应部门编号dept_no。SQL211 获取当前薪水第二多的员工的emp_no以及其对应的薪水salary。SQL212 获取当前薪水第二多的员工的emp_no以及其对应的薪水salary。SQL196 查找入职员工时间升序排名的情况下的倒数第三的员工所有信息。SQL204 获取所有非manager的员工emp_no。

2024-12-18 19:40:48 263

原创 零售行业数据分析的相关业务指标

下面分别从销售、库存、运营、财务这4个维度介绍零售行业的业务指标。

2024-12-16 15:32:18 1714

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除