自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(83)
  • 收藏
  • 关注

原创 数据分析:利用gpt进行短视频电商平台用户的内容消费情况开展专题分析

用户行为分析:了解用户在平台上的活跃度、参与度和消费习惯。内容效果评估:量化内容的受欢迎程度和影响力。电商转化率:分析内容如何推动电商销售。用户留存与流失:识别哪些因素影响用户的长期参与。个性化推荐效果:评估推荐算法的准确性和效果。用户行为分析内容效果评估电商转化率用户留存与流失个性化推荐效果了解18-35岁年龄段用户的购买行为。分析“美妆”和“家居”两大类别的内容效果。评估2023年Q2的电商转化率。识别导致用户流失的主要因素。

2023-09-17 09:35:48 309

原创 利用gpt进行商品销售情况专题分析,构建相应的分析框架

价格敏感度分析(Price Sensitivity Analysis)旨在了解价格变动如何影响商品销量、销售额和利润。该分析可以帮助电商平台确定最佳定价策略,并找出消费者最愿意接受的价格区间。

2023-09-16 23:14:57 323

原创 利用gpt进行数据分析:用户生命周期专题分析

通过这样的分类,我们可以更加精准地针对不同阶段的用户实施相应的营销策略和用户挽回计划。对于流失用户,我们可以进行深入的流失原因分析,以便制定更有效的挽回策略。本报告旨在对电商平台的用户生命周期进行全面分析,以便更精确地理解用户在不同生命周期阶段的行为和需求。通过这个全面而系统的分析框架,我们不仅可以深入了解用户在不同生命周期阶段的行为模式,还可以更有效地制定针对性的营销策略,以提高用户留存率和生命周期价值。尝试从潜在用户,新用户,活跃用户,沉默用户,流失用户进行划分且给出相关案例说明。

2023-09-16 23:05:50 431

原创 数据分析:利用gpt建立双11活动的分析框架

当然,双11活动,也称为“光棍节”购物节,是中国最大的在线购物节之一。双11活动通常在每年的11月11日进行,因此得名“双11”。这一天,各大电商平台会推出大量优惠券、折扣和促销活动,吸引消费者进行购物。当然,针对双11这样的大型营销活动进行全面的效果评估是非常重要的。现在要针对双11这样的大型营销活动做出全面的效果评估,请构建相应的分析框架。您是一名某电商平台的资深数据分析师,首先,您知道什么是双11活动吗?营销效果:各种营销活动(如优惠券、秒杀、团购等)的效果。竞争分析:与其他电商平台的表现对比。

2023-09-16 08:43:12 282

原创 数据分析-利用gpt进行电商平台用户细分专题分析(RFM模型)

本报告旨在通过使用RFM模型(Recency, Frequency, Monetary)对电商平台的用户进行细分,以便实施更精细化的运营策略。报告包括数据准备、分数计算、用户细分、策略制定,以及持续监控和优化的建议。

2023-09-16 08:11:56 376

原创 数据分析:利用gpt进行探索性分析,基于电商用户行为分析

这只是一个非常简单的探索性数据分析,对于真实世界的电商数据,通常需要进行更深入和复杂的分析。希望这对你有所帮助!action: 用户行为(view、click、purchase)每种用户行为(view、click、purchase)的数量统计。购买行为是最常见的,共有5次,而点击行为相对较少,只有2次。用户 U005 和 U003 相对更活跃,都有3次行为记录。用户 U005: 3次行为。用户 U003: 3次行为。用户 U001: 2次行为。用户 U004: 1次行为。用户 U002: 1次行为。

2023-09-14 22:17:57 215

原创 数据分析:利用gpt进行归因分析

prompt:你是某电商平台的一名数据分析师,发现昨日的GMV环比下降了5%,请对这数据变动做出归因。output:在电商行业中,GMV(总销售额)是一个非常重要的指标,用于衡量业务的整体健康状况。当GMV出现环比下降时,这通常意味着需要进行详细的分析以找出可能的原因。以下是一些可能导致GMV环比下降5%的因素,以及如何进行进一步的分析。可能的因素季节性因素: 某些季节可能比其他季节的销售额要低。比如,在大型促销活动(如“双十一”)之后的一个月通常会有所下降。库存问题: 如果热销产品缺货,这将直接

2023-09-14 22:13:00 457

原创 利用gpt进行GMV变化数据分析

现在已知男性GMV从800降至600,女性GMV从1200至1300,请计算男女GMV变动对整体GMV变动的贡献度。

2023-09-14 22:09:25 358

原创 GPT3.5之模仿例子完成任务

一个封装 OpenAI 接口的函数,参数为 Prompt,返回对应结果 def get_completion(prompt , model = "gpt-3.5-turbo") : '''prompt: 对应的提示model: 调用的模型,默认为 gpt-3.5-turbo(ChatGPT),有内测资格的用户可以选择 gpt-4。

2023-05-05 22:11:29 380 1

原创 GPT3.5之运用之检查模型是否满足条件

在如下示例中,我们将分别给模型两段文本,分别是制作茶的步骤以及一段没有明确步骤的文本。我们将要求模型判断其是否包含一系列指令,如果包含则按照给定格式重新编写指令,不包含则回答未提供步骤。你还可以考虑潜在的边缘情况以及模型应该如何处理它们,以避免意外的错误或结果。如果任务做出的假设不一定满足,我们可以告诉模型先检查这些假设,第六步 - 如果你愿意,可以加一些糖或牛奶调味。第七步 - 就这样,你可以享受一杯美味的茶了。第四步 - 等待几分钟,让茶叶浸泡。第三步 - 把烧开的水倒在茶包上。第一步 - 把水烧开。

2023-05-04 22:21:53 874

原创 GPT API使用之输出结构化的数据

第二个策略是要求生成一个结构化的输出,这可以使模型的输出更容易被我们解析,例如,你可以在 Python 中将其读入字典或列表中,此类数据在生产环境中更具鲁棒性。在以下示例中,我们要求 GPT 生成三本书的标题、作者和类别,并要求 GPT 以 Json 的格式返回给我们,为便于解析,我们指定了 Json 的键。书名,作者,类别为任务,书籍清单为中文书目为边界范围。JSON输出为任务,相关的键为JSON的key。,可以是 Json、HTML 等格式。

2023-05-02 18:25:53 2772

原创 GPT3.5 promt的两个编写原则之一 编写具体、清晰的指令

你可以使用任何明显的标点符号将特定的文本部分与提示的其余部分分开。提示注入是指如果用户将某些输入添加到提示中,则可能会向模型提供与您想要执行的操作相冲突的指令,从而使其遵循冲突的指令而不是执行您想要的操作。即,输入里面可能包含其他指令,会覆盖掉你的指令。编写清晰的指令不意味着简短的指令,因为在许多情况下,更长的提示实际上更清晰且提供了更多上下文,这实际上可能导致更详细更相关的输出。,分隔符可以是:```,“”,,,等**对作文的一个背景描述,需要完成的任务,以及设置任务的边界。

2023-05-02 18:12:46 1318

原创 GPT3.5 API使用之配置env环境

为了更好的在python使用gpt3.5,以下快速介绍一下如何使用gpt3.5API提示:以下是本篇文章正文内容,下面案例可供参考。

2023-05-01 21:36:38 1661

原创 python 关于元组的一些写法

python元组运用

2022-09-05 22:53:48 299

原创 对需求的内容进行jieba分词并按词频排序输出excel文档

jieba

2022-07-21 23:13:45 1958 2

原创 python批量重命名文件的标题的方法(helloworl123.txt->123.txt)

helloworld123.txt->123.txt

2022-07-14 09:00:32 338

原创 python实现自动化读取word文档(办公自动化)

docx库实现word文档读取自动化

2022-07-03 21:27:49 839

原创 国产爬虫库feapder使用心得

爬虫框架feapder细要

2022-07-03 10:11:41 2092

原创 A/B 测试:Python实战(新老页面的转化率测试)

AB test

2022-06-22 22:49:13 1092 1

原创 一幅脑图总结一下需求分析(工作上实际遇到的情况的补充)

需求分析所需要的一些情况

2022-06-21 21:56:33 112

原创 python的链式操作及类型推断(filter/map/find) 摘自国产开源库pyiter库

python链式操作库

2022-06-09 12:09:02 500

原创 如何快速的获取文件夹目录下的所有文件路径

python

2022-03-20 22:45:55 1524

原创 异步协程多浏览器开启playwright实战

import asynciofrom playwright.async_api import async_playwrightasync def run(url): async with async_playwright() as playwright: # create a chromium browser instance chromium = playwright.chromium # browser = await chromium.l

2022-03-13 08:53:50 4921

原创 COM自动化使用电脑程序

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、COM是什么?二、使用步骤1.打开EXCEL2.在Excel中打开文件总结前言Python有许多本地创建通用Microsoft Office文件类型的选项,包括Excel、Word和PowerPoint。然而,在某些情况下,使用纯python方法解决问题可能太困难了。幸运的是,python有一个名为pywin32的“python for Windows Extensions”包,它允许我们轻松地访问Windows的组.

2022-03-09 22:44:10 1256

原创 easydl的遍历文件夹批量识别程序

import osimport jsonimport base64import requestsclass pic_recog: def __init__(self, app_key, app_secret): # self.app_id = app_id self.app_key = app_key self.app_secret = app_secret self.token_url = 'https://aip.bai

2022-02-26 13:09:23 226

原创 python 时间和时间戳转换的处理

时间和时间戳转换的处理import datetime as dtimport time# 获取当前时间呈现到毫秒级别并转换为时间戳def get_current_time_ms_to_timestamp(): return int(time.time() * 1000)# 获取当前时间呈现到当天的0时0分0秒000毫秒并转换为时间戳def get_current_time_day_to_timestamp(): # 获取当日0时0分0秒000毫秒 today_0 =

2022-02-06 21:47:51 1119

原创 playwright自动测试库的爬虫使用

在尝试使用playwright之前,也使用过Selenium,Selenium依赖多种不同的driver,根据浏览器的不断更新,就要不断去维护这些driver,以及处理相应的适用性问题,对于整体的产品来看,显得太重,playwright的这方面封装会更加轻量级,所以尝试了把playwright的使用使用之前,首先在已新建的虚拟环境下,可以:pip install playwright//2.安装相应的封装好的驱动playwight install第二步可能网络不好时会下载失败,多尝试,下载后.

2022-02-03 23:14:32 1265

原创 基于产品的AB测试的检验

首先查看数据集的数据结构Impression:曝光数Click:点击数Purchase:购买的产品数Earning:赚取的money数数据分为控制组,和测试组两个元数据集

2022-02-02 10:02:34 594

原创 关于安装深度学习环境以及调试rembg库出现的问题的脑图归纳(backup)

主要涉及从硬件购买到系统搭建以及深度学习环境配置,以及调试rembg库出现的一些问题的总结。

2022-01-31 08:51:11 1339 5

原创 基于产品的RFM模型的k-means聚类分析

首先我们可以看看数据集的数据形态:导入rfm数据,查看数据的统计学参数df =pd.read_csv('rfm.csv')df.describe()在实施Kmeans聚类之前,我们必须检查这些关键k-means假设-变量对称分布(不倾斜)-具有相同平均值的变量-方差相同的变量从这个表中,我们发现了这个问题:均值和方差不相等解决:使用scikit-learn库中的标量来缩放变量#绘制RFM值的分布f,ax = plt.subplots(figsize=(10, 12))plt.s

2022-01-26 17:04:03 2740 2

原创 基于产品的RFM模型分析

系列文章目录基于python的RFM模型分析提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录前言一、RFM是什么?二、分析步骤1.引入库2.读入数据总结前言提示:这里可以添加本文要记录的大概内容:RFM模型是评价用户分层的一个非常有价值的模型,主要是通过评分的方式量化用户R/F/M三个行为层面上的数据,在日常工作中,RFM模型还经常与AARRR模型一起使用以对用户进行分类,以寻找我们运营中核心关注的用户,以花更多的精力去维护这些核心用户群体。提示:以

2022-01-26 12:10:00 2335

原创 产品分析之用户评论分析

文章目录前言一、NLP是什么?二、使用步骤1.引入库2.数据分析流程总结前言在产品运营上线后,总是有各种各样的反馈,我们一般需要对这些反馈进行统计,因为这些数据都是非结构化的数据,类似文本消息,语音消息,这时候我们可以考虑利用NLP对这些数据进行聚类或者分类,在NLP使用之前,我对NLP的各种产品以及Python自带的库也摸索了一遍,最终出于最优解决方案原则,选择了腾讯的NLP文本处理接口,主要利用了情感分析/智能分词的接口,当然有兴趣的小伙伴也可以尝试利用jieba库,snownlp去进行文本分析

2022-01-24 21:07:31 1597

原创 基于用户的产品分析之Cohort Analysis(群组分析,留存分析)

在产品正式上线后,我们需要对产品的客群对象进行分析,此时产品的群组分析会给予我们找到一定的方向。核心的维度:产品 ->客群,时间->聚类周期现象首先读取数据集:import numpy as npimport pandas as pd df = pd.read_excel('./Online Retail.xlsx')查看数据前五列/info#%%df.head()#%%df.info()通过结果,我们可以看到数据有8个字段,其中,Description列和C

2022-01-21 08:40:51 1396

原创 销售转化率分析

数据字段阐述:* *数据:* *这个项目中使用的数据来自一个匿名组织的社交媒体广告活动。1) ad_id:每个ad的唯一ID。2) XYZ campaign ID: XYZ公司每一个广告活动的ID。3) fbcampaigns:一个与Facebook如何追踪每个活动相关的ID。4) age:显示AD的对象的年龄。5) gender:性别的人心血来潮添加显示6) interest:指定个人兴趣所属类别的代码(个人的Facebook公开资料中提到的兴趣)。7) Impressions:广告被播

2022-01-18 08:51:44 1113

原创 python lambda及正则表达式实现数据预处理

#%%import pandas as pdimport numpy as np#%% mdcar price prediction#%%# create a dataframe abut the car pricedf = pd.DataFrame({'mileage':['23.4 kmpl','21.4 kmpl','20.4 kmpl'], 'engine':['1.4 liter','1.2 liter','1.5 liter'],

2022-01-16 22:53:31 689 1

原创 用python实现中译英(dataframe list dict)

The first try!from translate import Translatortranslator = Translator(to_lang="zh")text ='Hello, world!'translation = translator.translate(text)translationresult:what about the dataframe# of course, you can translate dataframe.columnsimport pand

2022-01-14 23:05:48 899

原创 python绘制正弦函数/余弦函数

前言:numpy的linespace的参数介绍:start:返回样本数据开始点(这里会用在自变量x)stop:返回样本数据结束点num:生成的样本数据量,默认为50# draw the sinx curveimport numpy as npimport matplotlib.pyplot as pltx = np.linspace(-20, 20, 100)y = np.sin(x)plt.plot(x, y)plt.show()# draw the cos x curve

2022-01-11 07:51:07 7132

原创 利用pandas计算一月至今的所有月份(欢迎评论区留下其他方法)

import pandas as pdfrom datetime import datetime# calculate the year and month from '2021-01-01' to nowdf = pd.DataFrame(pd.date_range('2021-01-01', datetime.now(), freq='M'), columns=['begin_month'])# offset the month by 1df['end_month'] = df['begi

2022-01-08 23:55:43 857

原创 4行代码python随机抽样(不放回)程序

import randomname = ['小明','小黄','小黑','小白','小橙','小紫']for i in range(len(name)): print(name.pop(random.randint(0,len(name)-1)))result:

2022-01-08 23:49:29 4171

原创 sklearn/pands one-hot 编码

import pandas as pddf = pd.DataFrame([['red', 'M', 10.1, 'type1'], ['blue', 'L', 12.5, 'type1'], ['white', 'XL', 13.3, 'type2']])df.columns = ['color', 'size', 'price', 'type']from sklearn.preprocessing import One

2022-01-03 11:43:10 551

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除