数据分析项目笔记
文章平均质量分 93
各种数据分析项目的过程记录
Avasla
好好学习,天天向上。
展开
-
用户流失分析:如何使用Python训练一个用户流失预测模型?
在当今商业环境中,客户流失分析是至关重要的一环。随着市场竞争的加剧,企业需要更加注重保持现有客户,并深入了解他们的离开原因。本文探讨了用户流失分析的核心概念以及如何构建客户流失预测模型的案例。通过分析用户行为数据和交易模式,以及利用机器学习算法,企业可以更好地预测潜在的流失风险,并采取相应措施提高客户满意度。随着持续性的监控和迭代,企业将能够建立智能化的流失分析体系,为业务发展提供持续支持。原创 2024-05-29 17:06:41 · 1925 阅读 · 0 评论 -
【机器学习项目】电信行业的客户流失预测模型
在电信行业,顾客可以从各种服务提供商中选择。顾客流失被定义为顾客停止与公司或服务进行业务往来的情况。该项目任务是使用提供的其余数据建立一个预测客户流失的模型。原创 2024-05-17 10:00:00 · 692 阅读 · 0 评论 -
【数据科学】Python开源库数据集大全(附代码)
还在发愁找不到合适的数据集嘛? 本文介绍了数据科学中常用的数据集库及加载代码,包括scikit-learn、NLTK、TensorFlow Datasets、Keras Datasets、Statsmodels、Seaborn等。原创 2023-11-20 16:38:07 · 4443 阅读 · 0 评论 -
数据分析初学者的热门项目推荐(附数据集链接)
本文介绍了适合初学者的多个数据分析项目,涵盖经济、住房、媒体等领域,包括薪资数据、市场营销、租赁与住房、娱乐音乐、经济公共数据分析等。同时推荐了高级项目,如谷歌趋势和《纽约时报》电影评论情感分析,介绍如何使用API等高级技巧进行数据分析。原创 2023-11-20 10:00:00 · 1742 阅读 · 0 评论 -
零售行业交易数据分析(3)——群组/同期群分析(留存率分析)
本文介绍了群组分析(同期群分析)的方法以及Python实现过程,并继续对一家零售公司的交易数据进行用户留存分析和可视化。原创 2023-01-07 22:25:33 · 985 阅读 · 0 评论 -
零售行业交易数据分析(2)——RFM模型分类及可视化(Python实现)
分析一年的零售交易数据,从用户的角度,使用RFM模型对用户进行打分归类,并对结果进行可视化展示。原创 2022-12-30 19:33:31 · 2410 阅读 · 0 评论 -
零售行业交易数据分析(1)——客户终身价值(CLTV)计算和回归预测模型(Python)
本文整理了客户终身价值(CLV或者CLTV)的相关概念,并对一家英国线上零售公司的一年交易数据进行分析,计算该公司所有客户的CLV并且建立回归预测模型。原创 2022-12-22 02:02:39 · 5594 阅读 · 0 评论 -
汽车价格预测回归分析模型
回归分析案例:使用python的sklearn库对汽车历史价格信息进行回归分析,包括数据预处理、特征相关性分析等步骤,最后利用lasso回归建立价格预测模型。原创 2020-12-21 18:08:10 · 8534 阅读 · 10 评论 -
时间序列预测的8种常用方法简介
时间序列预测8种常用方法简介,包括朴素预测法、简单平均法、移动平均法、简单指数平滑法、霍尔特(Holt)线性趋势法、Holt-Winter方法、AMRIA。原创 2020-12-08 22:01:17 · 49909 阅读 · 3 评论 -
使用Python建立时间序列(ARIMA、MA、AR)预测模型
导入数据import pandas as pdimport numpy as npimport matplotlib.pyplot as plt%matplotlib inlinefrom matplotlib.pylab import rcParamsrcParams['figure.figsize']=15,6#导入数据并查看data=pd.read_csv('Airpassengers.csv')print(data.head())print('\nData Types:'原创 2021-04-08 21:26:35 · 19644 阅读 · 12 评论 -
贝叶斯算法(新闻分类任务)
建立新闻文章分类模型,使用TF-IDF和词袋模型构建特征,基于贝叶斯算法来完成分类任务。原创 2020-09-22 17:08:02 · 5654 阅读 · 14 评论 -
Big Mart Sales prediction 商场销售预测分析项目
BigMart数据集收集了2013年不同城市中10个商场、1559个产品的销售数据。该项目目的是建立一个模型去预测每个产品在具体商场的销售情况,以协助决策者提高整体的销售情况。原创 2020-09-07 00:42:25 · 6262 阅读 · 19 评论 -
SQL淘宝用户数据分析
本项目使用sql和Excel对淘宝用户行为数据进行分析和可视化展示,通过建立用户行为转化漏斗模型、商品销售分析、使用RFM模型对用户分层,找到针对不同商品、用户群体的营销策略。原创 2020-08-28 22:50:22 · 2465 阅读 · 0 评论 -
银行贷款预测模型项目(Loan Prediction)(下)
前言:在《银行贷款预测模型项目(Loan Prediction)(上)》中,记录了整个项目的数据分析和预处理过程。下篇继续记录项目的建模流程,一共分成两个部分:第一部分(Part1)建立模型(Part I)1. 数据集切分将目标变量和其他数据变量分开。###modeltrain = train.drop('Loan_ID',axis=1)test=test.drop('Loan_ID',axis=1)X=train.drop('Loan_Status',1)y=train.Loan_St原创 2020-08-10 14:21:31 · 6958 阅读 · 3 评论 -
银行贷款预测模型项目(Loan Prediction)(上)
项目背景银行选择是否贷款给申请人,是日常生活中经典的二分类问题。在审批流程中,需要考虑贷款申请人的各种信息,比如家庭情况、经济情况、房子情况等等,经过综合分析这些因素最后决定是否要贷款给申请人,即审批通过还是拒绝。数据探索性分析1. Understand the Data了解数据#导入模块包import pandas as pd import numpy as np # For mathematical calculations import seab原创 2020-08-10 13:55:03 · 12631 阅读 · 4 评论 -
探索性数据分析(四)——特征工程(对数转换、标准化/归一化、离散化、标签编码、独热编码、Dummy变量)
特征工程的基础介绍和常用方法总结,包括对数转换、特征标准化、离散化、Label Encoder、OneHot Encoder 以及 Dummy Variables。原创 2020-09-02 11:33:26 · 7026 阅读 · 0 评论 -
探索性数据分析(三)—— 异常值处理
异常值是什么?什么原因导致异常值。找出和剔除异常值的方法介绍原创 2020-08-31 21:20:10 · 6374 阅读 · 0 评论 -
探索性数据分析EDA(二)—— 缺失值处理
主要内容为缺失值处理方法介绍,以及相关python代码及sklearn.impute的使用介绍。原创 2020-08-10 10:16:55 · 2553 阅读 · 0 评论 -
探索性数据分析EDA(一)——变量识别与分析
1.数据探索和预处理的步骤处理步骤:1)变量识别 (Variable Identification)2)单变量分析 (Univariate Analysis)3)双变量分析(Bi-variate Analysis)4)缺失值处理 (Missing values treatment)5)异常值处理(Outlier treatment)6)变量转换(Variable transformation)7)变量构造 (Variable creation)1)变量识别 (Variable Identi原创 2020-08-05 10:39:56 · 5025 阅读 · 2 评论 -
鸢尾花数据分析项目(附详细代码和结果)
数据集解释:https://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_iris.html#sklearn.datasets.load_iris1. 数据导入鸢尾花数据可直接从Sklearn中的datasets 导出。该Iris中有两个属性,分别是:iris.data和iris.target。data里是一个矩阵,每一列代表了萼片或花瓣的长宽,一共4列,每一列代表某个被测量的鸢尾植物,一共采样了150条记录。tar原创 2020-06-29 18:53:56 · 13698 阅读 · 2 评论