- 博客(282)
- 收藏
- 关注
原创 Python数据分析案例83——宏观经济指标与沪深指数实证研究分析
本研究基于2015-2024年数据,采用多元回归方法分析了12个宏观经济变量对沪深300指数的影响。在解决多重共线性问题(剔除M0和M2)后,沪深300指数走势主要受三大因素驱动:投资者情绪波动, 全球金融环境变化, 通胀预期调整。
2025-08-17 11:36:31
2158
原创 Python数据分析案例82——基于机器学习的航空公司满意度分析
本案例就是一个分类问题的全流程展示。用各种特征去预测客户对这个航空公司的体验是不是满意的一个分类模型,包括数据的预处理,探索性分析变量的可视化特征工程,特征组合数据标准化模型的选择和构建模型的训练对比评估,评价指标,变量重要性排序以及模型的解释。解释用的是shap包。
2025-08-17 10:52:11
1209
原创 Python数据分析案例81——数据驱动的营销优化(模型预测购买行为)
本文基于营销活动数据集,通过数据分析和机器学习模型预测客户购买行为。包括数据的读取,清洗,预处理,特征工程,可视化,模型对比,超参数搜索,特征重要性风险,模型评估。研究发现客户对营销活动的响应与最近消费时间、注册时长及特定活动参与度显著相关,而学历和婚姻状态影响较小。采用梯度提升模型表现最佳(AUC=0.87,KS=0.586),能有效预测客户行为。
2025-08-03 11:40:48
984
原创 Python数据分析案例80——KYC客户风险等级评分模型
机器学习全流程,读取数据,探索性分析,可视化,预处理,特征工程,异常值处理。建模,模型对比,交叉验证,超参数搜索,模型评估,特征变量重要性。
2025-08-03 11:16:40
1142
原创 Python数据分析案例79——基于征信数据开发信贷风控模型
基于征信数据构建了一个机器学习风控模型。研究首先对多源征信数据进行合并、清洗和特征工程,包括缺失值处理、异常值处理、变量标注等。通过可视化分析变量分布特征后,采用重采样技术处理样本不平衡问题。实验比较了10种分类算法,最终选择随机森林模型并进行超参数优化。
2025-07-19 10:06:04
1104
原创 Python数据分析案例78——客户无监督聚类分析(5种聚类方法)
使用k均值,DBSCAN,HDBSCAN,等无监督方法进行客户聚类数据分析,计算评价指标Inertia:Inertia,Silhouette Score,,Davies-Bouldin Score ,Calinski-Harabasz Score等
2025-07-19 09:24:50
1550
原创 Python数据分析案例77——基于机器学习的餐厅评论反欺诈识别
对比了普通的机器学习模型,常见的树模型(xgboos,lgbm)相比于图神经网络的效果,发现图神经网络并不能取得更好的效果,图结构特征并不能带来更好的提升,在表格数据里面表现最好的还是树模型。
2025-06-28 11:36:35
1107
原创 Python量化交易12——Tushare全面获取各种经济金融数据
获取K线数据,市盈率,市净率,换手率,还有宏观经济的GDP,LPR,CPI,PPI,PMI,M0,M1,M2,还有财务报表里面的指标,资产负债表,现金流量表,利润表等
2025-05-29 17:08:41
3033
原创 Python数据分析案例75——基于图神经网络的交通路段流量时间序列预测
图结构数据,将道路间的距离作为边的权重,利用图卷积层提取空间特征,再通过LSTM层处理时间序列数据,进行交通流量预测。
2025-05-10 16:18:55
1691
原创 Python数据分析案例74——基于内容的深度学习推荐系统(电影推荐)
电影数据集构建推荐系统,结合内容推荐和深度学习两种方法。预处理、探索性分析,加权平均法和余弦相似度进行基于内容的推荐,计算电影的相似度并生成推荐结果。并且使用深度学习模型,构建评分预测和检索任务,用户个性化推荐和评分预测。
2025-05-10 15:19:48
2194
原创 Python数据分析案例73——基于多种异常值监测算法探查内幕交易信息
使用无监督聚类的一些异常检测算法,进行内幕交易监测,计算一些评价指标——准确率,精准率,召回率,F1值,特异度,灵敏度,ROC,AUC。
2025-04-25 23:52:45
1514
1
原创 Python数据分析案例72——基于股吧评论数据的情感分析和主题建模(LDA)
股吧的评论数据,对文本进行情感分析,主题分析,聚类分组聚合,中文分词,词向量化,LDA主题建模分析
2025-04-25 21:39:39
2155
原创 Python数据分析案例71——基于十种模型的信用违约预测实战
机器学习模型预测贷款违约实战,描述性统计,可视化,模型选择对比,评价指标,混淆矩阵,ROC曲线
2025-02-08 14:34:43
2305
3
原创 Python自动化小技巧28——批量获取上市公司财务数据(利润表、现金表、资产负债表)
tushare批量获取指定上市公司财务数据,并且可以进行财务指标计算分析。做成应用,不需要写代码也能用。
2025-01-19 19:42:36
4255
原创 Python数据分析案例70——基于神经网络的时间序列预测(滞后性的效果,预测中存在的问题)
使用十种神经网络做时间序列预测对比,全流程代码,浅谈效果和一些相关的问题。
2025-01-19 17:50:59
2750
2
原创 Python自动化小技巧26——百度云OCR识别文档格式转化(批量将图片自动转为表格)
百度云OCR识别文档格式转化,request请求就行,使用简洁,可以批量将图片自动转为表格
2025-01-04 12:31:34
1534
原创 Python数据分析案例68——基于SARIMA的AQI空气质量预测
SARIMA时间序列分析全流程,数据的预处理,重采样,时间序列画图,平稳性检验,季节性检验,纯随机性检验,差分模型阶数确定。残差检验,模型预测,模型评估以及可视化。
2024-12-21 12:19:57
1898
1
原创 Python机器学习20——三十种数据降维方法全面解析(最全数据降维方法总结)
三十种数据降维的方法使用(skleran),全面解析,数据降维算法使用全面总结。
2024-12-14 15:29:08
2270
原创 Python数据分析案例65——基于深度学习的音频文件分类(音频文件特征提取和模型构建)
提取音频文件特征,然后进行神经网络分类音乐所属类别。
2024-11-25 17:06:34
2436
2
原创 无需代理 调用OpenAI的大模型API接口(Python)
无需代理就能使用openai最新模型,无需一次性支持高昂的会员月费无论你是新手小白,需要直接使用类似官网的网页端的接口,还是有一定python基础的开发者,需要写入代码自动化调用大模型接口写脚本处理工作流,都能满足你。
2024-11-22 11:43:21
3791
原创 Python数据分析案例64——杭帮菜美食探索数据分析可视化
杭帮菜分析可视化,柱状图,箱线图,直方图,饼图,小提琴图,词云图,散点图,六方形图,
2024-11-09 16:47:40
2288
1
原创 Python数据分析案例63——智能车价预测系统的构建与应用
汽车价格预测,机器学习全流程(数据的读取,清洗特征工程可视化分析模型的训练选择。交叉验证搜索超参数变量重要性分析。)
2024-11-09 12:55:24
1515
原创 Python数据分析案例62——基于MAGU-LSTM的时间序列预测(记忆增强门控单元)
加入了模态分解,加入了分位数损失函数构建的分位数神经网络,然后在lstm上面加了记忆增强门控单元,实现更好的效果。
2024-11-02 22:29:50
1058
原创 Python数据分析案例61——信贷风控评分卡模型(A卡)(scorecardpy 全面解析)
传统信贷评分卡模型,A卡模型,逻辑回归,IV变量筛选,AUC,KS
2024-11-02 19:04:16
6288
4
原创 Python数据分析案例59——基于图神经网络的反欺诈交易检测(GCN,GAT,GIN)
三种图神经网络的实现,反欺诈场景,GCN,GAT,GIN
2024-09-16 16:49:18
5610
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅