机器学习
文章平均质量分 94
我只喝milk。
听障|计算机本科妹子|喜欢数据分析,在入坑机器学习ing|求内推(base杭州)
展开
-
Python实战02:披萨订单数据分析
每天销量最好是在中午12点到13点和傍晚18点到19点,而下午和晚上仍有一些销量;每日销量大概在100-200范围之内;每周销量大概在6000-8000范围之内,其中周五销量最高;从月度销量来看,销量最好的是七月,九月十月跌倒低估了,整体来看销量有些波动;在每个季节中销量似乎是差不多,由此可见披萨基本上不受季节影响。披萨平均单价为16.5元,其中尺寸越大单价就越贵,其中L码披萨销量最高,依次是M和S码;不同种类披萨单价都差不多,其中经典披萨很受人喜欢,其余三个种类不相上下。原创 2024-03-11 15:55:46 · 1799 阅读 · 0 评论 -
Python实战03:关于运动员伤病预测数据的探索
数据处理主要用pandas和numpy,可视化主要使用matplotlib、plotly、seaborn,机器学习算法模型使用了随机森林算法来预测特征的重要性。原创 2024-04-01 15:05:52 · 788 阅读 · 2 评论 -
Python实战05:银行客户流失分析与预测(超详细)
本研究案例通过综合运用统计方法,包括皮尔逊相关性、T/U检验及卡方检验,精准筛选对客户流失具有预测价值的特征。这些精选特征随后被输入随机森林模型,经由精细的参数调优以优化模型性能,特别是针对ROC-AUC值进行最大化,确保预测既准确又具备高度区分力。原创 2024-06-11 16:01:31 · 2668 阅读 · 1 评论 -
Python实战06:电商用户行为分析与聚类
本研究通过分层分析深入探讨了用户活跃度,结合RFM模型对用户价值进行了全面评估。且进一步探索了将融合RFM得分与原始指标的复合特征作为K-Means聚类算法的输入,以期实现更精准的用户细分。然而,实验结果显示这种方法并未达到预期的聚类效果,提示在用户分群策略中需审慎考量特征工程的选择与优化。原创 2024-07-05 13:24:56 · 900 阅读 · 0 评论 -
Python实战09:随机森林算法在天气分类的应用(入门)
本案例通过综合运用统计方法,包括皮尔逊相关系数、T/U检验及卡方检验等,精准筛选对客户流失具有预测价值的特征。随后被输入随机森林模型...原创 2024-08-12 14:48:55 · 702 阅读 · 0 评论