我只喝milk。
码龄7年
关注
提问 私信
  • 博客:22,591
    问答:3,791
    26,382
    总访问量
  • 16
    原创
  • 73,133
    排名
  • 163
    粉丝

个人简介:听障|计算机本科妹子|喜欢数据分析,在入坑机器学习ing|求内推(base杭州)

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:江苏省
  • 加入CSDN时间: 2017-06-12
博客简介:

我只喝milk的个人博客

博客描述:
在这里,我将与大家分享有关包括但不限于数据分析、数据可视化以及机器学习的各种案例研究和技术文章。
查看详细资料
  • 原力等级
    领奖
    当前等级
    3
    当前总分
    211
    当月
    4
个人成就
  • 获得222次点赞
  • 内容获得7次评论
  • 获得337次收藏
  • 代码片获得4,451次分享
创作历程
  • 9篇
    2024年
  • 7篇
    2023年
成就勋章
TA的专栏
  • 数据分析
    10篇
  • Python
    15篇
  • 机器学习
    5篇
  • MySQL
    1篇
兴趣领域 设置
  • Python
    pythonpandasmatplotlibipython
  • 编程语言
    c++c语言
  • 大数据
    mysql数据库
创作活动更多

如何做好一份技术文档?

无论你是技术大神还是初涉此领域的新手,都欢迎分享你的宝贵经验、独到见解与创新方法,为技术传播之路点亮明灯!

182人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
搜TA的内容
搜索 取消

Python实战10:印度女性安全现状及改进措施探讨

本数据集涵盖了从2001年至2021年间针对妇女的一系列犯罪行为的全州统计数据。该数据集详细记录了各类针对女性的犯罪案例,本研究项目将重点对这些犯罪行为进行地区分布、时间趋势以及相互关联性的深入分析。
原创
发布博客 2024.09.10 ·
1084 阅读 ·
19 点赞 ·
0 评论 ·
13 收藏

Python实战09:随机森林算法在天气分类的应用(入门)

本案例通过综合运用统计方法,包括皮尔逊相关系数、T/U检验及卡方检验等,精准筛选对客户流失具有预测价值的特征。随后被输入随机森林模型...
原创
发布博客 2024.08.12 ·
838 阅读 ·
18 点赞 ·
0 评论 ·
16 收藏

Python实战08:在线书店主题对用户参与度与购买率的影响分析

一家在线书店正在优化其网站设计,旨在通过提供深色主题和浅色主题来提高用户参与度与购买率。本项目通过描述性可视化、假设检验和皮尔逊相关性分析方法来探索不同主题对用户的影响。
原创
发布博客 2024.08.02 ·
854 阅读 ·
13 点赞 ·
0 评论 ·
25 收藏

Python实战07:麦当劳用户市场调研分析

(新手入门)本数据集提供了针对麦当劳消费用户的市场调研信息,可以用于深入了解顾客偏好、评估产品与服务质量、优化价格策略等
原创
发布博客 2024.07.18 ·
1099 阅读 ·
19 点赞 ·
0 评论 ·
19 收藏

Python实战06:电商用户行为分析与聚类

本研究通过分层分析深入探讨了用户活跃度,结合RFM模型对用户价值进行了全面评估。且进一步探索了将融合RFM得分与原始指标的复合特征作为K-Means聚类算法的输入,以期实现更精准的用户细分。然而,实验结果显示这种方法并未达到预期的聚类效果,提示在用户分群策略中需审慎考量特征工程的选择与优化。
原创
发布博客 2024.07.05 ·
1264 阅读 ·
20 点赞 ·
0 评论 ·
20 收藏

Python实战05:银行客户流失分析与预测(超详细)

本研究案例通过综合运用统计方法,包括皮尔逊相关性、T/U检验及卡方检验,精准筛选对客户流失具有预测价值的特征。这些精选特征随后被输入随机森林模型,经由精细的参数调优以优化模型性能,特别是针对ROC-AUC值进行最大化,确保预测既准确又具备高度区分力。
原创
发布博客 2024.06.11 ·
4322 阅读 ·
36 点赞 ·
1 评论 ·
52 收藏

Python实战04:关于全国旅游景点数据的探索

数据处理主要用pandas和numpy,可视化主要用matplotlib和seaborn,然后从中可以学习到如何使用geopandas处理地理坐标。
原创
发布博客 2024.05.14 ·
1658 阅读 ·
23 点赞 ·
2 评论 ·
32 收藏

Python实战03:关于运动员伤病预测数据的探索

数据处理主要用pandas和numpy,可视化主要使用matplotlib、plotly、seaborn,机器学习算法模型使用了随机森林算法来预测特征的重要性。
原创
发布博客 2024.04.01 ·
894 阅读 ·
6 点赞 ·
2 评论 ·
21 收藏

Python实战02:披萨订单数据分析

每天销量最好是在中午12点到13点和傍晚18点到19点,而下午和晚上仍有一些销量;每日销量大概在100-200范围之内;每周销量大概在6000-8000范围之内,其中周五销量最高;从月度销量来看,销量最好的是七月,九月十月跌倒低估了,整体来看销量有些波动;在每个季节中销量似乎是差不多,由此可见披萨基本上不受季节影响。披萨平均单价为16.5元,其中尺寸越大单价就越贵,其中L码披萨销量最高,依次是M和S码;不同种类披萨单价都差不多,其中经典披萨很受人喜欢,其余三个种类不相上下。
原创
发布博客 2024.03.11 ·
2010 阅读 ·
25 点赞 ·
0 评论 ·
45 收藏

使用Python的matplotlib设置多子图方法

plt.subplots()、fig.add_subplots()、plt.subplot()、fig.subplots_adjust()
原创
发布博客 2023.11.29 ·
571 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Python实战01:电商用户消费行为分析

python数据分析案例实战——电商用户消费行为分析(附详细的注释),来跟我一起学习数据分析的基本流程和方法吧~
原创
发布博客 2023.11.17 ·
2123 阅读 ·
17 点赞 ·
2 评论 ·
44 收藏

order2021.xlsx

发布资源 2023.11.16 ·
xlsx

Python的GUI库——Tkinter快速入门

请先确保本电脑下载了Tkinter库,再跟我一起踏上Tkinter之旅吧~设计界面时至少有一个窗口,对否?以下demo的800x600是该窗口的大小,+0+50是该窗口离屏幕左上角的水平偏移和垂直偏移。如果想让该窗口位于屏幕中心呈现,该如何做?使用winfo_screenwidth方法即可获取该屏幕的宽度,然后进行计算水平偏移,高度同理。例如:.title()、.maxsize/minsize()、.config()、.iconbitmap()等等。是对用户拖曳该窗口的最大/小尺寸的限制。
原创
发布博客 2023.09.07 ·
165 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

使用Python统计日本核污染水排海话题的词频

1.将以下文章内容复制拷贝到到word:日本正式启动核污染水排海,海鲜还能吃吗?
原创
发布博客 2023.08.28 ·
175 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Excel数据同步到数据库的Python自动化脚本

我上个月搭建了finebi看板,需要每天定时更新数据,但数据源是excel(finebi暂时不支持),需要自己在服务器搭建mysql,再写个excelToMySQL的python自动化脚本然后通过服务器的任务计划程序设置定时启动就能实现。
原创
发布博客 2023.08.24 ·
826 阅读 ·
1 点赞 ·
0 评论 ·
8 收藏

Python数据清洗——不同数据类型缺失值的填充

现有两张excel文件,通过python实现定时自动更新到数据库。如果源数据有缺失值,数据库将会报错:nan can not be used with MySQL。就是说需要处理好缺失值,就万事大吉了。
原创
发布博客 2023.08.24 ·
426 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

在windows server 2012r2下安装MySQL(新手避雷指南)

在windows server 2012r2下部署数据库MySQL,一路碰到各种坑,特此将其记录下来,为小伙伴扫雷,安全下车。
原创
发布博客 2023.08.07 ·
4226 阅读 ·
24 点赞 ·
0 评论 ·
37 收藏

小学生计算机辅助教学系统 c语言

发布问题 2017.06.12 ·
3 回答
加载更多