自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 Python机器学习算法

通过本文的学习,您已经了解了机器学习的基本概念,并掌握了使用Python和Scikit-learn实现常见机器学习算法的方法。机器学习是一个广阔而深入的领域,希望本文能为您打开机器学习的大门,激发您进一步探索的兴趣。在实际应用中,您可能会遇到更复杂的问题和数据,这就需要不断学习和实践,尝试不同的算法和技术,以找到最佳的解决方案。同时,关注机器学习领域的最新研究成果和技术动态,也是保持竞争力的关键。

2025-05-14 11:00:04 406

原创 爬虫学习总结

通常需要在代码中获取授权链接,引导用户在浏览器中完成授权操作,获取授权码后,再通过授权码获取访问令牌,进而使用令牌访问用户授权的数据。在多页爬虫基础上,当页面链接不是简单的页码规律时,需要通过解析页面中的超链接来获取下一页或相关页面链接。对于需要登录才能访问数据的网站,可模拟登录过程。以常见的用户名密码登录为例,通过分析登录请求的 POST 参数,构造包含用户名、密码等信息的请求数据,发送到登录接口。1. 设置时间:避免过于频繁且规律的请求,合理设置请求间隔,模拟人类正常浏览速度,降低被识别为爬虫的风险。

2025-04-23 10:47:18 836

原创 学生信息数据分析与可视化

通过对 “所在城市” 列的计数,以柱状图形式展示各城市学生数量,方便对比不同城市的学生分布差异。通过运用多种数据处理和可视化工具,旨在清晰呈现学生各项信息的分布特征,为后续可能的教学管理等工作提供数据支持。此过程先统计各省份的学生数量,将数据整理成合适格式后添加到地图图表中,最后生成 html 格式的可视化文件。在确定区间数量和范围时,可根据实际数据特点进行调整,以便更准确地反映成绩分布特征。在这个过程中,可根据需要调整词云的形状、颜色等参数,突出显示高频词汇。通过对 “性别” 列进行计数统计,然后利用。

2025-04-07 17:26:27 376

原创 电商网站销售情况

在整个过程中,你可以随时向豆包提问,比如某个函数的用法、代码报错如何解决等。豆包可以帮助你理解 Python 语法、数据分析概念以及优化代码等,辅助你更好地完成这个软件项目中的数据分析与可视化部分。假设我们要分析某电商网站一段时间内商品的销售情况,包括不同商品的销售额、销售量等,通过可视化展示找出畅销商品和销售趋势等信息。,包含字段:商品名称、销售数量、单价、销售日期。你可以自行创建模拟数据或者从实际业务系统导出类似数据。假设已有一份 CSV 格式的销售数据文件。

2025-04-07 17:19:44 471

原创 微信好友数据分析案例

一站式分析:从数据获取到可视化、文本 / 图像分析全流程覆盖交互友好:Tkinter 界面降低操作门槛,适合非技术用户可扩展性:模块化设计便于新增功能(如好友聊天记录分析)

2025-04-07 16:17:41 958

原创 自然语言处理编程文档

库名称用途版本要求os文件路径操作jieba中文分词≥0.42.1wordcloud词云生成≥1.9.1.1matplotlib基础可视化≥3.7.1seaborn高级可视化≥0.12.2gensim摘要生成/相似度计算≥4.3.1snownlp情感分析≥0.12.3本程序实现了从基础文本处理到高级语义分析的完整NLP流程,采用模块化设计便于功能扩展。通过组合使用jieba、gensim等库,可快速构建中文文本处理系统。

2025-03-17 17:05:55 481

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除