自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 基于 Python 的机器学习总结

机器学习项目通常遵循一定的流程,以 Python 为工具,我们可以高效地完成每一个环节。数据收集:从各种数据源,如数据库、文件系统、网络爬虫等获取原始数据。Python 提供了丰富的库来实现数据的读取,如pandas可以轻松读取 CSV、Excel、SQL 等多种格式的数据,requests库可以用于从网页爬取数据。数据预处理:原始数据往往存在缺失值、异常值、噪声等问题,需要进行预处理。使用pandas可以方便地处理缺失值(如删除缺失行或填充缺失值)、清洗数据;Numpy可以对数据进行数值计算和变换;

2025-05-14 11:39:10 1551

原创 Python爬虫教程

在开始爬取之前,务必查看网站的 robots.txt 文件,了解哪些页面可以被爬取,哪些不可以。在开始编写爬虫之前,你需要明确自己要爬取的数据是什么以及从哪些网站获取这些数据。在完成爬虫编写后,你需要进行测试,确保爬虫能够正常工作并能够准确地提取所需的数据。同时,你还可以对爬虫进行优化,例如提高爬取效率、减少资源消耗等。Python 是编写爬虫最常用的编程语言,因为它有丰富的库可以帮助你快速实现爬虫功能。在爬虫运行过程中,可能会遇到各种错误,例如网络连接错误、解析错误等。在这个示例中,我们使用。

2025-04-23 10:47:29 2033

原创 数据分析可视化

title_opts=opts.TitleOpts(title="微信好友省份分布图", subtitle="数据来源:微信好友", pos_right="center"),.set_series_opts(label_opts=opts.LabelOpts(is_show=True)) # 是否显示省市名称。.set_global_opts(title_opts=opts.TitleOpts(title="关系图示例"))# 系列数据项,格式为[(key1,value1),(key2,value2)]

2025-04-07 17:49:50 646

原创 借助AI工具完成软件项目

本项目将使用泰坦尼克号乘客数据集,通过 Python 进行数据探索、清洗和可视化,以了解泰坦尼克号乘客的生存情况与不同特征之间的关系。女性乘客的生存率明显高于男性乘客。舱位等级越高,乘客的生存率越高。年龄分布较为广泛,且年龄与生存情况之间没有明显的线性关系。

2025-04-07 17:46:18 1396

原创 自然语言处理

nltk用于英文文本的分词、词性标注、词频统计等。:对英文文本进行分词。:对文本进行词性标注。:统计词频。jieba中文分词库,用于对中文文本进行分词。:对中文文本进行分词。matplotlib数据可视化库,用于绘制柱状图、饼状图、点状图等。:绘制柱状图。:绘制饼状图。matplotlib.pyplot.scatter():绘制点状图。wordcloud用于生成词云图。:生成词云。easyguitkinter提供简单的图形用户界面(GUI),easygui适合简单交互,tkinter。

2025-03-17 17:43:50 739 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除