2401_83196531-CSDN博客

原创基于 Python 的机器学习总结

机器学习项目通常遵循一定的流程，以 Python 为工具，我们可以高效地完成每一个环节。数据收集：从各种数据源，如数据库、文件系统、网络爬虫等获取原始数据。Python 提供了丰富的库来实现数据的读取，如pandas可以轻松读取 CSV、Excel、SQL 等多种格式的数据，requests库可以用于从网页爬取数据。数据预处理：原始数据往往存在缺失值、异常值、噪声等问题，需要进行预处理。使用pandas可以方便地处理缺失值（如删除缺失行或填充缺失值）、清洗数据；Numpy可以对数据进行数值计算和变换；

2025-05-14 11:39:10 1551

原创 Python爬虫教程

在开始爬取之前，务必查看网站的 robots.txt 文件，了解哪些页面可以被爬取，哪些不可以。在开始编写爬虫之前，你需要明确自己要爬取的数据是什么以及从哪些网站获取这些数据。在完成爬虫编写后，你需要进行测试，确保爬虫能够正常工作并能够准确地提取所需的数据。同时，你还可以对爬虫进行优化，例如提高爬取效率、减少资源消耗等。Python 是编写爬虫最常用的编程语言，因为它有丰富的库可以帮助你快速实现爬虫功能。在爬虫运行过程中，可能会遇到各种错误，例如网络连接错误、解析错误等。在这个示例中，我们使用。

2025-04-23 10:47:29 2033

原创数据分析可视化

title_opts=opts.TitleOpts(title="微信好友省份分布图", subtitle="数据来源：微信好友", pos_right="center"),.set_series_opts(label_opts=opts.LabelOpts(is_show=True)) # 是否显示省市名称。.set_global_opts(title_opts=opts.TitleOpts(title="关系图示例"))# 系列数据项，格式为[(key1,value1),(key2,value2)]

2025-04-07 17:49:50 646

原创借助AI工具完成软件项目

本项目将使用泰坦尼克号乘客数据集，通过 Python 进行数据探索、清洗和可视化，以了解泰坦尼克号乘客的生存情况与不同特征之间的关系。女性乘客的生存率明显高于男性乘客。舱位等级越高，乘客的生存率越高。年龄分布较为广泛，且年龄与生存情况之间没有明显的线性关系。

2025-04-07 17:46:18 1396

原创自然语言处理

nltk用于英文文本的分词、词性标注、词频统计等。：对英文文本进行分词。：对文本进行词性标注。：统计词频。jieba中文分词库，用于对中文文本进行分词。：对中文文本进行分词。matplotlib数据可视化库，用于绘制柱状图、饼状图、点状图等。：绘制柱状图。：绘制饼状图。matplotlib.pyplot.scatter()：绘制点状图。wordcloud用于生成词云图。：生成词云。easyguitkinter提供简单的图形用户界面（GUI），easygui适合简单交互，tkinter。

2025-03-17 17:43:50 739 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 基于 Python 的机器学习总结

原创 Python爬虫教程

原创 数据分析可视化

原创 借助AI工具完成软件项目

原创 自然语言处理

空空如也

空空如也

原创基于 Python 的机器学习总结

原创数据分析可视化

原创借助AI工具完成软件项目

原创自然语言处理