- 博客(5)
- 收藏
- 关注
原创 Python机器学习
sklearn 提供了多种数据预处理工具。例如,可以使用类对数据进行标准化处理,将数据转换为均值为 0、方差为 1 的分布。这对于许多机器学习算法(如支持向量机、K - 近邻算法等)来说是很重要的预处理步骤,因为这些算法对数据的尺度比较敏感。通过标准化,可以确保不同特征的尺度一致,避免某些特征因为取值范围大而对模型产生过大的影响。还能进行数据的归一化处理,将数据缩放到一个特定的范围(如 [0,1]),这在一些场景下(如处理图像数据或者需要使用梯度下降优化的算法)很有用。
2025-05-14 11:06:23
377
原创 爬虫数据分析
通过上述代码可以爬取网站的html代码(里面的网址可换成任意网址)运行结果截图:但是如果不对爬虫进行伪装很容易被浏览器拦下来所以我们要对爬虫进行伪装让他尽可能想一个用户在访问。
2025-04-23 11:17:51
646
原创 基于ai辅助生成数据可视化
通过AI工具的辅助,我们快速完成了数据分析与可视化的项目。AI工具帮助生成代码框架,而我们通过手动调整和优化,确保了代码的准确性和可视化效果。本教程将展示如何使用AI工具(如豆包、腾讯元宝或深度思考)辅助完成一个Python数据分析与可视化项目。我们将以一个简单的电商销售数据为例,完成数据清洗、分析和可视化。:使用AI工具(如豆包)生成代码框架,结合Python库(如Pandas、Matplotlib)完成分析。:获取销售数据(CSV格式),包含日期、商品名称、销售额等字段。:销售趋势和热门商品的发现。
2025-04-07 17:39:46
387
原创 python的自然语言处理
在python语言中读取文档和撰写文档需要两个库文件:xlrd xlwt。至于统计词频和提取关键词up学的不怎么好就不误导群众了。精准模式:适合文本分析(默认模式)其中xlwt库 用于写入excel数据。分词可以用到一个名叫jieba的库。饼状图可以充分体现部分与整体的关系。xlrd库用于读取excel文件。最后就是可视化的问题。
2025-03-17 17:05:33
191
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人