- 博客(5)
- 收藏
- 关注
原创 服装图片分类
glob: 用于获取文件路径列表。numpy 和 pandas: 用于数据处理和数组操作。PIL.Image: 用于图像处理。warnings: 用于忽略警告信息。其他导入了深度学习相关的模块tensorflow.keras.layers、tensorflow.keras.models和tensorflow.keras.optimizers。
2024-06-23 21:25:57 1015
原创 深入解析数据预处理技术
数据清洗是数据预处理的重要环节,可以帮助提高数据质量,减少错误和噪声的影响,使数据更适合后续分析和应用。数据清洗的对象是数据,目的是发现并纠正数据文件中可识别的错误,包括检查数据一致性,处理无效值和缺失值等。理解数据:在选择数据预处理方法之前,首先要深入理解数据的特点、分布和含义。这包括了解数据的类型(数值型、类别型、文本型等)、数据的缺失情况、数据的分布和偏度等。只有对数据有深入的理解,才能选择合适的预处理方法。选择合适的缺失值处理方法:根据缺失值的类型和缺失值的比例选择合适的缺失值处理方法。
2024-05-13 20:47:46 1514
原创 深入理解Pandas中的Series对象
创建Series对象主要使用Pandas的Series()方法,语法如下:参数说明:data :表示数据,支持 Python 字典、多维数组、标量值(即只有大小,没有方向的量。也就是说,只是一个数值,如 s = pd . Series (5))index :表示行标签(索引)返回值: Series 对象。
2023-12-08 17:12:35 1961
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人