- 博客(3)
- 收藏
- 关注
原创 【python机器学习——python基础】
数字(Number)字符串(String)列表(List)元组(Tuple)集合(Set)字典(Dictionary)区别:整数和浮点数是数值类型,用于存储数值;字符串是文本类型,用于存储文本数据;列表、元组和字典是复合类型,用于存储多个值;集合是无序的,唯一的,用于存储唯一的元素集合;布尔值是特殊的整数类型,只有两个值 True 和 False,用于条件判断。
2024-05-13 18:23:23
332
原创 【python 数据预处理】
盒须图,散点图进行协同分析,可以方便的发现连续型变量是否存在疑似离群值,也可以用平均值法直接计算,平均值±n倍标准差(SR)之外的数据被视为离群值;进行转化之前,先对数据进行分箱处理,分箱的方法:等宽分箱,和等深分箱。删除离群值使用盖帽法,3法,分箱法,WoE法。连续变量:主成分分析,因子分析和变量聚类。(6)连续型变量的中心标准化和归一化。(2)连续型变量离群值识别与处理。(5)连续型变量的分布形态转换。(3)分类型变量的概化处理。(1)错误数据识别与处理。分类型变量:概化处理。
2024-04-01 11:04:42
594
原创 【 Python Excel库对比】
Python Excel库对比我们先来看一下python中能操作Excel的库对比(一共九个库):在这里插入图片描述1 Python xlrd 读取 操作Excel1.1 xlrd模块介绍(1)什么是xlrd模块?python操作excel主要用到xlrd和xlwt这两个库,即xlrd是读excel,xlwt是写excel的库。(2)为什么使用xlrd模块在UI自动化或者接口自动化中数据维护是一个核心,所以此模块非常实用。
2024-03-31 20:24:51
927
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人