【Python】已完美解决：机器学习填补数值型缺失值时报错)TypeError: init() got an unexpected keyword argument ‘axis’，

原创已于 2024-09-21 09:48:38 修改 · 876 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#python #机器学习 #开发语言

于 2024-06-12 21:01:46 首次发布

个人简介：某不知名博主，致力于全栈领域的优质博客分享 | 用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！

🍅 文末获取更多信息 🍅 👇🏻 精彩专栏推荐订阅收藏 👇🏻

专栏系列	直达链接	相关介绍
书籍分享	点我跳转	书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家
AI前沿	点我跳转	探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然语言处理、计算机视觉等领域的研究进展和趋势分析。通过深入解读前沿技术、案例研究和行业动向，为读者带来关于人工智能未来发展方向和应用前景的洞察和启发。
Elasticsearch	点我跳转	详解 Elasticsearch 搜索和数据分析引擎
科技前沿	点我跳转	本档是关于科技和互联网的专栏，旨在为读者提供有趣、有用、有深度的科技资讯和思考。从多个角度探讨科技与人类生活的关系，包括但不限于科技趋势、产品评测、技术解读、行业观察、创业故事等内容。希望通过本栏，与读者分享科技的魅力和思考，让科技成为我们生活的一部分，而不仅仅是一个陌生的词汇。
Java之光	点我跳转	本栏将带领读者深入探索Java编程世界的种种奥秘。无论你是初学者还是资深开发者，这里都将为你提供丰富的Java知识和实用的编程技巧。
Linux学习日志	点我跳转	本专栏致力于探索Linux操作系统的各个方面，包括基础知识、系统管理、网络配置、安全性等。通过深入浅出的文章和实践指南，帮助读者更好地理解和应用Linux，提高系统管理和开发技能。无论你是初学者还是有经验的Linux用户，都能在本专栏中找到有用的信息和解决方案。
MySQL之旅	点我跳转	专栏将带领读者进入MySQL数据库的世界，探索其强大的功能和应用。我们将深入探讨MySQL的基本概念、SQL语言的应用、数据库设计与优化、数据备份与恢复等方面的知识，并结合实际案例进行讲解和实践操作。
精通Python百日计划	点我跳转	我们将引领你踏上一段为期100天的编程之旅，逐步深入了解和掌握Python编程语言。无论你是编程新手还是有一定基础的开发者，这个专栏都会为你提供系统而全面的学习路径，帮助你在短短100天内成为Python高手。

文章目录

在这里插入图片描述
已解决：Python机器学习中的数值型缺失值填补与TypeError: init() got an unexpected keyword argument 'axis’问题

一、问题背景

在数据分析和机器学习的项目中，处理缺失值是一个常见的任务。缺失值的存在可能会影响模型的性能和准确性。对于数值型数据，我们通常使用均值、中位数、众数或者更复杂的机器学习算法（如K-近邻算法、随机森林等）来进行缺失值的填补。然而，在使用这些方法进行填补时，有时可能会遇到TypeError: init() got an unexpected keyword argument 'axis’的错误。

二、可能出错的原因

这个错误通常表明你在调用某个函数或类时，传入了一个它不支持的关键字参数axis。在Python中，axis参数常用于NumPy和Pandas等库，用于指定操作的轴（例如行或列）。然而，并非所有的函数或类都支持这个参数。如果你错误地将axis参数传递给了一个不接受它的函数或类，就会引发这个错误。

三、错误代码示例

假设我们正在使用一个简单的机器学习库（为了演示，这里假设为FictitiousML库，实际上并不存在这样的库）来填补缺失值，并错误地传入了axis参数：

import numpy as np  
from fictitious_ml import FictitiousImputer  # 假设的库和类  
  
# 创建一个包含缺失值的numpy数组  
data = np.array([[1, 2, np.nan], [4, np.nan, 6], [7, 8, 9]])  
  
# 尝试使用FictitiousImputer来填补缺失值，错误地传入了axis参数  
imputer = FictitiousImputer(strategy='mean', axis=0)  # 假设FictitiousImputer不支持axis参数  
filled_data = imputer.fit_transform(data)

这段代码会触发TypeError: init() got an unexpected keyword argument 'axis’错误，因为FictitiousImputer类的初始化方法（init）可能不接受axis参数。

四、正确代码示例（结合实战场景）

使用Pandas的fillna方法（对于简单的填补策略）

如果你只是想用简单的策略（如均值、中位数等）来填补缺失值，并且你的数据是Pandas的DataFrame或Series，那么可以使用fillna方法：

import pandas as pd  
import numpy as np  
  
# 创建一个包含缺失值的DataFrame  
df = pd.DataFrame({  
    'A': [1, 4, 7],  
    'B': [2, np.nan, 8],  
    'C': [np.nan, 6, 9]  
})  
  
# 使用均值填补缺失值（默认沿axis=0，即按列计算均值）  
filled_df = df.fillna(df.mean())

使用scikit-learn的SimpleImputer（对于更复杂的机器学习填补）

对于更复杂的填补策略，你可以使用scikit-learn库中的SimpleImputer类。这个类不接受axis参数，因为它默认就是按列（即axis=0）进行操作的：

from sklearn.impute import SimpleImputer  
  
# 将DataFrame转换为NumPy数组（如果需要）  
X = df.values  
  
# 创建SimpleImputer对象，使用均值策略填补缺失值  
imputer = SimpleImputer(strategy='mean')  
  
# 拟合并转换数据  
filled_X = imputer.fit_transform(X)  
  
# 如果需要，可以将填补后的数据转回DataFrame  
filled_df = pd.DataFrame(filled_X, columns=df.columns)