skmultiflow使用自己的csv文件训练模型并保存实验结果

skmultiflow使用

skmultiflow是基于scikit-multiflow包的,scikit-multiflow官方文档官方文档中有写里面API的具体使用方法,但是本人经过阅读发现并没有自己所需的类型,本人所需有的是自己提供训练数据集,而不是官方文档中调用相关数据生成包生成的训练数据集,并且我们还希望可以将实验结果保存下来。接下来我将告诉大家如何实现的:
1.先给大家展示一下代码和运行后的实验结果:

from skmultiflow.meta import AdaptiveRandomForestClassifier
from skmultiflow.evaluation import EvaluatePrequential
from skmultiflow.data.file_stream import FileStream
'''
Heitor Murilo Gomes, Albert Bifet, Jesse Read, Jean Paul Barddal, Fabricio Enembreck, Bernhard Pfharinger, Geoff Holmes, Talel Abdessalem. Adaptive random forests for evolving data stream classification. In Machine Learning, DOI: 10.1007/s10994-017-5642-8, Springer, 2017.
'''
stream = FileStream(r'.\sea_stream.csv')
stream.prepare_for_use()
classifier = AdaptiveRandomForestClassifier()
evaluator = EvaluatePrequential(pretrain_size=200, max_samples=6220, batch_size=1,
                                n_wait=200, max_time=1000, output_file=r'.\11.csv',
                                show_plot=True, metrics=['accuracy', 'precision','recall', 'f1'])
evaluator.evaluate(stream=stream, model=classifier)

说明一下,使用的训练数据集是sea_stream.csv,实验结果存于11.csv。度量这里展示了最长用的’accuracy’, ‘precision’,‘recall’, ‘f1’。pycharm运行后控制台展示的实验结果。除此之外还会实时的生成一个一个实验结果图如下所示:
在这里插入图片描述
最后,我们来看一下生成的11.csv里面存放着那些实验结果数据:
在这里插入图片描述
如果小伙伴们的需求是和我一样的,欢迎采用。另外,这只是给出了一个样例,如果 是实现不同的方法,其实总体代码实现是一样的。
2.知道小白同学们还是希望能够打个样例,以下是实现不同算法实现的代码:
在这里插入图片描述
我将主要的区别用红方框括起来了,大家可以根据官网上API使用说明更换不同的方法
好了,就这个样子了,是不是很简单。最最最重要的,大家可能会需要样例中的训练数据集,给大家看一下数据集的内容与注意事项:
在这里插入图片描述
第一行要写成字符内容!!!

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
要调用已经训练好的随机森林模型进行预测并保存CSV 文件,你可以按照以下步骤进行: 1. 加载模型使用 joblib.load() 函数从文件中加载训练好的随机森林模型,或者直接使用已经训练好的模型对象。 2. 准备输入数据:将要预测的数据转换为与模型期望的输入格式相同的数据。这通常需要对数据进行预处理、归一化或特征提取,以及将数据转换为 NumPy 数组或 Pandas DataFrame。 3. 进行预测:使用模型的 predict() 方法对输入数据进行预测,并将预测结果保存到一个新的 Pandas DataFrame 中。 4. 将预测结果保存CSV 文件使用 Pandas 的 to_csv() 方法将预测结果保存CSV 文件。 下面是一个简单的示例代码,演示如何使用 Scikit-learn 训练好的随机森林模型进行预测,并将预测结果保存CSV 文件: ``` python import joblib import pandas as pd # 加载模型 model = joblib.load('random_forest_model.pkl') # 准备输入数据 X_test = pd.read_csv('test_data.csv') # 进行预测 y_pred = model.predict(X_test) # 创建包含预测结果的 DataFrame results = pd.DataFrame({'有机质': y_pred}) # 将结果保存CSV 文件 results.to_csv('predictions.csv', index=False) ``` 在这个示例中,我们使用 joblib.load() 函数从文件中加载训练好的随机森林模型。然后,我们使用 Pandas 的 read_csv() 方法加载测试数据集,准备输入数据 X_test。接下来,我们使用模型的 predict() 方法对输入数据进行预测,并将预测结果保存到一个新的 Pandas DataFrame 中。最后,我们使用 Pandas 的 to_csv() 方法将预测结果保存CSV 文件,其中 index=False 表示不保存行索引。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值