数据挖掘（Python）——利用sklearn进行数据挖掘，实现算法：svm、knn、C5.0、NaiveBayes

最新推荐文章于 2024-07-08 15:53:05 发布

pat_datamine

最新推荐文章于 2024-07-08 15:53:05 发布

阅读量5.2k

点赞数 1

分类专栏：数据挖掘（python）

本文链接：https://blog.csdn.net/pat_datamine/article/details/42723027

版权

本文介绍了使用Python的sklearn库进行数据挖掘，重点探讨了支持向量机（SVM）、K近邻（KNN）、C5.0决策树以及朴素贝叶斯（NaiveBayes）算法在预测用户流失问题上的应用。通过对用户行为变量的分析，展示了如何利用这些算法进行分类预测。

摘要由CSDN通过智能技术生成

<span style="line-height: 18px; font-family: Consolas, 'Courier New', Courier, mono, serif; background-color: rgb(255, 255, 255);">说明：下面程序将利用python中的sklearn包根据用户流失前的行为，对用户的流失进行预测</span>

数据格式：lost表示是否流失，其他变量为用户的行为变量，下面是部分数据

import xlrd
import string
import sklearn
from sklearn import svm
from sklearn import neighbors
from sklearn import cluster
from sklearn import tree
from sklearn import naive_bayes 
import numpy as np

#--------数据加载开始--------------
def data_import(filepath):
 data=xlrd.open_workbook(filepath)
 table=data.sheet_by_index(0)
 nrows=table.nrows
 ncols=table.ncols
 result&