数据挖掘(Python)——利用sklearn进行数据挖掘,实现算法:svm、knn、C5.0、NaiveBayes

本文介绍了使用Python的sklearn库进行数据挖掘,重点探讨了支持向量机(SVM)、K近邻(KNN)、C5.0决策树以及朴素贝叶斯(NaiveBayes)算法在预测用户流失问题上的应用。通过对用户行为变量的分析,展示了如何利用这些算法进行分类预测。
摘要由CSDN通过智能技术生成
<span style="line-height: 18px; font-family: Consolas, 'Courier New', Courier, mono, serif; background-color: rgb(255, 255, 255);">说明:下面程序将利用python中的sklearn包根据用户流失前的行为,对用户的流失进行预测</span>

数据格式:lost表示是否流失,其他变量为用户的行为变量,下面是部分数据




import xlrd
import string
import sklearn
from sklearn import svm
from sklearn import neighbors
from sklearn import cluster
from sklearn import tree
from sklearn import naive_bayes 
import numpy as np

#--------数据加载开始--------------
def data_import(filepath):
 data=xlrd.open_workbook(filepath)
 table=data.sheet_by_index(0)
 nrows=table.nrows
 ncols=table.ncols
 result&
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值