一. 将数据格式转换为libsvm
用libsvm分析数据,首先要把csv格式的数据转换成libsvm格式,网上搜到的方法如下:
1. 网上有一个xls文FormatDataLibsvm.xls具有宏命令,可以利用其中的宏命令来实现。对于属性数据只有一二百的,这种工具简单方便。
2. 可以利用weka来转换,用weka打开csv文件,再将文件重新保存为libsvm格式。
由于我的数据有180万左右,所以使用了第二种方法。去weka官网下载最新版本,我的是weka-3-9-2-oracle-jvm,转换前需要提前下载libsvm的包。打开GUI界面,点击tools下的package manager,按如下界面搜索并下载。
然后就可以转换了数据了。需要注意的是,保存时有可能没有存为.libsvm的选项,这是因为数据格式只能是numerical或者nominal,修改或移除之后就可以了。
二. Mac电脑配置python(PyCharm)的libsvm
1. 首先下载libsvm.zip文件
2. unzip一下libsvm.zip文件,用终端进入libsvm文件夹
3. 输入make
4. 进入libsvm下的python文件夹
5. make一次libsvm->python文件夹 ,上层