1.libsvm在python下的使用
由于研究需要,今天在学习支持向量机svm在python中的使用。看了svm的API后发现,貌似只有svm低级的方法,在网上查了之后才知道要下载libsvm,网址是http://www.csie.ntu.edu.tw/~cjlin/libsvm/。libsvm在python下的目录中包含了svm.py和svmutil.py,而svm.py接口主要包括了一些low-level的应用,svmutil中主要包含了以下几个函数:
svm_train() : train an SVM model
svm_predict() : predict testing data
svm_read_problem() : read the data from a LIBSVM-format file.
svm_load_model() : load a LIBSVM model.
svm_save_model() : save model to a file.
evaluations() : evaluate prediction results.
按照网上所给的方法,却怎么也不能在程序中正确使用这些方法。后来在D:\Program Files\Anaconda\Lib目录中发现,在该目录中,有.pyc文件的方法都可以在程序中import,而libsvm-3.20中没有svm.pyc和svmutil.pyc文件,还好python自带的有编译成pyc文件的工具。在命令行中执行下面的命令,就可以把py格式的文件编译成pyc格式,把py格式编译成.pyc格式的模块叫做py_compile
这样的话,在eclipse中,直接import svmutil就可以啦!
2.pyc文件
什么是pyc文件
pyc是一种二进制文件,是由py文件经过编译后,生成的文件,是一种byte code,py文件变成pyc文件后,加载的速度有所提高,而且pyc是一种跨平台的字节码,是由python的虚拟机来执行的,这个是类似于JAVA或者.NET的虚拟机的概念。pyc的内容,是跟python的版本相关的,不同版本编译后的pyc文件是不同的,2.5编译的pyc文件,2.4版本的python是无法执行的。
为什么需要pyc文件
这个需求太明显了,因为py文件是可以直接看到源码的,如果你是开发商业软件的话,不可能把源码也泄漏出去吧?所以就需要编译为pyc后,再发布出去。当然,pyc文件也是可以反编译的,不同版本编译后的pyc文件是不同的,根据python源码中提供的opcode,可以根据pyc文件反编译出py文件源码。