pymrmr模块的安装和使用
\: \: \: \: github链接
一、模块介绍
在Python 3使用mRMR特征选择算法,pymrmr提供了方法 \: \: pymrmr.mRMR()
pymrmr.mRMR(df, ‘MIQ’, K)
返回排序后的列名(list)
Parameters:
- df:数据文件(pandas.DataFrame)
第一列要是标签
其他列要是特征量
列的名称要是字符串 - 内部选择方法(‘MIQ’或‘MID’)(str)
MIQ:互信息熵
MID:互信息差 - K:要选取的特征数量(int)
\: \: \: \:
二、安装
以下步骤皆是在anaconda下安装:
- 创建虚拟环境pymrmr(任意名字)
- 激活虚拟环境(activate pymrmr),安装必要的包 (pip install numpy Cython)
- 在github(上面的链接)下载安装包
- 将安装包的解压文件复制到anaconda安装路径 D:\Anaconda3\envs\pymrmr中
- 打开控制台Anaconda Prompt(Anaconda3),进入上一步的目录中安装(运行下述命令)
D:
cd D:\Anaconda3\envs\pymrmr\pymrmr-master
python setup.py install
\: \: \: \:
三、使用
实例代码:每一列对应一个特征,第一列是标签
import pandas as pd
import pymrmr
from sklearn.datasets import make_classification
X, y = make_classification(n_samples=10000,
n_features=6,
n_informative=3,
n_classes=2,
random_state=0,
shuffle=False)
# Creating a dataFrame
df = pd.DataFrame({'Class': y,
'Feature 1': X[:, 0],
'Feature 2': X[:, 1],
'Feature 3': X[:, 2],
'Feature 4': X[:, 3],
'Feature 5': X[:, 4],
'Feature 6': X[:, 5],
})
y_train = df['Class']
X_train = df.drop('Class', axis=1)
res = pymrmr.mRMR(df, 'MIQ', 6)
print(res)
\:
\:
\:
\:
特征选择结果:
pymrmr.mRMR(df, ‘MIQ’, 6)
[‘Feature 4’, ‘Feature 5’, ‘Feature 2’,‘Feature 6’, ‘Feature 1’, ‘Feature 3’]
pymrmr.mRMR(df, ‘MID’, 6)
[‘Feature 4’, ‘Feature 6’, ‘Feature 5’, ‘Feature 2’, ‘Feature 1’, ‘Feature 3’]