1.环境:ubuntu ,python3.4,pycharm
2.数据格式:
3.源码:
import sklearn
import numpy as np
import pandas as pd
from sklearn.cross_validation import train_test_split
from sklearn.linear_model import LogisticRegression
'''
特征归一化:
各特征之间的大小范围一致,才能使用距离度量等算法
加速梯度下降算法的收敛
在SVM算法中,一致化的特征能加速寻找支持向量的时间
不同的机器学习算法,能接受的输入数值范围不一样
'''
'''
sklearn中最常用的特征归一化方法MinMaxScaler和StandardScaler。
它默认将每种特征的值都归一化到[0,1]之间,归一化后的数值大小范围是可调的(根据MinMaxScaler的参数feature_range调整)。
下面代码将特征归一化到[-1,1]之间。
'''