机器学习项目
步骤
一、Import the Data 引入数据
这些数据是通常以.csv结尾的文件,要构建一个拥有大量数据的数据库
二、Clean the Data
包括去除一些重复数据或不相干数据、对不完整数据的修复或删除,保证最后训练模型的准确性
三、Split the Data into Training/Test Sets
把数据分成训练和测试两部分
四、Creat a Model
选择合适的算法来构建模型
五、Train the Model
六、Make predictions
七、Evaluate and Improve
对预测进行评估,并衡量其准确性
python 中与机器学习有关的 Libraries and Tools
一、Libraries
Numpy、Pandas、Matplotlib、Scikit-learn
二、
上 http://www.kaggle.com 下载数据
对卷积神经网络一点小小的理解:
训练出的权重核就相当于是一个个抽象的特征,比如好苹果的特征是,颜色红,长得饱满,为了训练机器能识别什么是好苹果就要先通过训练集来提取特征,再用这些权重即特征,来检验验证集,去判断哪些是好苹果。