1. 机器学习的主要任务:(分类、回归)有监督学习、(聚类、密度估计)无监督学习
2. 如何选择合适算法:使用机器学习的目的;需要分析的数据是什么;——分类、回归、聚类还是密度估计,确定算法类型;特征选择,离散型还是连续型,是否有缺失,出现频率;
3. 开发机器学习应用程序的步骤
(1)收集数据
(2)准备输入数据:规范格式
(3)分析输入数据:查找异常值
(4)训练算法
(5)测试算法
(6)实用算法
4. NumPy基础
(1) from numpy import *
(2) randArray = random.rand(4, 4)
(3) randMat = mat(randArray)
(4) invRandMat = randMat.I
(5) eye(4, 4)
5. NumPy SciPy MatplotLib安装方法
(1) 安装相应版本的numpy
(2) 安装相应版本的scipy
(3) 安装相应版本的matplotlib
(4) 修复msvcp71.dll丢失的问题(可选)
msvcp71.dll下载文件修复方法:
① 解压下载的文件。
② 复制文件“msvcp71.dll”到系统目录下。
③ 系统目录一般为:C:\WINNT\System32 64位系统为C:\Windows\SysWOW64
④ 最后点击开始菜单-->运行-->输入regsvr32 msvcp71.dll后,回车即可解决错误提示!
(5) 将six.py加入$HOME\Pythonx.x\Lib目录
-------------------------------------
解决ImportError: matplotlib requires dateutil的问题
(6) 执行ez_setup.py
(7) 添加环境变量,path中添加$HOME\Pythonx.x\Scripts
(8) 在命令行执行easy_install python-dateutil
-------------------------------------
解决ImportError: matplotlib requires pyparsing的问题
(9) 在命令行执行easy_install pyparsing