hi 大家好:
最近因为在做医疗大数据相关的数据分析和机器学习预测模型训练相关的工作,所以在此记录一下,作为一个菜鸟级的机器学习者,如何一步步完成自己的机器学习相关工作的。
想要做机器学习,那么首先要配置相关开发环境
第一步: 安装python
可以安装python2.7 或 python3.6 这里用户可以自己选择
安装方法: 附上我总结的安装文档链接: 链接:https://pan.baidu.com/s/1mjls0je 密码:2vb9
第二步: 安装可视化开发环境
这里我选择的是 pycharm 社区版, 这里也有一些其他的可视化的开发环境,大家可以根据自己需要选择
安装步骤及方法: 附一个网盘链接的word,供大家参考 链接:https://pan.baidu.com/s/1nw2lvHB 密码:agz8
第三步: 安装数据分析包:
主要需要装以下一些包: numpy scipy matplotlib scikit-learn pandas
安装方法参考链接: MAC版:http://www.jb51.net/article/78667.htm
https://www.v2ex.com/t/381619 (该作者通过anaconda直接进行安装,很方便,可以学习)
https://www.v2ex.com/t/381606
windows版:http://blog.csdn.net/skyinmoon/article/details/51790886
linux版:https://www.cnblogs.com/Chayeen/p/7995086.html
(PS: 其实windows和linux下安装这些包特别方便,只需要直接pip install XXX就可以 。但是在windows下最好还是把对应的包的源文件下载下来进行安装会更快一些)
这里先给了大家关于具体安装的参考链接,后续我会将自己在这三个平台的安装过程整理出来,发布分享给大家。
祝大家安装顺利,一起加油~