机器学习基础知识笔记记录
已知python是机器学习算法实现使用程度很广泛的语言,这里只对Python进行一个入门级了解,方便后续进行机器学习相关算法实践。
- 环境搭建
- 基本语法、变量、数据模型、控制语句
- 函数的使用
- 面向对象
笔记目录
1. Python技术的主要使用领域
- NO.1 数据采集 与处理领域 :使用Requets/Urllib/Re模块库实现典型的网络爬虫程序,通过动态代理Proxy自动轮询,突破403反爬虫拦截机制。。同时采用scrapy或BS4企业级爬虫框架快速完成网络深维度自动探索采集。
- NO.1 数据计算与分析领域 :在数据处理方面使用强大的NumPy/SciPy/Pandas模块库实现数据规整化操作标准流程;充分利用强大的Pandas模块库实现聚合与分组算法、时间序列算法等核心的数据分析计算,最后使用Matpolitlib模块库进行可视化数据呈现。
- NO.1 人工智能与机器学习领域 : 使用Scikit-Learn模块库实现机器学习,使用AIML人工智能标记语言,掌握Theano/Keras模块库搭建各种深度学习模型。TensorFlow人工智能系统(Google)。
2. Python开发环境
- Python 3.9.13 (自行去官网下载)
- Python 环境变量设置(根目录与Scripts),想让哪个python环境优先使用,就将其上移即可。
查看高级系统设置——>环境变量——>系统变量——>Path
3. 安装环境验证
win + R ——>cmd——>输入验证代码
环境安装成功。
4. python的入口函数
python是一个脚本语言,严格意义上讲是不需要所谓入口函数的,所以python定义的main函数是普通函数,只有调用才会执行,没有特殊性。python使用隐式编译,.pyc文件就是python编译后得到的文件,然后通过python虚拟机解释执行。因为python是隐式编译,所以源代码文件的风险很高,所以尽量还是需要将python进行编译打包,然后再进行发布。它用到的编译模块是py_compile模块。
5. python在Windows系统中的开发环境搭建
- pip第三方模块管理组件
- PyWin32组件
- 开发IDE
(1)安装和管理python的第三方模块:pip
安装完pypthon后,可以在Scripts目录下找到pip的可执行文件。
// pip安装库
pip install pywin32
// 版本升级
pip install --upgrade pywin32
// 指定镜像网址安装(以清华大学镜像网址为例)
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple 安装包名称
python的库文件后缀是.whl,如果有需要,可以去该网址中查找对应的库包:
https://www.lfd.uci.edu/~gohlke/pythonlibs/
上述安装方式是在线安装,通过这个网址,可以进行各种库的离线安装。在该网址中下载安装包,然后在cmd中使用pip install + 安装包所在路径,就可以手动进行安装。
(2) 全局镜像配置
新建一个pip.ini文件
[global]
index-url = https://pypi.tuna.tsinghua.edu.cn/simple
把它放入pip文件夹中,然后将该文件夹移动到C:>用户>Administrator目录下即可(这里登录的是Administrator就放入其下,如果是用户登录,放入user目录下,总之,放入当前自己登录的账户的目录下)。
(3) 安装pycharm 2018.1.4
自行去官网下载安装即可
6. 环境实践
这里注意最下方解释器的选择,不要创建虚拟环境,而是在最下方使用主环境的解释器,这种情况下可以尽量减少由于环境出现的报错。
python是使用缩进和换行来组织代码结构,区分代码块的,所以在编写时一定要注意缩进等问题。