这段时间的机器学习知识点总结如下:
第一部分:环境配置专题
1. 环境配置的重要性:正确配置Python环境可以避免版本冲突和奇奇怪怪的bug。使用conda环境可以隔离不同的包版本,防止项目之间的冲突。
2. Conda和pip的区别:conda可以安装多种语言的软件包,已经编译好了直接下载;pip只能安装Python包,有些需要本地编译。建议使用conda安装PyTorch等会更快一些。
3. 安装PyTorch:需要根据GPU情况选择CPU或CUDA版本,调用GPU需要安装相应的CUDA;验证安装成功可以import torch并检测是否可调用CUDA。
4. 安装PaddlePaddle:也需要根据GPU情况选择版本;验证是否成功通过import paddle并检测是否可调用GPU。
5. 镜像站点:使用镜像站点如清华镜像可以加速下载安装速度。需要设置conda和pip的镜像源。
6. Jupiter Notebook:可以用来编写和运行代码。添加新代码块,运行代码,保存文件。
7. 云环境:如百度AI Studio、阿里天池等提供云GPU资源,可以在无GPU的电脑上进行深度学习。
8. VSCode: 需要安装Python和Jupyter插件,可以在VSCode中运行Jupiter Notebook。
详细思维导图流程如下:
第二部分:相关的数据类型和操作
1. Python的数据类型:整数int、浮点数float、布尔bool、字符串str等。可以用type()检查类型。
2. 常数的值不可变,如True、False、None等。 math模块包含数学常量如π和e。
3. 运算符:算术运算符+-*/、赋值运算符=、比较运算符>==、逻辑运算符and or not等。都有优先级和结合性。
4. 整除用//,默认/是浮点除法。%是取余运算。幂运算用**。
5. 类型影响运算语义:不同类型间的运算结果不同。如str + str 是拼接。
6. 逻辑运算有短路求值:and只要一个false就false,or只要一个true就true,可提前结束运算。
7. 判断类型:type()判断类型,isinstance()判断是否是某种类型的对象。
8. 浮点数存在误差,需注意判断相等时的误差范围。
9. 注释代码用#。
第三部分:Chap启航--聪明办法学Python
1. 注释 - 单行注释使用#号,多行注释使用三个单引号或双引号。注释可以增加代码可读性。
2. 输出 - 使用print()函数在终端输出内容,默认打印后换行。可以使用end参数控制打印结束符。
3. 输入 - 使用input()函数获取用户输入,返回值为字符串类型。
4. 字符串 - 使用单引号或双引号定义,可进行拼接、复制等操作。
5. 错误处理 - 常见错误类型包括语法错误、运行时错误和逻辑错误。
6. 模块导入 - 使用import语句导入模块,然后使用模块.函数的方式调用模块中的函数。
7. 格式化字符串 - 在字符串前加f,使用{}括起变量,会自动替换变量值。
8. 多个变量输入 - 在input()末尾添加sep参数,可自定义分隔符,将用户输入分配到多个变量。
9. 作业系统 - 需要完成必做题和部分提高题或者写好笔记才能成为优秀学习者。
第四部分:Python介绍与课程安排
1. Python是当前最流行的编程语言之一,适合学习人工智能。
2. 学习Python的关键是动手编程,多写代码和练习。可多看优秀代码,从中学习。
3. 注释可以增加代码可读性。提问要遵守规范,需提供详细描述、代码和报错截图等信息。
4. Python有丰富的库和工具包,如机器学习、深度学习、数据分析等方面都有成熟的工具。
5. Python语法简单自然,比如打印只需一行代码。支持混合编程与其他语言配合使用。
6. 数据类型有整数、浮点数、布尔值、字符串等。运算符有赋值、比较、算术运算等。
7. 函数可以实现代码的模块化和重用。
8. 在线评测系统可以测试和提交代码作业。
9. 数据科学与AI组织datawhale,致力于构建开源社区。