目录
1.课程目的
学习机器学习算法、提高算法性能的技巧
2.算法分类
有监督学习supervised learning、无监督学习unsupervised learning
(1).有监督学习
在这种学习方式中,算法需要一个带有标签的训练数据集,这些标签通常是每个样本的真实输出或类别。
在有监督学习过程中,算法通过学习输入特征与标签之间的关系来建立预测模型。一旦模型训练完成,就可以使用它对新的、未经标记的数据进行预测。
常见的有监督学习任务包括:分类(如垃圾邮件检测)、回归(如房价预测)以及序列标注(如自然语言处理中的词性标注)。
有监督的学习例子:为算法系统选择合适的直线或者曲线
回归(regression):学习输入、输出或者x->y的映射来预测数字结果
分类(classification):
总结:
(2).非监督学习
非监督学习主要关注的是从没有标签或未分类的数据集中学习模式和结构。
在非监督学习中,常见的任务包括:
①聚类(Clustering):将数据对象分组到相似的子集,每个子集称为一个簇。
②降维(Dimensionality Reduction):通过减少数据中的特征数量或复杂性来简化数据表示。
③异常检测(Anomaly Detection):识别数据中不符合预期模式的行为或对象。
非监督学习应用场景:
非监督学习在很多实际应用中都非常有用,如市场分割、用户行为分析、医疗诊断辅助等。
3.学习环境搭建-Jupyter Notebooks
MAC系统安装教程:https://wenku.csdn.net/column/and2yb9ip2
(1)下载homebrew包管理工具
教程中的安装命令可能会出现连接错误,可以使用下面的命令:
/bin/zsh -c "$(curl -fsSL https://gitee.com/cunkai/HomebrewCN/raw/master/Homebrew.sh)"
(2)安装Python环境
brew install python3
(3)安装jupyter
pip3 install jupyter
(4)设置环境变量:
mac终端配置环境变量,如果只是配置 .bash_profile 的话环境变量只对当前终端会话有效,可以配置 .zshrc 文件,可以参考下面
(5)安装效果:
配置官方的资源库-课程代码
4.下载安装Anaconda
为了更好的使用jupyter notebook,将环境资源隔离,可以下载Anaconda使用conda
Download Anaconda Distribution | Anaconda
下载安装完成后,软件会把环境变量自动写入系统文件
这样我们就可以使用conda,实现包的安装管理和环境资源管理了。
5.参考
吴恩达-机器学习系列课程
下一章-线性回归模型,将开始学习机器学习之旅~