机器学习 第一讲 机器学习概述

在这里插入图片描述

一、机器学习与应用

1.“人工智能之父”–艾伦.图灵

图灵测试(1950)
在这里插入图片描述

2.人工智能的知识图谱

在这里插入图片描述

二、AI,ML,DL的关系

1.机器学习是实现人工智能的一种方法,深度学习是机器学习一个分支

在这里插入图片描述

2.机器学习领域

自然语言处理
图像处理
传统预测
学习完之后可以干什么?

图像处理
图像识别
在这里插入图片描述
图像处理
人脸识别
在这里插入图片描述

3.机器学习库和框架

在这里插入图片描述

4.什么是机器学习?

机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测
在这里插入图片描述
在这里插入图片描述

5.为什么需要机器学习?

5.1 解放生产力,智能客服

5.2 解决专业问题,ET医疗

5.3 提供社会便利,城市大脑

三、机器学习应用程序的步骤

1.收集数据

2.准备输入数据

3.分析输入数据

4.训练算法

5.测试算法

6.使用算法

四、数据来源与类型

1.数据来源

1.企业日益积累的大量数据(互联网公司更为显著)
2.政府掌握的各种数据
3.科研机构的实验数据

2.数据类型

离散型数据:由记录不同类别个体的数目所得到的数据,又称计数数据,所有这
些数据全部都是整数,而且不能再细分,也不能进一步提高他们的精确度。
连续型数据:变量可以在某个范围内取任一数,即变量的取值可以是连续的,如,
长度、时间、质量值等,这类整数通常是非整数,含有小数部分。

3.可用数据集

  • Kaggle特点
    (1)大数据竞赛平台
    (2)80万科学家
    (3)真实数据
    (4)数据量巨大
    (5)Kaggle网址:https://www.kaggle.com/datasets
  • scikit-learn特点(自带数据集,方便演示)
    (1) 数据量较小
    (2)方便学习
    (3)scikit-learn网址:http://scikit-learn.org/stable/datasets
  • UCI特点
    (1)收录了360个数据集
    (2)覆盖科学、生活、经济等领域
    (3)数据量几十万
    (4)UCI数据集网址: http://archive.ics.uci.edu/ml/

4.常用数据集数据的结构组成

结构:特征值+目标值

五、数据的特征工程

1.特征工程是什么?

特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的模型准确性

2.特征工程的意义?

直接影响预测结果

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Jupyter Notebook是一个基于Web的交互式计算环境,非常适合用于机器学习的开发和实验。下面是在Jupyter Notebook中使用机器学习的一般步骤: 1. 安装所需的Python库:首先,确保你已经安装了必要的Python库,例如NumPy、Pandas、Matplotlib和Scikit-learn等。你可以使用pip或conda来安装这些库。 2. 创建一个新的Jupyter Notebook:通过运行命令`jupyter notebook`在终端打开Jupyter Notebook。然后,在打开的浏览器窗口中点击“New”并选择“Python 3”来创建一个新的Notebook。 3. 导入所需的库:在Notebook的第一个单元格中,导入你需要使用的Python库。例如,你可以使用以下代码导入NumPy和Pandas: ```python import numpy as np import pandas as pd ``` 4. 加载和探索数据:使用Pandas库读取你的数据集,并使用一些基本的数据探索方法来了解数据的结构和特征。 ```python data = pd.read_csv("your_dataset.csv") data.head() ``` 5. 数据预处理:根据需要对数据进行预处理,例如处理缺失值、对分类特征进行编码、数据标准化等。 6. 数据可视化:使用Matplotlib或其他可视化库绘制图表,以便更好地理解数据。 ```python import matplotlib.pyplot as plt plt.scatter(data["feature1"], data["feature2"]) plt.xlabel("Feature 1") plt.ylabel("Feature 2") plt.show() ``` 7. 拆分数据集:将数据集拆分为训练集和测试集,以便用于训练和评估模型。 8. 训练模型:根据你的问题选择合适的机器学习算法,使用Scikit-learn或其他机器学习库来训练模型。 ```python from sklearn.model_selection import train_test_split from sklearn.linear_model import LogisticRegression X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) model = LogisticRegression() model.fit(X_train, y_train) ``` 9. 模型评估:使用测试集对训练好的模型进行评估,例如计算准确率、查准率、查全率等指标。 ```python y_pred = model.predict(X_test) accuracy = accuracy_score(y_test, y_pred) precision = precision_score(y_test, y_pred) recall = recall_score(y_test, y_pred) print("Accuracy:", accuracy) print("Precision:", precision) print("Recall:", recall) ``` 这里只是一个简单的概述,实际上在Jupyter Notebook中使用机器学习可能涉及到更复杂的步骤和技术。希望对你有所帮助!如果你还有其他问题,请随时提问。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值