机器学习笔记:机器学习概述和特征工程简介

一、机器学习简介和概述:

1.影响人工智能的发展:数据和算法

2.分类:(1)自然语言处理:自动报到天气的程序,写新闻

(2)图像识别:人脸识别,图片优化

(3)传统预测:信贷需求预测,店铺销量预测

3.机器学习是:从数据中自动分析获得规律,并利用这些规律对未知数据进行预测。

比如说:AlphaGo(从棋谱中学习数据,打败柯洁)、广告搜索:根据历史行为推荐商品

4.为什么需要机器学习:解放生产力(智能客服)、解决专业问题(ET医疗)、提供社会便利(城市大脑)

5.机器学习的价值:领域需要多,让机器学习程序替代手动的步骤,减少企业的成本也提高企业的效率。

二、特征工程和文本提取

1.数据集的组成

机器学习的数据:文件csv,使用pandas读取数据处理数据,基于numpy

numpy为什么处理速度很快?c编写,GIL锁释放可以进行多线程操作

2.数据集的结构:

数据集:kaggle uci scikit-learn

结构:特征值+目标值

比如说:利用身高、体重、皮肤颜色、头发长度等判断男女

{特征值:身高、体重、皮肤、头发长度 目标值:男、女}

注:有些数据集可以没有目标值

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值