机器学习入门前准备

最新推荐文章于 2024-08-21 21:37:40 发布

牛麦康纳

最新推荐文章于 2024-08-21 21:37:40 发布

阅读量1.9k

点赞数 1

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yejingtao703/article/details/78897563

版权

机器学习专栏收录该内容

16 篇文章 1 订阅

订阅专栏

机器学习的意义：

不是单纯模仿的机器人，也不是具备人类感情的仿生人，机器学习的意义是利用计算机来挖掘数据背后的真实含义。

机器学习必备概念：

1 训练集，用于训练机器学习算法的数据样本集合，与之相对应的是测试集

2 特性，数据的不同属性，训练集不同的列，代表不同的维度

3目标变量，机器学习算法的预测结果，在分类算法中目标变量的类型通常是标称型的，而在回归算法中通常是连续型的。训练样本集必须确定知道目标变量的值，以便机器学习算法可以发现特征和目标变量之间的关系。

4知识表示，机器学习最终的产出

5 监督学习，有训练样本进行训练，有测试样本进行回归的学习方式

6 无监督学习，没有训练集支持训练，完全靠自己的建模。

机器学习的开发步骤：

1 收集数据，原始资料的收集，爬虫、传感器、实测数据等方式获得。

2 准备输入数据

因为第一步收集上来的数据不能直接使用，需要进行格式转化，转化成机器语言可以处理的格式。

3 分析输入数据（非必需）

再次人工干预确认是否有垃圾数据，能否用来进行学习

4 训练算法

监督学习，将前两步得到的格式化数据输入到算法，从中抽取知识或信息。

5 测试算法

测试算法的工作效果，如果是监督学习，需要测试集回归算法统计出错误概率

6 使用算法

将学习结果封装成应用程序，执行实际任务

需要掌握的基本公式：

欧氏距离公式（欧几里得度量）：(Xa,Ya)和(Xb,Yb)之间的距离是

d=开根号((Xb-Xa)**2 + (Yb-Ya)**2)

贝叶斯公式：反概率论用得到

P（A│B）* P（B）= P（B│A）* P（A）

翻译过来是概率B发生的前提下发生概率A的概率等于概率A发生的前提下概率B发生的概率

需要掌握一门机器学习的语言，这里我们使用Python，Python在运行效率上很慢，但是提供了很丰富的扩展包供我们使用，在编程上简洁易懂，是入门机器学习的不二语言。

Python扩展包的安装：

1 首先在自己脚本里执行下

import pip
print (pip.pep425tags.get_supported())

找到适合自己的扩展包的版本

2 扩展包的下载地址在：

https://www.lfd.uci.edu/~gohlke/pythonlibs/#mysql-python

必备的包有numpy、matplotlib等，下载跟自己版本对应的whl文件

3 命令行执行pip installXXXX.whl文件，执行成功后会得到相应的文件夹，文件夹内是新的扩展模块

Numpy的矩阵(Matrix)和数组(array)使用起来很容易引起混淆，这两个概念需要加强了解，通过print()和内容排列看不出区别，这两个的差别主要在于运算。

Matrix_A =

[ [1,4]

[3,2] ]

Matrix_B =

[ [2,1]

[1,3] ]

矩阵相乘A*B，A的第一行与B的第一列相乘得到0,0坐标的值（1*2+4*1=6）; A的第一行与B的第二列相乘得到0,1左标的值(1*1+4*3=13)；以此类推1,0左标值（3*2+2*1=8）；右下角是（3*1+2*3=9）

所以A*B的结果是

[ [6,13]

[8,9] ]

如果将矩阵换成数组的话，A*B的结果是两个矩阵对应的左标相同的值进行相乘。0,0坐标的值（1*2=2）; 0,1坐标的值(4*1=4)；以此类推1,0左标值（3*1=3）；右下角是（2*3=6）

所以A*B的结果是

[ [2,4]

[3,6] ]

有了乘法的区别，可以理解阶乘也是有区别的。

A**2，A是矩阵和A是数组的结果显然是不同的。

Numpy模块下矩阵和数组是可以通过numpy. asarray() 和 numpy. asmatrix()来进行转换的。

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

牛麦康纳

CSDN认证博客专家 CSDN认证企业博客

码龄16年

221: 原创

1万+: 周排名

2万+: 总排名

74万+: 访问

: 等级

7893: 积分

730: 粉丝

427: 获赞

227: 评论

1120: 收藏

私信

关注

热门文章

分类专栏

kubernetes-叶工好容 7篇
混沌工程 6篇
API网关 8篇
应届求职 4篇
金丝雀分析 1篇
自动化测试 1篇
互联网 23篇
Spring boot 6篇
CSDN 2篇
Spring cloud 12篇
Spring微服务 5篇
Docker 6篇
MQ 3篇
ElasticSearch 14篇
Http与信息安全 11篇
Linux 11篇
Java 13篇
Redis 6篇
Python 17篇
算法 10篇
机器学习 16篇
深度学习 6篇
数据库 3篇
OpenStack 2篇
ansible 2篇
Terraform 1篇
云计算 10篇
持续集成 14篇
Spinnaker 18篇

最新评论

叶工好容2-云原生网络
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://test-cms-ccloud.csdn.net/ccloud/topics/600592700。
叶工好容2-云原生网络
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/615225413。
LinkedHashMap引发的内存泄漏以及解决过程
secowo: removeEldestEntry 并发的时候为什么不生效呢？按照逻辑来说，只要有超过限制的值输入，那么就会把他移除掉
Jenkins Pipeline的实战详解
asaKing2: 作者你好，请问你这个jenkins脚本是写在jenkinsfile吗
Spring Cloud Gateway VS Netflix Zuul2
山野小生: 写的真好，涨知识了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。