机器学习初步

写给自己的一些废话

从大学到研究生,学习了不少数学知识,如线性代数,高等数学,概率论与数理统计,由于专业是软件,学了一些编程语言,数据结构和算法。但是知识一直是停留在书本上,对于编程,也只是停留在做个网站,写个app,并没有太大的兴趣。工作的同伴很多人都对做出一些东西而感到有成就感,然而我好像对那些并无太大的感觉,可能是因为觉得那些都是一个熟练工的问题,用的也是别人写好的API,SDK而已,用多了自然就熟了,所以导致现在对于工作未来也很迷茫,一直想找到自己真正想做的东西。Finally,遇到了机器学习!
真的是能做的东西太多了。生物医疗,环境科学,人工智能,金融经济,以前不相信机器能够操控人的我,现在终于也相信了起来。当初本科选专业时本来是想学环境工程的,可惜成绩不够分配到了软件,现在又对金融感兴趣,突然发现我的专业是那么的amazing!可以在很多领域都有用武之地,是啊,有了这个强有力的工具,就可以解决更多的问题!
许多的线性代数,高等数学都串起来了!以前也做过图像处理,那时候觉得图像篡改检测有什么好玩的,但现在觉得以前学的东西是那么有用,自己这次回家特地把以前的书本都翻出来背回来,就好像Jobs说的某一天一切点就都串成了线。虽然自己当初学的现在都忘了一大半,马尔科夫链学的也不认真,机器学习又真的是很难,但是我相信用心在自己感兴趣的领域上,一定能够做的很好!虽然现在开始的晚,自己的学习能力也未必有年轻时那么好,有时候都有觉得自己是不是老了的时候。。但是老话说的好,脑子越用越活,用脑用脑,开发智力哈!

什么是机器学习

机器学习,顾名思义,就是像训练人一样,训练机器来学习。通过训练机器学习,让机器能够具有自我判断、预测的能力。

机器学习的分类

1. 监督式学习

看名字来说,监督机器来学习。怎么样才能监督?自然是需要告诉机器,什么是对的,否则如何能够监督呢?也就是说,给定一个训练样本集,并且已知这个样本集的所有样本具有什么样的输出结果,及影响输出结果的特征变量。

2. 非监督式学习

与监督式学习相反,通常拿到的样本集我们不知道其中的数据具有怎样的规律。正是想通过机器学习,来找出数据中存在着怎样的规律,特征等等。举例来说,以搜索引擎来说,一个用户上网搜索,我们可以将用户搜索的关键词进行机器学习。机器学习可以将这些关键词进行分类,从而得出该用户更关心的领域,那么下次用户再进行搜索的时候,就可以进行相应的推荐。那么这个将关键词进行分类,已找到用户关心领域的过程就是非监督式学习。

监督式机器学习的一般步骤

  1. 找样本集,并对样本进行数据预处理
    样本集包含样本的特征变量,和目标变量。特征变量就是指影响该问题的几个变量,目标变量就是该问题的结果。有点绕。举个例子来说,我们想给自己的房子进行一个估值。现在手上有200套房屋的数据,即样本集。该样本集中的每个样本包括了房子的大小,房子的地理位置,那么这两个就是特征变量,还包括了房屋的价格,这个就是目标变量,即问题的结果。
  2. 利用样本集训练,得出适用该问题的算法模型
  3. 通过测试数据集,测试2中得出的算法的精度,如果精度不满意,需要改变2中的算法模型
  4. 给出待预测的数据,利用算法模型,预测数据的结果

非监督式机器学习的一般步骤

这个还没有学习到,应该主要是通过对样本进行分类,找出样本集的特征变量

机器学习的一些实例

监督式的
1. 手写文本的识别
2. 房价的预测
非监督式的
1. 将双声道的声音分离
2. 分析疾病的影响因素

机器学习的一些常用算法

  1. 回归分析(梯度下降)
  2. K-近邻算法
  3. SVM支持向量机
  4. 朴素贝叶斯
  5. 聚类(非监督式)
    等等

小结

实际自己也是刚刚开始学习,做一个简易的笔记,随着深入学习,自己也希望能真正做出自己的软件!有感而发写了一些废话,毕竟我从来没有做过自己真的想做的东西,都是项目需要,这次我也要自己动手,丰衣足食!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值