认识机器学习机器学习实战第一章

最新推荐文章于 2024-06-01 23:35:30 发布

creator_gzw

最新推荐文章于 2024-06-01 23:35:30 发布

阅读量398

点赞数

分类专栏：机器学习实战文章标签： python 人工智能

本文链接：https://blog.csdn.net/qq_47119231/article/details/128427824

版权

1 篇文章 0 订阅

订阅专栏

学习目标

机器学习实战第一章

答：简单地说，机器学习就是把无序的数据转换成有用的信息。

从互联网上可以获取大量的人为数据，比如某用户的购物记录，刷过的短视频记录，这占了很大一部分比例；但是另一部分非人为数据也变得越来越重要，比如传感器数据，尤其是移动手机的封装的各种小传感器数据。如何从移动计算和传感器产生的海量数据中抽取有价值的信息是一个很重要的研究课题。

监督学习：分类、回归；无监督学习：聚类、密度估计、特征降维。

首先考虑目的。如果要预测目标的值，则选择监督学习，反之，选择无监督学习。进一步来说，在选择监督学习后，如果目标变量是离散的，选择分类方法，如果是连续的，选择回归方法；在选择无监督学习后，如果进一步需要将数据划分为组别，可以选择聚类算法，如果还需要估计数据与每个组别的相似程度，则选择密度估计算法。
其次是考虑数据。数据是离散还是连续，特征值是否存在缺失、数据中是否存在异常值、某些特征出现的频率等等。
上述考虑只是缩小选择范围，并不一定是最好的，还需要考虑最后的效果。

虽然个人认为python一点都不好用，但是大家都在用，那就勉为其难地接受它吧哈哈哈哈哈。
书中提到Python比java和C好理解（本人也不这样认为），但是python的性能并不是很好（比Java和C低），于是想出来了用python调用C代码，可谓是天秀。
让本人接受的点倒是有，比如python的矩阵运算清晰简练、有很多的第三方库比如NumPy，方便机器学习算法的实现。