首先,机器学习有众多算法,监督,无监督,聚类,回归......,初学者看到这么多的算法想必跟我一样头都晕了,到底在处理实际问题时候要怎么从这么多的算法中选择一个适合自己问题的方法,那么我们就对它们简单的归一下类,根据我们实际中的使用目的,可以得出下面的导图,举例说明,如果我现在需要预测一个地区的房价,那么按下图的指示,我们应该选择一个监督学习模型,那么我们再来看下一步,我们的目标变量房价显然是一个连续值,那么我们就需要找一个回归算法对我们的数据进行预测。
但是我们需要清楚的是,根据下面的图,我们只能在一定程度上缩小算法的选择范围,一般并不存在最好的算法或者可以给出最好结果的算法,同时还要尝试不同算法的执行效果,一般来说,对于所选的每种算法,都可以使用其他的机器学习技术改进其性能,发现好算法的关键环节是反复试错的迭代过程,机器学习算法虽然很多,但是使用算法创建应用程序的步骤却基本类似,这一部分将在后面进行详细介绍。