机器学习
文章平均质量分 67
FrancoLiang
博客已经很久没更新了,一些技术性的、非理论的文章可能已经过时,不具备参考意义
展开
-
k-means 聚类算法(Python实现)
k-means 聚类算法思想先随机选择k个聚类中心,把集合里的元素与最近的聚类中心聚为一类,得到一次聚类,再把每一个类的均值作为新的聚类中心重新聚类,迭代n次得到最终结果分步实现 一、初始化聚类中心 首先随机选择集合里的一个元素作为第一个聚类中心放入容器,选择距离第一个聚类中心最远的一个元素作为第二个聚类中心放入容器,第三、四、、、N个同理,为了优化可以选择距离开方做为评判标准二、迭...原创 2018-10-02 13:32:19 · 61480 阅读 · 52 评论 -
机器学习之主成分分析PCA(Python实现)
当我们拿到一个数据集的时候,往往数据集中每一个样本的描述是多维的例如鸢尾花数据集:http://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data数据集中对150个鸢尾花样本的描述:萼片长度,萼片宽度,花瓣长度,花瓣宽度当我们读取数据时会读到一个 150x4 的矩阵 X(150x4),但是四维的特征空间不便于我们或...原创 2018-10-09 22:49:29 · 2457 阅读 · 2 评论 -
机器学习之线性回归模型
当我们拿到样本并经过特征降维后得到 x1、x2 … 低维特征,经过多项式映射得到线性回归的模型假设:上式 x1、x2 是样本特征,如果 y 是现实中房子的价格,那么 x1、x2 相当于房子的面积、卧室数量等影响房子价格的因素,而 θ0、θ1、θ2 … 是系数,也就是各影响因素的权值用 h(x) 来表示预测结果,上式用线性代数来表达:线性模型用于预测,当前主要的问题是如何求出最优的系数 θ...原创 2018-10-20 17:39:21 · 336 阅读 · 0 评论