机器学习
侠客岛的含笑
我只不过在说有可能发生的事情,我并没有肯定的说法,不相信也不怀疑,要是想法偏向任何一边,而真相却相反的时候。(这是以前菜鸡的我)
展开
-
机器学习入门-线性回归
工具graphlab create下载地址:https://turi.com/download/install-graphlab-create.htmlIpython NoteBook enter + shiftcell 切换makedown (esc + m) graphlab createimport graphlab 导入包读取数据集sf = graphlab.SFrame(原创 2017-08-13 13:05:11 · 875 阅读 · 0 评论 -
机器学习入门-分类器入门
餐厅评价分类线性分类器决策边界训练分类器=学习权重混淆矩阵不同一应用中不同类型的错误的成本也会不同模型需要学习多少数据类别概率总结import graphlabproducts = graphlab.SFrame('amazon_baby.gl/')products.head()构建词袋向量(添加一列)products['word_count'] = graphlab.text_analyti原创 2017-08-13 18:34:19 · 687 阅读 · 0 评论 -
机器学习入门- 聚类和相似度(文档检索)
如何测量相似度?如何在文章中搜索?用于测量相似度的单词计数表示测量相似度 单次计数的问题-文档长度-解决:归一化向量文档复制两倍->相似度增加4倍 解决方法:归一(将不同长度文章置于平等的地位)应用TF-IDF对于重要单词进行优先级排序Key WordTF-IDF文档表示方式检索相似文档最近邻域检索1-最邻近k-最邻近文档聚类根据主题对文档分类聚类->事后回溯聚类算法(k-均值)其他应用图片搜原创 2017-08-13 22:46:23 · 5095 阅读 · 0 评论 -
机器学习入门-推荐商品
学习目标分类模型流行度分类模型协同过滤-》同现矩阵(对称矩阵) 同现矩阵正规化流行度过大的问题:矩阵补全问题特征+矩阵分解(混合模型)推荐系统的性能度量最优推荐准确率=1召回率=1音乐推荐系统原创 2017-08-15 19:00:42 · 1468 阅读 · 0 评论 -
机器学习(Machine Learning)- 吴恩达(Andrew Ng )-笔记
Supervised learning(regression problem)监督学习(线性回归)a straight line to the data or do you want to fit the quadratic function to the data and there’s no fair picking用一条直线还是二次项函数分析数据取决于真实的数据情况(线性分类器,寻找特定的标记原创 2017-10-10 14:17:01 · 1626 阅读 · 0 评论