![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
风信子的故事
这个作者很懒,什么都没留下…
展开
-
聚类算法之kmeans算法
首先要来了解的一个概念就是聚类,简单地说就是把相似的东西分到一组,同 Classification (分类)不同,对于一个 classifier ,通常需要你告诉它“这个东西被分为某某类”这样一些例子,理想情况下,一个 classifier 会从它得到的训练集中进行“学习”,从而具备对未知数据进行分类的能力,这种提供训练数据的过程通常叫做 supervised learning (监督学习),而...原创 2018-09-27 22:13:22 · 751 阅读 · 0 评论 -
特征工程之特征抽取
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。(本文是个人的笔记,有些内容是引用)...原创 2018-10-21 17:38:12 · 2964 阅读 · 0 评论 -
在Python中实现你自己的推荐系统
现今,推荐系统被用来个性化你在网上的体验,告诉你买什么,去哪里吃,甚至是你应该和谁做朋友。人们口味各异,但通常有迹可循。人们倾向于喜欢那些与他们所喜欢的东西类似的东西,并且他们倾向于与那些亲近的人有相似的口味。推荐系统试图捕捉这些模式,以助于预测你还会喜欢什么东西。电子商务、社交媒体、视频和在线新闻平台已经积极的部署了它们自己的推荐系统,以帮助它们的客户更有效的选择产品,从而实现双赢。两种最普...翻译 2019-01-13 12:02:58 · 7639 阅读 · 2 评论 -
机器学习-模型评估与选择
2.1、经验误差和过拟合错误率:通常把分类错误的样本占总样本总数的比例称为“错误 率”,即如果在m个样本中有a个样本是错误的,则错误率为E=a/m解释:统计分类器预测出来的结果与真实结果不同的个数,然后除以总的样例集D的个数。精度:是分类正确的样本数占样本总数的比例。1-a/m,即 精度=1-错误率注意:这里的分类正确的样本数指的不仅是正例分类正确的个数还有反例分类正确的个数。...原创 2019-03-03 21:48:20 · 907 阅读 · 1 评论