算法AI
zhanht
我是海涛,是名程序员。热爱思考,热爱技术,拒绝停留在舒适区、一成不变,渴望成长、突破。在此,我将每一至两周至少分享一篇自己原创的技术文章,内容主要涵盖Java后台开发,算法,AI等方向,也欢迎各位读者积极和我交流自己的观点见解,共同进步。欢迎关注同名公众号:htzhanTech(海涛技术漫谈)
展开
-
模型评估指标:P-R曲线和ROC曲线
在机器学习建模中,模型评估指标用于评估不同模型的优劣。在分类任务中,最简单的评估指标莫过于错误率和精度了,错误率表示的是错误分类的样本个数占总样本个数的比例,精度则是1减去错误率。错误率和精度的优点是:它们不仅仅适用于二分类问题,也同样适用于多分类问题。但是单单看错误率和精度两个指标无法很好的对模型进行合适的评估。一方面,现在不少的模型最终都是预测一个类别的概率值,为了计算错误率和精度...原创 2019-03-19 18:48:27 · 11867 阅读 · 2 评论 -
深入剖析FP-Growth原理
同步更新公众号:海涛技术漫谈频繁项挖掘广泛的应用于寻找关联的事物。最经典的就是,电商企业通过分析用户的订单,挖掘出经常被共同购买的商品,用于推荐。本文首先介绍频繁项挖掘技术的演进,从暴力求解到Aprioir算法。然后,通过一个案例详细的讲解FP-Growth的原理。接下来介绍并行FP-Growth算法怎么通过3次map-reduce实现了并行化。最后通过分析spark mlib包中PF...原创 2019-04-21 18:40:52 · 11154 阅读 · 3 评论 -
TFRecord文件查看包含的所有Features
TFRecord作为tensorflow中广泛使用的数据格式,它跨平台,省空间,效率高。因为 Tensorflow开发者众多,统一训练时数据的文件格式是一件很有意义的事情,也有助于降低学习成本和迁移成本。但是TFRecord数据是二进制格式,没法直接查看。因此,如何能够方便的查看TFRecord格式和数据,就显得尤为重要了。为什么需要查看TFReocrd数据?首先我们先看下常规的写入和读取...原创 2019-08-31 21:29:07 · 5054 阅读 · 0 评论