机器学习
文章平均质量分 56
IT小村
Java JavaScript Python
展开
-
Spark 2.0 机器学习 ML 库:常见的机器学习模型(Scala 版)
一、前言机器学习中,人为地设计算法,需要一定的知识积淀。 而使用别人设计好的机器学习库如 Spark 2.0 ML,那是基本不需要什么基础的,开箱即用。 首先,看一个简单、完整、规范的案例,无疑是最好的方式。 之前的文章(内含短小精悍的案例): Spark 2.0 机器学习 ML 库:特征提取、转化、选取(Scala 版) Spark 2.0 机器学习 ML 库:机器学...原创 2018-08-15 17:10:14 · 13987 阅读 · 7 评论 -
使用结巴分词(jieba)对自然语言进行特征预处理(Python、Java 实现)
一、前言之前使用基于 Python 语言的 Spark 进行机器学习,编程起来是十分简单。① 但是算法部署到云服务器上,是一个障碍。② 得借助 Flask/Django 等 Python Web 开发框架,同时这些框架的部署又是一个障碍。③ 借助 Docker 来简化部署,Spark 环境又是一个障碍。近来试着将之前的Python版算法改写为 Java 版本。首先是 jieba 分词的...原创 2018-11-14 11:17:48 · 5159 阅读 · 0 评论 -
使用 Spark ML + Jieba + Pandas 实现一个疾病智能诊功能(Python)
一、前言电子病历,很多市中心医院都在使用,却很少有人将其中的数据用于机器学习,以达到智能诊断的功能本文对此做了一个实战案例。二、可行性分析1、功能介绍:用户输入个人身体特征的信息,机器返回最可能的得出的疾病类型及其可能性 %。2、分析:① 用户输入个人病症时,为一段 中文 字符串② 首先要进行做特征处理,即将文字进行分词(英文则可以直接跳过!),③ 打上标签 label,进行 S...原创 2018-11-13 07:54:33 · 2539 阅读 · 4 评论