数据挖掘
感性企鹅
数据驱动决策
展开
-
数据挖掘-pandas-读取mysql
背景pandas经常用来读取不同数据源的数据进行分析,本博客实战读取mysql的结构化数据。实战依赖模块:import pandas as pdfrom sqlalchemy import create_engineengine = create_engine('mysql+pymysql://szy:yP0tfUTHvP5q@alpha-mysql.szy.com:3306/dbar...原创 2020-02-13 10:18:01 · 209 阅读 · 0 评论 -
机器学习-java调用机器学习pai的LR模型
背景最近在使用阿里的机器学习pai进行模型训练,训练出来的模型需要给java进行调用来使用。本博客阐述java调用pmml进行预测的过程。实战获取pmml模型在机器学习pai->模板实验->心脏病预测,可以直接训练并且导出模型,具体步骤参考:https://help.aliyun.com/document_detail/34929.html?spm=a2c4g.11186623...原创 2020-01-14 16:56:38 · 763 阅读 · 0 评论 -
数据挖掘-python-numpy排序
背景在进行数据分析的时候,最常用的手段之一就是排序。本博客阐述一下博主经常用到排序方法。基础语法sort,直接对数据排序argsort,获取排序索引需求二维矩阵获取topk在获取索引之后,循环遍历,通过索引获取数据,博主感觉应该有更好的方法,待之后进行优化...原创 2019-12-27 17:36:13 · 221 阅读 · 0 评论 -
数据挖掘-pandas的helloworld
背景数据挖掘中python是一件利器,而pandas则是这个利器的刀剑,可想而知它的重要性,本节做一下它的helloworld。本节重点:数据接入数据命令行简易打印简易画图展示数据接入安装就带过了,不多赘述。这里我使用的jupyter notebookimport pandas as pdimport sklearnimport datetimeimport panda...原创 2019-12-04 11:26:54 · 193 阅读 · 0 评论