机器学习
文章平均质量分 92
神兽牛
这个作者很懒,什么都没留下…
展开
-
Python环境安装及数据基本预处理-大数据ML样本集案例实战
1 环境安装shift + Enter :换行ctrl + Enter :执行原创 2018-12-08 13:08:11 · 303 阅读 · 0 评论 -
基于雇员流失率数据进行多分类模型训练及阈值调整实践-大数据ML样本集案例实战
版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。QQ邮箱地址:1120746959@qq.com,如有任何学术交流,可随时联系。1 数据的预处理分析from __future__ import divisionimport pandas as pdimport num...原创 2018-12-11 19:22:55 · 519 阅读 · 0 评论 -
基于球员和裁判数据进行探索性数据分析实践-大数据ML样本集案例实战
版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。QQ邮箱地址:1120746959@qq.com,如有任何学术交流,可随时联系。1 数据简介数据包含球员和裁判的信息,2012-2013年的比赛数据,总共设计球员2053名,裁判3147名,特征列表如下:Var...原创 2018-12-11 19:24:10 · 535 阅读 · 0 评论 -
深度学习基础知识入门及案例代码实战-深度学习牛刀小试
版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。QQ邮箱地址:1120746959@qq.com,如有任何学术交流,可随时联系。1 神经网络基础知识整理RNN网络模型概率函数Softmax分类器是不知道满足的分类器Softmax分类器计算步...原创 2018-12-18 18:47:20 · 1146 阅读 · 0 评论 -
Python基础算法库及可视化库使用实践-大数据ML样本集案例实战
版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。QQ邮箱地址:1120746959@qq.com,如有任何学术交流,可随时联系。1 Numpy详细使用读取txt文件 import numpy world_alcohol = numpy.genfromtxt(...原创 2018-12-18 18:48:47 · 577 阅读 · 0 评论 -
Python基础算法库及可视化库使用实践-大数据ML样本集案例实战
版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。QQ邮箱地址:1120746959@qq.com,如有任何学术交流,可随时联系。1 Numpy详细使用读取txt文件 import numpy world_alcohol = numpy.genfromtxt(...原创 2018-12-18 18:48:47 · 240 阅读 · 0 评论 -
Python基础算法库及可视化库使用实践-大数据ML样本集案例实战
版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。QQ邮箱地址:1120746959@qq.com,如有任何学术交流,可随时联系。1 Numpy详细使用读取txt文件 import numpy world_alcohol = numpy.genfromtxt(...原创 2018-12-18 18:48:47 · 458 阅读 · 0 评论 -
数据处理利器python与scala基本数据结构对比分析1-大数据ML样本集案例实战
版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。QQ邮箱地址:1120746959@qq.com,如有任何学术交流,可随时联系。1 python与scala基本数据结构1.1 scala 数据结构List 案例 val l = List(1, 1, 2, 2, 3...原创 2018-12-18 18:49:26 · 360 阅读 · 0 评论 -
Python技术栈与Spark大数据平台整合实战--大数据ML样本集案例实战
版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。QQ邮箱地址:1120746959@qq.com,如有任何学术交流,可随时联系。1 Python技术栈与Spark大数据数据平台整合下载Anaconda3 Linux版本 Anaconda3-5.3.1-Linux-...原创 2018-12-18 18:50:14 · 322 阅读 · 0 评论 -
数据处理利器python与scala面向对象对比分析2-大数据ML样本集案例实战
版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。QQ邮箱地址:1120746959@qq.com,如有任何学术交流,可随时联系。1 python与scala面向对象对比分析1.1 scala面向对象定义类,包含field以及方法 class HelloWorld...原创 2018-12-18 18:51:10 · 219 阅读 · 0 评论 -
Python技术栈与Spark交叉数据分析双向整合技术实战--大数据ML样本集案例实战
版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。QQ邮箱地址:1120746959@qq.com,如有任何学术交流,可随时联系。1 Python Spark SQL 基本数据处理Python Spark DataFrame 基础 df = spark.read.p...原创 2018-12-18 18:53:18 · 412 阅读 · 0 评论 -
时间序列数据的预处理及基于ARIMA模型进行趋势预测-大数据ML样本集案例实战
版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。QQ邮箱地址:1120746959@qq.com,如有任何学术交流,可随时联系。1 数据的预处理时间序列数据生成 import pandas as pd import numpy as np da...原创 2018-12-11 19:21:09 · 1964 阅读 · 0 评论 -
基于Scikit-learn回归基础问题及TPR及ROC指标相关技术实践-大数据ML样本集案例实战
版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。QQ邮箱地址:1120746959@qq.com,如有任何技术交流,可随时联系。1 线性回归问题实践(车的能耗预测)数据集欣赏 import pandas as pd import matplotlib.pyp...原创 2018-12-22 11:18:22 · 481 阅读 · 0 评论 -
基于逻辑回归及随机森林的多分类问题数据分析-大数据ML样本集案例实战
版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。期待加入IOT时代最具战斗力的团队。QQ邮箱地址:1120746959@qq.com,如有任何学术交流,可随时联系。1 数据预处理数据集介绍 import pandas #ipython notebook tit...原创 2018-12-10 20:07:50 · 8414 阅读 · 0 评论 -
信用卡欺诈行为逻辑回归数据分析-大数据ML样本集案例实战
版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。QQ邮箱地址:1120746959@qq.com,如有任何学术交流,可随时联系。1 信用卡欺诈行为案例集预处理import pandas as pdimport matplotlib.pyplot as pltimpor...原创 2018-12-08 18:12:44 · 1508 阅读 · 0 评论 -
数据相关性可视化及交叉验证预测分析-大数据ML样本集案例实战
版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。QQ邮箱地址:1120746959@qq.com,如有任何学术交流,可随时联系。1 数据预处理DF加上表头 5.1,3.5,1.4,0.2,Iris-setosa 4.9,3.0,1.4,0.2,Iris-set...原创 2018-12-08 22:37:30 · 812 阅读 · 0 评论 -
Python基础算法库及可视化库使用实践-大数据ML样本集案例实战
版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。QQ邮箱地址:1120746959@qq.com,如有任何学术交流,可随时联系。1 Numpy详细使用读取txt文件 import numpy world_alcohol = numpy.genfromtxt("...原创 2018-12-12 22:46:19 · 281 阅读 · 0 评论 -
Hadoop联邦机制加HA容错机制详细配置说明-Hadoop商业环境实战
本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。期待加入IOT时代最具战斗力的团队。QQ邮箱地址:1120746959@qq.com,如有任何学术交流,可随时联系。1 core-site.xml 配置:1:配置统一视图viewfs:///2: 配置不同命名空间下,每一个H...原创 2018-12-19 18:57:09 · 267 阅读 · 0 评论 -
机器学习入门课程5
原创 2018-12-07 00:53:57 · 122 阅读 · 0 评论 -
机器学习入门课程6-Numpy使用
1:分隔符和类型,ndarray核心数组,help非常详细的指南2 三维三个中括号3 一维表示一个多少个元素。4 array元素类型必须一致与其中之一保持同步,都会进行类型转换4 数据索引读取5 切片 (行或列,:表示所有)第0列和第一列取指定行和指定列6 判断7 矩阵操作8 类型转换10 维度axis =1 对行求和,axis =0按列进行...原创 2018-12-07 01:34:40 · 113 阅读 · 0 评论 -
TensorFlow基础及MNIST数据集逻辑回归应用实践-大数据ML样本集案例实战
版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。QQ邮箱地址:1120746959@qq.com,如有任何学术交流,可随时联系。1 TensorFlow基本使用操作TensorFlow基本模型 import tensorflow as tf a = 3 #...原创 2018-12-09 23:01:24 · 267 阅读 · 0 评论 -
Pandas多维特征数据预处理及sklearn数据不均衡处理相关技术实践-大数据ML样本集案例实战
版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。QQ邮箱地址:1120746959@qq.com,如有任何学术交流,可随时联系。1 机器学习调优步骤(第一行不平衡问题处理)2 Pandas多维特征数据预处理数据初始化展示 import pandas as pd...原创 2018-12-20 20:17:55 · 2360 阅读 · 0 评论 -
基于MNIST数据集实现2层CNN神经网络案例实战-大数据ML样本集案例实战
版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。QQ邮箱地址:1120746959@qq.com,如有任何学术交流,可随时联系。1 神经网络基本结构定义28*28=784个像素点,第一层神经元256,第二层神经元1282 基本神经网络构建变量初始化 im...原创 2018-12-10 20:05:06 · 373 阅读 · 0 评论 -
Python技术栈与Spark交叉数据分析双向整合进阶实战--大数据ML样本集案例实战
版权声明:本套技术专栏是作者(秦凯新)平时工作的总结和升华,通过从真实商业环境抽取案例进行总结和分享,并给出商业应用的调优建议和集群环境容量规划等内容,请持续关注本套博客。QQ邮箱地址:1120746959@qq.com,如有任何学术交流,可随时联系。1 Spark SQL 分组聚合统计groupBy与agg搭配使用,agg(*exprs),这个方法是GroupedData上用于计算聚合数...原创 2018-12-18 18:53:58 · 211 阅读 · 0 评论