机器学习
Jumay0612
一个热爱生活,热爱编程的程序媛,擅长数据处理和分析,目前在做机器学习和数据挖掘方向。喜欢leetcode,虽然脑子不灵光,一直保持锻炼中,防止生锈。。。
展开
-
xgboost算法初步尝试和绘图
数据准备数据使用hive提取,此处不做说明spark.sql读取hive表from pyspark.sql import SparkSessionspark = SparkSession \ .builder \ .enableHiveSupport() \ .appName("predict_sale") \ .getOrCreate()sc = spa...原创 2018-12-13 14:39:14 · 3412 阅读 · 0 评论 -
面试整理(一)----逻辑回归的常见面试点总结
转自:http://www.cnblogs.com/ModifyRong/p/7739955.html1.简介逻辑回归是面试当中非常喜欢问到的一个机器学习算法,因为表面上看逻辑回归形式上很简单,很好掌握,但是一问起来就容易懵逼。所以在面试的时候给大家的第一个建议不要说自己精通逻辑回归,非常容易被问倒,从而减分。下面总结了一些平常我在作为面试官面试别人和被别人面试的时候,经常遇到的一些问题。2...转载 2019-03-29 17:06:45 · 191 阅读 · 0 评论 -
机器学习实践系列(三)----达观杯--北京PM2.5浓度回归分析训练赛
1.大赛地址北京PM2.5浓度回归分析训练赛看了很长时间机器学习算法了,从这个博客开始打算长期更新一些算法的尝试,在实践中用起来。先从最简单的线性回归开始吧。2.赛题说明数据主要包括2010年1月1日至2014年12月31日间北京pm2.5指数以及相关天气指数数据。数据分为训练数据和测试数据,分别保存在pm25_train.csv和pm25_test.csv两个文件中。其中训练数据主...原创 2019-04-10 15:59:19 · 3811 阅读 · 3 评论 -
机器学习实践系列(二)----达观杯--轴承故障检测训练赛
竞赛地址轴承故障检测训练赛任务轴承有3种故障:外圈故障,内圈故障,滚珠故障,外加正常的工作状态。如表1所示,结合轴承的3种直径(直径1,直径2,直径3),轴承的工作状态有10类:参赛选手需要设计模型根据轴承运行中的振动信号对轴承的工作状态进行分类。数据*注 : 报名参赛或加入队伍后,可获取数据下载权限。可供下载使用的有2个文件:1.train.csv,训练集数据,1到6000为按...原创 2019-04-11 15:09:34 · 2879 阅读 · 3 评论