自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 XGBoost学习

下面是一个使用Python实现的简单XGBoost分类任务示例,包括数据预处理、模型训练、评估和预测的基本步骤。此示例使用了著名的鸢尾花(Iris)数据集,该数据集可以直接从sklearn库获取。XGBoost广泛应用于推荐系统、信用评分、疾病预测等多个领域。通过实例分析,我们可以直观感受到其在实际问题解决中的强大威力。

2024-06-20 16:16:49 252

原创 【python】数据仿真法

数学仿真法计算平均获得一名五星角色的概率是多少?该概率与基础概率相比有多大区别?保底机制: 最多90次抽奖必定获得一个五星角色。一般概率: 抽中五星角色的基础概率为0.6%

2022-08-12 13:24:39 672 1

原创 商家看板指标体系

商家看板指标体系

2022-01-27 13:43:15 394

原创 hive 同比&环比&对比

hive 同比&环比&对比

2021-12-16 18:14:33 1332

原创 hive 常用数据类型01

hive 数据格式01一级目录二级目录三级目录一级目录二级目录三级目录

2021-12-15 15:28:29 1431

原创 【hive】时间函数01

月份第一天,最后一天,一月多少天select trunc('2021-12-13','MM');select last_day('2021-12-13');select (datediff(last_day('2021-12-13'), trunc('2021-12-13','MM')) + 1) days;返回值:2021-12-012021-12-3131当天:select current_date()select '${zdt.addDay(-1).format("yyyy

2021-12-13 18:06:09 2763

原创 常用数据分析框架

常用数据分析框架

2020-05-20 15:54:44 488

原创 Intellij IDEA15 编写Python

Intellij IDEA15:建立Python 工程原文地址 https://blog.csdn.net/weixin_41659384/article/details/80636535五个步鄹:1)Windows中Python安装2)Intellij IDEA15中Python安装3)Intellij IDEA15建立Python项目4)编辑Python脚本5)安装pipWindows中Python安装:Intellij IDEA15中Python安装:Intellij IDEA

2020-05-12 13:42:31 241

原创 Python数据分析入门 matplotlib数据可视化基础【三】

分析特征内部数据分布与分散状况绘制直方图主要用户查看各分组数据的数量分布,以及各个分组数据之间的数量比较可比较直观地看出产品质量特性的分布状态,便于判断其总体质量分布情况可发现分布表无法发现的数据模式、样本的频率分布和总体的分布bar函数的常用参数及其说明绘制饼图倾向于查看各分组数据在总数据中的占比可比较清楚地反映出部分与部分、部分与整体之间的比例关系,易于显示每组数据相对于总数...

2020-04-28 22:36:32 541

原创 Python数据分析入门 matplotlib数据可视化基础【二】

Python 入门 matplotlib数据可视化基础【二】分析特征之间的关系绘制散点图三级目录绘制折线图绘制散点图任务实现分析特征之间的关系绘制散点图三级目录绘制折线图绘制散点图任务实现...

2020-04-27 15:29:18 849

原创 Python数据分析入门 matplotlib数据可视化基础【一】

matplotlib数据可视化基础掌握绘图基础语法与常用参数掌握pyplot基础语法创建画布与创建子图添加画布内容分析特征之间的关系二级目录三级目录分析特征内部的数据分布与分散状况二级目录三级目录掌握绘图基础语法与常用参数掌握pyplot基础语法import matp;ot;ib.pyplot as pltpyplot基本绘图流程:创建画布与创建子图plt.figure :创建一个空...

2020-04-26 22:36:13 1666

原创 利用numpy进行统计分析

numpy 统计分析排序 sort去重 unique重复数 repeat tile累计和、累计积

2020-04-25 14:44:54 811

原创 HSQL like和rlike区别【HIVE SQL】

hive中like、rlike的使用方法

2020-04-22 17:59:43 3143

原创 HSQL替换空格【HIVE SQL】正则表达式使用

hive sql替换空格正则表达式regexp_replacetrim

2020-04-21 16:52:03 5311

原创 SQL 累计和

SQL 累计和

2020-04-09 15:56:39 200

原创 SQL 当天在当月、当季度、当年的时间进度

SQL 当天在当月、当季度、当年的时间进度

2020-04-03 14:12:55 2645

原创 SQL 【hive建表&导入数据】

SQL insert overwriteinsert into create创建 导入 表

2020-04-02 19:01:59 1279

原创 python数据分析入门【numpy】

numpy array函数 切片 索引 排序 随机数

2020-03-30 17:28:56 628

原创 python数据分析入门【前菜】

python入门知识:基本知识点、元组、列表、字典等

2020-03-27 17:06:49 734

原创 SQL 周数据对比(本周VS上周)

用sql计算本周和上周同期区别

2020-03-26 16:41:22 8397

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除