自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 问答 (2)
  • 收藏
  • 关注

原创 背包问题-python3实现

背包问题-python3实现

2022-09-14 18:14:35 217 1

原创 几个关于使用python、pandas处理数据的题目

使用python处理实际问题

2022-09-02 11:59:10 201

原创 sklearn-交叉验证

使用交叉验证获取合适的参数

2022-07-07 16:29:09 393

转载 数据分析 — 用户粘性的两个计算指标(DAU/MAU和月人均活跃天数)

https://blog.csdn.net/u011919863/article/details/113754427

2021-03-30 23:06:01 752

原创 hive中replace的使用-貌似基本上不怎么用

目前的分区表是这样的:CREATE TABLE `szddemo.partition_fix_dict_ios_month_uv_backup`( || `datasource` string, || `version` string, || `uv` string) || PARTITIONED

2021-03-10 10:32:54 500 1

原创 IOException: incorrect header check-hive查询语句报错

stored as rcFile的hive表估计会有这个问题也许是 zip 有bug。尝试换 DeflateCodec。设置看下:set hive.exec.compress.output=true;set mapred.output.compress=true;set mapred.output.compression.codec=org.apache.hadoop.io.compress.DeflateCodec;set io.compression.codecs=org.apache.h

2020-11-05 17:33:34 910

原创 【大数据之路】第9章阿里巴巴数据整合及管理体系

9.2规范定义名词术语数据域:面向业务分析。既能涵盖目前所有的业务需求,又能在新业务进入时不影响的进入到已有的数据域或扩展新的数据域。业务过程:注意不可拆分的行为事件,例如下单、支付、浏览等。就是企业活动中的事件。修饰类型:修饰词的概括。例如订单中的支付方式、日志域中的访问终端类型等。派生指标:等于原子质保+一个或者多个修饰词+时间周期。待完善...

2020-09-20 22:43:19 483

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除