孤城暮雨@
码龄3年
关注
提问 私信
  • 博客:10,486
    10,486
    总访问量
  • 8
    原创
  • 2,228,433
    排名
  • 60
    粉丝
  • 0
    铁粉
  • 学习成就
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:四川省
  • 毕业院校: 河南工业大学
  • 加入CSDN时间: 2021-12-31
博客简介:

jiang1182427208的博客

查看详细资料
  • 原力等级
    成就
    当前等级
    2
    当前总分
    109
    当月
    0
个人成就
  • 获得74次点赞
  • 内容获得3次评论
  • 获得92次收藏
  • 代码片获得147次分享
创作历程
  • 2篇
    2024年
  • 6篇
    2023年
成就勋章
TA的专栏
  • 数据迁移
    1篇
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

175人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

数据挖掘案例

构造需要预测的新数据,并插入到数据库表ads_cscd_predict_profit_ratio_i_y 中;从数据库表ads_cscd_date_profit_total_asset_i_y中读取历史收益率数据;从数据库表ads_cscd_predict_profit_ratio_i_y中读取待预测的新数据;构造需要预测的新数据,并插入到数据库表ads_cscd_predict_profit_i_y中;将预测结果插入到数据库表ads_cscd_predict_profit_ratio_i_y中。
原创
发布博客 2024.01.02 ·
528 阅读 ·
7 点赞 ·
0 评论 ·
9 收藏

Azkaban+Spark资源调度

先创建dws_cscd数据库,然后创建dws_cscd数据库的外部表,接着创建ads_cscd数据库,最后创建ads_cscd数据库的外部表。首先在IDEA中分别编写创建DWS数据库、DWS库中外部表并导入数据、创建ADS数据库、ADS库中外部表并导入数据的代码。前提条件:各节点之间的免密、登录启动Hadoop集群、Spark、Azkaban、Hive。登录Azkaban,创建dws_and_ads项目并上传Azkaban_spark.zip压缩包。ADS层和ADS层外部表的创建方式与DWS层相同。
原创
发布博客 2024.01.02 ·
582 阅读 ·
14 点赞 ·
0 评论 ·
10 收藏

分区表创建及插入数据的操作

hive.exec.dynamic.partition:是否启动动态分区。默认false。hive.exec.dynamic.partition.mode:打开动态分区后,动态分区的模式为strict和nonstrict。strict可设置为静态和半动态,要求至少包含一个静态分区列。nonstrict可设置为静态、半动态和动态,动态必须设置此参数。hive.exec.max.dynamic.partitions:允许的最大的动态分区的个数。默认1000。
原创
发布博客 2023.12.21 ·
1108 阅读 ·
8 点赞 ·
0 评论 ·
11 收藏

数据仓库命名规范详解

小时(h)、天(d)、周(w)、月(m)、季(q)、年(y)。实时(rt)、小时(h)、天(d)、周(w)、月(m)、季(q)、年(y)、一次性任务(o)、无周期(n)实时(rt)、小时(h)、天(d)、周(w)、月(m)、季(q)、年(y)、一次性任务(o)、无周期(n)实时(rt)、小时(h)、天(d)、周(w)、月(m)、季(q)、年(y)、一次性任务(o)、无周期(n)实时(rt)、小时(h)、天(d)、周(w)、月(m)、季(q)、年(y)、一次性任务(o)、无周期(n)
原创
发布博客 2023.12.21 ·
4926 阅读 ·
28 点赞 ·
0 评论 ·
38 收藏

数据仓库分层详解

从极端情况来说,可以为每一张报表在APP层构建一个模型来支持,达到以空间换时间的目的数据仓库的标准分层只是一个建议性质的标准,实际实施时需要根据实际情况确定数据仓库的分层,不同类型的数据也可能采取不同的分层方法。在这个过程中,数据经过了一定的清洗,比如字段的统一,脏数据的去除等,但是数据的粒度是不会变化的。这一层不是必须有的。而且便于维 护数据的准确性,当 数据出现问题之后, 可以不用修复所有的 数据,只需要从有问 题的步骤开始修复。随着业务的变化,只需 要调整底层的数据,对 应用层对业务的调整零 感知。
原创
发布博客 2023.12.20 ·
597 阅读 ·
7 点赞 ·
0 评论 ·
7 收藏

Kettle行转列详解

将每个指数简称的资产负债率的2013年到2022年的数据从资产负债率那一行转换成日期和资产负债率两列,以供后续分析。
原创
发布博客 2023.12.20 ·
1512 阅读 ·
9 点赞 ·
0 评论 ·
12 收藏

1022 D进制的A+B

输入两个非负 10 进制整数 A 和 B (≤230−1),输出 A+B 的 D (1<D≤10)进制数。
原创
发布博客 2023.10.06 ·
73 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

使用Datax将Hive中的表迁移到MySQL

3. 配置datax配置文件(下面文件和目录均以我自己的为例,可根据自己的需求自行修改)2.MySQL阶段(以下以我自己的数据库和文件为例,可根据需求自己做出相应修改)使用vim spark_1_hive_.json打开文件并写入下列内容。在该目录下创建spark_1_hive_1.json文件。创建一个新的数据库用来接收从Hive中传输过来的数据。(4)给hadoop用户datax权限。(5)去MySQL查询表中是否有数据。(1)下载datax安装包。(2)解压datax压缩包。(3)修改文件夹名称。
原创
发布博客 2023.06.23 ·
1147 阅读 ·
1 点赞 ·
2 评论 ·
5 收藏