自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

ArYe

人工智能

  • 博客(460)
  • 资源 (18)
  • 收藏
  • 关注

原创 图解HIVE时间和日期and类型转换

时间戳现在今天昨天字符串秒数现在SELECT CURRENT_TIMESTAMP();current_dateunix_timestampFROM_UTC_TIMESTAMPGMT+8

2021-06-25 20:08:31 404

原创 大数据(0b)离线数据仓库

离线数仓数据库Database按照数据结构来组织、存储和管理数据的仓库数据仓库Data Warehouse是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合范式:构造关系数据库遵循的规则范式理论关系建模维度建模维度表事实表数仓分层ODS Operation Data StoreDWD Data Warehouse DetailDWS Data Warehouse ServiceDWT DataData Warehouse TopicADS

2020-12-25 23:34:29 2239

原创 图解Python时间和日期time和datetime数据类型转换

4大数据类型time.struct_time ⇌ floattime.struct_time ⇌ strdatetime.datetime ⇌ strPython主要内容:时间相关的数据类型转换floattime.struct_timestrdatetime.datetime4大数据类型import time, datetime时间运算日期转换

2020-02-27 08:47:34 3078 4

原创 文本清洗正则表达式(持续更新)

文章目录替换标点:中->英转小写查找时间数量词文本切分替换标点:中->英def replace_punctuation(text): """替换标点(英→中)""" text = text.replace(',', ',') # 逗号 text = text.replace(';', ';') # 分号 text = text.replace(...

2019-09-16 15:57:03 5002 7

原创 Python【print】常用颜色(复制用)

字体颜色# redprint('\033[031m')print('\033[0m')# yellowprint('\033[033m')# blueprint('\033[034m')# purpleprint('\033[035m')蓝绿色计时器背景色

2018-06-18 11:43:57 3833 1

原创 召唤物继承英雄属性(War3地图编辑器)

War3、地图编辑器、魔兽争霸3、触发器

2024-03-18 20:00:00 396 1

原创 无限自动出兵【war3地图编辑器】

触发器、魔兽争霸3、war3、地图编辑器

2024-03-16 22:12:26 505

原创 艾鲁尼之优雅【War3地图编辑器】

艾鲁尼之优雅、防御

2024-03-10 15:22:20 984

原创 游戏中主流的护甲计算

护甲、暴击、攻速、攻击速度、攻击力、暴击概率、暴击伤害、护甲穿透、魔法

2024-03-10 14:15:04 971 1

原创 群体风暴之锤【War3地图编辑器】

地图编辑器war3魔兽争霸3群体风暴之锤触发器

2024-03-03 18:00:09 450 1

原创 释放 群星聚落 时 自动魔免【War3地图编辑器】

魔兽争霸3地图编辑器war3触发器群星聚落魔法护盾

2024-03-01 15:06:32 402 1

原创 奥本海默-电影剧情简介

原子弹罗伯特·奥本海默阿尔伯特·爱因斯坦量子力学中子裂变聚变氢弹

2023-12-04 14:51:24 1127

原创 Python等比数列

python等比数列等差数列斐波那契数列

2023-10-24 23:47:20 623

原创 Python不调包手绘圣诞树

python手写圣诞树

2023-09-15 16:30:32 267

原创 Python工程师Java之路(p)Maven聚合和继承

继承、聚合、排除依赖、可选依赖

2023-09-14 22:56:44 361

原创 Python工程师Java之路(p)Module和Package

project、module、package、IDEA

2023-09-14 12:38:28 855

原创 桃矢:我把魔力都给你,希望你保护好小樱,和你自己

魔卡少女樱-第65话-雪兔与消失的力量

2023-07-15 15:21:07 145

原创 海岛旅行回忆总结(不定更)

大辣甲岛、外伶仃岛、东澳岛、下川岛

2023-04-30 15:25:03 1094

原创 Python工程师Java之路(t)使用Shell脚本部署SpringBoot

mavenGit仓库服务器进程编译、打包、重启

2023-03-18 11:11:38 1584

原创 海南三亚游记2022-2023跨年

海南三亚海口亚龙湾西岛鹿回头天涯海角机票椰子吉阳区天涯区

2023-01-06 18:28:27 1016

原创 Python工程师Java之路(t)SpringBoot配置文件

SpringBoot配置文件@Component@ConfigurationProperties@Autowired

2022-12-28 14:38:12 396

原创 Python工程师Java之路(t)SpringBoot部署步骤 java -jar

java -jar

2022-12-17 18:10:43 506

原创 记一些女装数据分析

服装维度尺码:XS、S、M、L、XL一级分类:上半身、下半身、全身季节:春、夏、秋、冬价格类型:正价、特价、折扣价、降价、优惠券…价格段:廉、贵年龄段:婴儿、儿童、少年、青年、中年面料:棉布、麻布、丝绸、、呢绒、皮革、化纤、混纺、莫代尔厚度:厚、薄长度:长、中、短、超短是否展陈(通常,贵价连衣裙 会 用衣架挂起展示,甚至穿假人身上,而 便宜T恤 则 折叠堆放)季节状态:季前、当季、过季服装的重要特性:试穿因此,先上渠道 和 线下渠道 各有优势

2022-12-13 18:11:30 723

原创 FlinkCDC部署

FLINK-CDCFlinkCDC

2022-12-10 12:48:30 2576 1

原创 实时数仓Flink生产环境部署+提交作业【步骤】

fastjsonjsonCheckpointorg.apache.hadoopFlinkSQLflink-connector-kafkaflink-table-planner-blinkorg.apache.maven.pluginsmaven-shade-plugin

2022-12-08 18:47:28 1819

原创 大数据(9h)FlinkSQL连MySQL、Kafka

flink-connector-jdbcflink-connector-kafka

2022-12-06 15:35:22 547

原创 Python工程师Java之路(w)数据库连接池Druid

DruidDataSourceDruidPooledConnectionjava.sql.ResultSetjava.sql.ResultSetMetaDatajava.sql.Statement缓冲池数据库连接池com.alibabaconnection pool

2022-12-06 12:36:50 836 1

原创 大数据(9f)Flink窗口函数练习:计算PV和UV

PVPage View,页面浏览量UVUnique Visitor,独立访客数(本文按设备ID去重)

2022-12-05 14:30:42 292

原创 一段时间后,stop-dfs.sh关不掉Hadoop3.1.3集群,stop-hbase.sh关不掉HBase集群

stop-dfs.sh关不掉Hadoop3.1.3集群stop-hbase.sh关不掉HBase集群

2022-12-04 10:12:53 937

原创 大数据(9g)FlinkCEP

CEPComplex Event Processing:复杂事件处理flink-cepflink

2022-12-03 23:23:02 593

原创 大数据(9j)FlinkCDC

CDC概述Flink-CDCflink-connector-mysql-cdcFlink-CDC代码测试开启MySQL8 BinlogFlinkSQL

2022-12-02 23:45:25 758

原创 大数据(9e)Flink侧输出流

sideOutputLateDataside output窗口允许迟到的数据,但仍有数据在关窗后到达Flink提供了侧输出流(sideOutput)来处理关窗之后到达的数据sideOutputLateDataOutputTagsideOutput

2022-11-30 17:33:28 1954

原创 大数据(9h)FlinkSQL双流JOIN

Lookup JoinTemporal Joins基于处理时间JOIN设置状态保留时间基于事件时间JOINInterval Joins(基于间隔JOIN)Temporal Join

2022-11-29 16:32:03 1661

原创 大数据(9h)FlinkSQL之Lookup Join

ttlFOR SYSTEM_TIME AS OFProcessing Time Temporal Joinlookup joinlookup cacheFlink查询缓存lookup.cache.max-rowslookup.cache.ttl

2022-11-29 16:29:12 6735 1

原创 自写Java时间处理工具(处理数据用)

获取当前时间获取今天日期获取昨天日期获取当前时间戳时间戳(毫秒级)转字符串时间戳(秒级)转字符串字符串转时间戳(毫秒级)字符串转时间戳(秒级)SimpleDateFormattime.Instant;java.time.LocalDateTimeZoneIdDateTimeFormatter

2022-11-29 10:19:24 190

原创 大数据(9e)Flink定时器

registerProcessingTimeTimerregisterEventTimeTimer基于处理时间的定时器基于事件时间的定时器

2022-11-28 14:05:10 334

原创 Flink打印当前Watermark

WatermarkStrategyforMonotonousTimestampstimerServicecurrentWatermarkforBoundedOutOfOrderness水位线水位线策略MonotonousWatermark

2022-11-28 12:49:36 379

原创 大数据(9f)Flink双流JOIN

使用状态列表实现 INNER JOIN(双流connect后CoProcessFunction)基于间隔的JOIN(Interval Join)基于窗口的JOIN(Window Join)

2022-11-27 09:20:20 631

原创 Python工程师Java之路(h)Java字符串拼接+null拼接处理

Java版本:1.8String的concatStringBuilder和StringBuffer的appendString的joinStringJoinerStringUtils.join场景:拼接SQLPhoenixMySQL

2022-11-24 22:25:19 761

原创 大数据(9f)Flink状态编程

Managed StateOperator StateListStateBroadcastStateKeyed StateValueStateListStateMapStateReducingStateAggregatingState状态后端

2022-11-24 00:07:00 491

编译好的Atlas服务和HIVE-hook

版本2.1.0 apache-atlas-2.1.0-server.tar.gz和apache-atlas-2.1.0-hive-hook.tar.gz

2022-02-03

ClickHouse2021年的安装包

解压后有4个ClickHouse的安装包

2021-09-01

ElasticSearch6.6压缩Linux压缩包

ElasticSearch6.6+kibana-6.6.0+elasticsearch-analysis-ik-6.6

2021-08-25

AI古诗生成2021版.rar

Python程序写诗【训练1分钟】古诗生成,原创链接: https://yellow520.blog.csdn.net/article/details/86726619

2021-06-20

hadoop-3.1.0.rar

适用于Windows10+IDEA上开发hadoop3.13的安装包(或者叫:压缩包;依赖) https://yellow520.blog.csdn.net/article/details/115712233

2021-04-14

segment.rar

Java+Maven实现中文分词:https://yellow520.blog.csdn.net/article/details/115035978

2021-04-06

Spark中文分词+文本分类.rar

Scala中文分词+SparkML逻辑回归 实现 中文文本分类

2021-03-25

离线数仓安装包.rar

亲测可用的JDK、Hadoop、HIVE安装包,配套博文: https://yellow520.blog.csdn.net/article/details/112253651

2021-01-06

大数据入门HIVE和MySQL安装包

配套专栏:https://blog.csdn.net/yellow_python/category_10582173.html

2020-12-25

大数据入门安装包Hadoop、JDK等

配套本专栏(https://blog.csdn.net/yellow_python/category_10582173.html)的大数据入门安装包

2020-12-25

自然语言处理文本分类实验

Python文本分类总结:贝叶斯,逻辑回归,决策树,随机森林,SVM,词向量,TFIDF,神经网络,CNN,LSTM,GRU,双向RNN,LDA:含文本10分类语料、机器学习算法、深度学习算法、专家系统,文本分类结果及结论

2020-09-27

NLP文本10分类EXCEL

用于自然语言处理的文本10分类语料,xlsx格式,数据量19467,分别为: [('science', 2093), ('car', 2066), ('finance', 2052), ('sports', 2017), ('military', 2007), ('medicine', 2000), ('entertainment', 1906), ('politics', 1865), ('education', 1749), ('fashion', 1712)]

2020-09-19

2020中国省市拼音.xlsx

2020年中国一级和二级行政区划的【驼峰拼音】,一共三百多条数据,另附行政区划全称和简称,说得够清楚了,下了就不要给差评。

2020-07-21

region2019.xlsx

中国行政区划2019(2020年采集),采集自国家统计局http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/

2020-05-28

中国行政区划【更新至2018-10-31】

中国行政区划(更新至2018-10-31),数据采集于2019年采集。 采集网址:http://www.stats.gov.cn/tjsj/tjbz/tjyqhdmhcxhfdm/2018/index.html

2019-03-27

Keras英译中seq2seq简洁示例

Keras【极简】seq2seq英译中示例,附带语料以及训练500次后的模型

2019-02-21

Python程序写诗【1分钟】古诗词生成

Python词向量gensim文本生成,训练【一分钟】,诗词歌赋【一秒生成】

2019-02-11

Python一分钟生成古诗词

Python文本生成程序,从零训练词向量,一分钟生成古诗对联~

2019-01-31

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除