白日与明月-CSDN博客

原创 hive-distribute by使用场景解析

DISTRIBUTE BY 的最佳实践围绕数据倾斜治理、Join 局部性优化和预聚合数据对齐展开。实际应用中需结合业务场景、数据分布特点和执行引擎特性灵活调整，建议通过实验对比不同配置的性能差异。

2025-03-01 21:54:44 887

原创删除hive用户后该用户创建的表权限问题及修复

当hive集群开启多用户的模式下，假设用户组A的用户hive_test创建了一个表，此时另一个用户也是可以访问这个表的，但是因为一些原因，目前需要删除用户组A和用户hive_test, 在这个情况下，该用户创建的表，此时能否正常被进行查询或者数据插入等操作？如果不能，应该如何修复这个问题？

2025-02-20 10:15:37 1324

原创 vsFTPd服务部署和用户模式简介

服务器部署vsftp，vsftp用户模式说明，PAM认证，解决用户密码正确，无法登录的疑难问题（直接跳转最后查看解决办法）

2025-01-06 23:01:25 1223

原创使用智普AI的sdk和streamlit创建一个简单的chatbot

使用智普AI的sdk和streamlit创建一个简单的chatbot

2024-10-03 18:50:08 411

当使用忽略大小写的标志时（例如在某些编程语言中通过特定的参数或修饰符），可能会意外地匹配到不希望的字符串。在优化后的表达式中，我们简化了模式，使用嵌套的分组和可选的量词。但如果对字符串的结构理解错误，可能会错误地使用锚点，导致不期望的匹配结果。）虽然是为了减少匹配量，但在复杂的表达式中可能会导致意外的行为，因为它们的行为取决于周围的模式和回溯机制。捕获组可能会捕获不需要的文本，或者在不需要捕获的时候进行了捕获，导致性能下降和结果的混乱。）时，如果不仔细考虑字符的范围，可能会意外地包含不需要的字符。

2024-09-02 22:19:30 1453

原创 PostgreSQL中的模式[schema]

postgresql数据库中的模式，以及如何选择。

2024-08-25 14:50:02 1438

原创本地创建PyPI镜像

本地搭建pypi镜像

2024-08-17 14:19:50 282

原创 DRF-API-解析器

DRF-API-解析器学习

2024-08-15 21:52:31 679

原创 DRF-API学习-Routers

DRF库中关于routers-api的学习

2024-08-15 21:31:24 670

原创 REST framework-ViewSets学习

REST framework-viewsets相关api学习

2024-08-14 23:40:11 764

原创 REST framework-通用视图[Generic views]

REST framework-通用视图[Generic views]学习使用

2024-08-14 22:58:16 938

原创 REST framework中Views API学习

django-rest_framework中view相关api学习

2024-08-14 22:48:06 894

原创 docker开发环境搭建-关于数据库的IP是什么

我在本地的ubuntu系统上安装了docker，并创建了一个mysql容器，但是在使用DBeaver连接该数据库时，需要填写数据库的ip，填写127.0.0.1，工具提示找不到这个库，然后使用。这将把主机的3306端口映射到容器的3306端口。现在，可以使用IP地址来连接DBeaver中的MySQL数据库。,查看返回的信息，然后，也没有找到需要的答案。替换为创建的MySQL容器的实际ID或名称。这将返回容器的IP地址。然后，可以在DBeaver中使用此IP地址连接到MySQL数据库。

2024-08-08 19:10:20 337

原创 docker开发环境搭建-mysql搭建

使用docker部署MySQL

2024-08-07 20:53:14 337

原创 Hive-函数-时间处理

在Hive中，处理时间数据的函数非常有用，尤其是在处理包含时间戳或日期字段的大数据时。以下是一些Hive中相对频繁使用的时间处理函数，包括它们的名称、参数、功能以及SQL示例。

2024-08-05 11:52:11 1123

原创 Hive-函数-窗口函数

Hive中常用的窗口函数（也称为开窗函数）丰富多样，这些函数能够在进行数据分析时提供强大的支持，特别适用于需要对分组数据进行复杂计算和排序的场景。

2024-08-05 11:49:09 1373

原创合并邻近时间的数据

【代码】合并邻近时间的数据。

2024-07-09 21:57:56 460 1

原创 Django中模型的基于类的混入

模型通过基于类的混入(继承),让模型继承重复的字段,减少一些不必要的重复工作.

2024-07-06 16:23:21 376

原创 Django-开发一个列表页面

使用django的内置视图,快速创建列表页面,提供基本的查询功能

2024-06-26 23:16:24 855

原创 pandas中的loc和iloc

pandas中的loc和iloc使用

2024-06-19 21:57:33 978

原创在win10折腾Flowise：部署和尝试

在win10部署Flowise，并基于ollama搭建简单的llm应用

2024-05-15 23:52:57 1685 4

原创深入探索Python协程：从基础到实践的学习笔记-01

Python协程（Coroutine）作为一种轻量级的并发模型，越来越受到开发者的关注。本文将带你走进Python协程的世界，从基础概念入手，逐步探索其实现原理、应用场景以及最佳实践。

2024-05-12 23:13:21 857 1

原创连续活跃天数统计

基于SQL、python统计对象连续出现天数

2024-05-08 21:21:39 810

原创数据预处理手段之【数据归一化】

数据预处理中的数据归一化介绍，列举常用归一化算法

2024-05-03 22:05:55 2730

原创主成分分析(PCA)学习

主成分分析（Principal Component Analysis，PCA）是一种常用的数据降维方法，它通过线性变换将原始数据变换为一组各维度线性无关的表示，通常用于提取数据的主要特征分量。PCA 的目标是从原始数据中提取出最重要的特征，通过这些特征来简化数据的复杂性，同时保持数据集中的大部分信息。

2024-05-03 21:06:41 2773

原创 WebSocket学习笔记

websocket学习

2024-05-03 10:11:44 1217

原创使用pyodps的表读写接口实现上传下载

使用pyodps的表读写接口实现上传下载

2024-05-01 10:16:31 360

原创利用PyODPS高效上传下载数据

本文提供了一个使用PyODPS库的Tunnel接口，将数据下载到本地或者上传DataFrame对象到ODPS的实例。

2024-05-01 10:02:45 594 3

原创使用 Flask、Gunicorn 与 Shell 脚本构建高效 Web 应用部署流程

本文介绍了如何使用 Flask 作为 Web 应用框架，结合 Gunicorn 作为高效的 WSGI 容器来构建并部署 Web 应用。文章还展示了如何编写简单的 shell 脚本来管理应用的启动、重启和停止操作，以提高应用的运维效率。通过使用 Flask 构建 Web 应用逻辑，并结合 Gunicorn 的高性能特性，开发者可以构建出稳定、高效的 Web 服务。同时，shell 脚本的引入使得应用的部署和运维工作变得更加便捷和自动化，为开发者提供了更好的开发体验。

2024-04-28 23:30:57 1507 1