- 博客(105)
- 资源 (1)
- 收藏
- 关注
原创 正则表达式优化建议
当使用忽略大小写的标志时(例如在某些编程语言中通过特定的参数或修饰符),可能会意外地匹配到不希望的字符串。在优化后的表达式中,我们简化了模式,使用嵌套的分组和可选的量词。但如果对字符串的结构理解错误,可能会错误地使用锚点,导致不期望的匹配结果。)虽然是为了减少匹配量,但在复杂的表达式中可能会导致意外的行为,因为它们的行为取决于周围的模式和回溯机制。捕获组可能会捕获不需要的文本,或者在不需要捕获的时候进行了捕获,导致性能下降和结果的混乱。)时,如果不仔细考虑字符的范围,可能会意外地包含不需要的字符。
2024-09-02 22:19:30 1064
原创 REST framework-通用视图[Generic views]
REST framework-通用视图[Generic views]学习使用
2024-08-14 22:58:16 872
原创 docker开发环境搭建-关于数据库的IP是什么
我在本地的ubuntu系统上安装了docker,并创建了一个mysql容器,但是在使用DBeaver连接该数据库时,需要填写数据库的ip,填写127.0.0.1,工具提示找不到这个库,然后使用。这将把主机的3306端口映射到容器的3306端口。现在,可以使用IP地址来连接DBeaver中的MySQL数据库。,查看返回的信息,然后,也没有找到需要的答案。替换为创建的MySQL容器的实际ID或名称。这将返回容器的IP地址。然后,可以在DBeaver中使用此IP地址连接到MySQL数据库。
2024-08-08 19:10:20 262
原创 Hive-函数-时间处理
在Hive中,处理时间数据的函数非常有用,尤其是在处理包含时间戳或日期字段的大数据时。以下是一些Hive中相对频繁使用的时间处理函数,包括它们的名称、参数、功能以及SQL示例。
2024-08-05 11:52:11 625
原创 Hive-函数-窗口函数
Hive中常用的窗口函数(也称为开窗函数)丰富多样,这些函数能够在进行数据分析时提供强大的支持,特别适用于需要对分组数据进行复杂计算和排序的场景。
2024-08-05 11:49:09 1000
原创 深入探索Python协程:从基础到实践的学习笔记-01
Python协程(Coroutine)作为一种轻量级的并发模型,越来越受到开发者的关注。本文将带你走进Python协程的世界,从基础概念入手,逐步探索其实现原理、应用场景以及最佳实践。
2024-05-12 23:13:21 797 1
原创 主成分分析(PCA)学习
主成分分析(Principal Component Analysis,PCA)是一种常用的数据降维方法,它通过线性变换将原始数据变换为一组各维度线性无关的表示,通常用于提取数据的主要特征分量。PCA 的目标是从原始数据中提取出最重要的特征,通过这些特征来简化数据的复杂性,同时保持数据集中的大部分信息。
2024-05-03 21:06:41 2139
原创 利用PyODPS高效上传下载数据
本文提供了一个使用PyODPS库的Tunnel接口,将数据下载到本地或者上传DataFrame对象到ODPS的实例。
2024-05-01 10:02:45 324 3
原创 使用 Flask、Gunicorn 与 Shell 脚本构建高效 Web 应用部署流程
本文介绍了如何使用 Flask 作为 Web 应用框架,结合 Gunicorn 作为高效的 WSGI 容器来构建并部署 Web 应用。文章还展示了如何编写简单的 shell 脚本来管理应用的启动、重启和停止操作,以提高应用的运维效率。通过使用 Flask 构建 Web 应用逻辑,并结合 Gunicorn 的高性能特性,开发者可以构建出稳定、高效的 Web 服务。同时,shell 脚本的引入使得应用的部署和运维工作变得更加便捷和自动化,为开发者提供了更好的开发体验。
2024-04-28 23:30:57 1376 1
原创 dbt-增量构建
增量构建是指在数据仓库的构建过程中,只处理自上次构建以来发生变化的数据,从而减少数据处理的时间和资源消耗。在 dbt 中,可以使用增量构建来提高数据处理的效率。dbt 中的增量构建是通过比较源表和目标表之间的差异来实现的。dbt 会记录源表和目标表之间的最后一次同步时间,并在下一次构建时只处理自上次同步时间以来发生变化的数据。dbt 的增量构建可以应用在许多场景中,提高数据处理的效率和速度,同时减少资源的消耗。
2024-02-27 23:00:49 806
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人