自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(67)
  • 收藏
  • 关注

原创 how to decrease volatility

a. Neutralizationb. Portfolio Constructionc. Reduce Overtradingd. Monitor Exposuree. Stabilize Input Data

2025-05-06 13:32:20 323

原创 how to increase return

a. Enhance Signal Qualityb. Diversify Your Inputsc. Target High-Impact Areasd. Improve Model Complexitye. Maximize Alpha Persistence

2025-05-06 13:30:44 220

原创 使用trade_when构建event alphas和low turnover alphas

event alpha” 就是指投资者通过捕捉和利用这些特定事件所带来的投资机会,从而获取超越市场平均水平的额外收益。比如,当一家公司公布超预期的财报这一事件发生时,投资者提前分析并布局,可能会在股价因财报利好而上涨的过程中获得比市场整体表现更好的回报,这部分额外回报就可以理解为 “event alpha”。} else {

2025-05-06 10:48:30 322

原创 worldquant brain如何提高alpha质量

注意:不要单纯调参,重要的是数学建模依据和内在经济含义。目标:Alphas with decent Sharpe (>2.5) and reasonable turnover (< 40%)

2025-05-06 00:49:15 329

原创 Incompatible unit for input at index 1, expected “Unit[CSPrice:-1,CSShare:-1]“, found “Unit[]“

worldquant brain代码出现这个报错,如果逻辑没有问题,官方说可以直接忽视。

2025-05-03 10:51:31 93

原创 ORM框架

框架语言/平台核心优势典型场景Ruby/Rails开发效率高,约定优于配置Web应用快速原型开发Django ORM集成度高,迁移工具完善中大型Web项目.NETLINQ支持,企业级功能企业级复杂业务系统HibernateJavaJPA标准,跨数据库兼容传统企业应用SequelizeJavaScript异步友好,轻量级Node.js后端服务。

2025-04-01 16:36:14 761

原创 【Cassandra数据库学术文献】

(解析Cassandra的分布式哈希表设计与最终一致性实现)

2025-04-01 15:34:38 948

原创 【Distributed Architecture and Clustered Database】

Describe common types of database architecture along with their benefits.Describe some techniques for managing data and optimizing performance.Multiple database servers processing workloads concurrentlyServer establishes a connection to a shared storageHi

2025-04-01 15:23:00 935

原创 数据库架构

通过结合业务需求、技术栈和成本预算,选择最匹配的数据库架构,可显著提升系统性能、可用性和可维护性。通过系统化的技术组合和场景化的策略选择,可显著提升数据管理效率和系统性能。

2025-04-01 14:48:14 935

原创 Airflow+Spark/Flink vs. Kettle

支持自定义代码(Python/Java),无缝集成Spark/Flink,适配复杂数据转换(如达梦→星环的类型映射)。Linux命令行模式(Kitchen)可用,但图形界面(Spoon)在国产化系统中可能兼容性问题(如字体、依赖库)。专业ETL工具,内置数据处理逻辑(转换、清洗),支持单机/集群(Kitchen/Carte模式)。单机性能有限(百万级),分布式模式(Kettle集群)配置复杂,性能提升有限(受限于JVM内存)。num_executors=20, # 20个Executor并行。

2025-04-01 10:58:44 1038

原创 【Database Architecture】

Describe some common deployment topologies.Recognize the advantages of deploying databases in cloud.

2025-04-01 10:48:12 760

原创 MySQL 创建用户,建库,建表

通过以上步骤,即可完成用户创建、数据库创建及表结构设计。实际使用时,根据业务需求调整表字段和权限范围。输入密码后回车,进入 MySQL 命令行界面。

2025-03-20 14:38:05 727

原创 kafka启动命令

首先要确保已经安装好了 Java 环境,因为 Kafka 是基于 Java 开发的,需要 Java 运行时的支持。配置文件来启动 Kafka 服务器实例,之后 Kafka 就处于运行状态,可以开始使用它进行消息的生产和消费等操作了。按照默认配置启动 Kafka 服务器,使其可以对外提供服务,接收和处理消息的生产与消费请求等。等)进行修改,例如修改监听地址、端口等相关参数,以更好地适配实际的网络环境和业务场景。另外,在实际使用中,可能还需要根据具体需求对 Kafka 的配置文件(如。

2025-03-13 15:41:46 750

原创 使用SDKMAN!安装springboot

Spring Boot 需要 Java 环境才能运行。如果您尚未安装 Java,可以通过 SDKMAN!安装 OpenJDK。完成这些步骤后,您就可以在 Ubuntu 环境中使用 Spring Boot 进行开发了。完成上述步骤后,您就可以使用 SDKMAN!安装 Spring Boot 了。,并将其配置到您的用户目录中。安装完成后,需要初始化 SDKMAN!或者,您也可以重新打开终端窗口,让初始化脚本自动加载。如果安装成功,您将看到 SDKMAN!运行以下命令验证 SDKMAN!命令之前,您需要先安装。

2025-03-03 15:37:36 485

原创 【ubuntu搭建jupyter notebook并在windows上访问】

要设置 Jupyter Notebook 的监听地址和端口,您需要修改 Jupyter Notebook 的配置文件。

2025-02-26 17:43:32 504

原创 防火墙ufw和firewalld对比

在 Linux 系统中,ufw(Uncomplicated Firewall)和firewalld(Firewall Daemon)是两个不同的防火墙管理工具,它们分别属于不同的防火墙系统。因此,它们的命令和操作方式也有所不同。

2025-02-21 09:45:41 636

原创 虚拟机之间复制文件

在防火墙关闭的前提下,您可以通过几种不同的方法将文件从一个虚拟机复制到另一个虚拟机。这里,我们假设您想要从 IP 地址为 192.168.4.5 的虚拟机上的/tmp文件夹复制文件到当前虚拟机(192.168.4.6)的/tmp文件夹下。

2024-11-25 16:02:20 1816

原创 端口port常识

端口(Port)用于区分不同的服务或进程。在网络通信中,每个运行在计算机上的进程都会通过一个端口来与其他计算机上的进程进行通信。了解这些基本的端口知识和使用常识可以帮助你更好地管理网络服务和提高网络安全性。

2024-11-22 10:01:29 656

原创 preparedStatement.executeUpdate()/addbatch()

【代码】preparedStatement.executeUpdate()/addbatch()

2024-11-15 15:30:44 949

原创 Java库lombok

方法来生成哈希值,该方法接受多个参数并根据这些参数计算出一个哈希值。这样可以确保如果两个对象通过。然后将传入的对象强制转换为当前类型,并逐个比较各个属性是否相等。方法中,首先进行简单的引用相等性检查。或者不是同一类型的对象,则返回。方法也应该返回相同的结果。方法比较相等,那么它们的。

2024-11-07 10:44:37 1022

原创 【极限编程(XP)】

极限编程(XP)、Scrum 和微服务架构之间存在一定的联系。

2024-11-06 11:31:30 1549

原创 在子类中调用父类的构造函数

【代码】在子类中调用父类的构造函数。

2024-11-04 18:55:37 543

原创 Bash脚本的使用场景和调试方法

Bash 脚本可以在任何支持 Bash 的环境中使用,包括但不限于各种 Linux 发行版、Mac OS X(通过默认的 Terminal 应用或 iTerm2 等第三方终端模拟器),以及通过 Windows Subsystem for Linux(WSL)在 Windows 10 和更高版本上运行。此外,Bash 脚本也可以在 Docker 容器中运行,以实现环境的一致性和可移植性。调试 Bash 脚本可以是一个挑战,尤其是对于复杂的脚本。调试是一个逐步的过程,需要耐心和细致的检查。

2024-11-04 10:29:16 743

原创 Linux/Unix echo命令

echo是 Linux 和 Unix 系统中一个非常基本且常用的命令行工具,用于在终端或文件中显示文本。以下是一些echo在终端显示 “Hello, World!echo $PATH显示环境变量PATH的值。将 “New content” 写入file.txt,如果文件不存在则创建它。将 “Additional content” 追加到file.txt文件的末尾。使用-e选项来解释转义序列(如\n表示换行)。使用-n选项来防止echo命令在输出后添加换行符。echo $?显示上一个命令的退出状态。$(

2024-11-04 10:22:33 1323

原创 Linux/Unix awk命令

的强大之处在于它能够处理复杂的文本和数据操作,包括模式匹配、字段分割、数组操作等。是一个强大的文本处理工具,它在 Unix 和类 Unix 系统中用于模式扫描和处理语言。创建一个数组,将每行的第一个字段作为键,第二个字段作为值,最后打印数组的内容。的功能远不止这些,它几乎可以作为一个完整的编程语言来使用。如果第一个字段的值大于10,则打印第一个和第二个字段。计算第一字段的总和,并在处理完所有行后打印。的内置变量,代表当前处理的是第几行。打印每行的第一个和第二个字段。打印每行的第一个字段。

2024-11-04 10:17:48 663

原创 Linux/Unix grep命令

是一个在 Linux 和 Unix 系统中广泛使用的命令行工具,用于搜索文件中的文本行。非常强大,可以通过组合不同的选项和正则表达式来执行复杂的文本搜索任务。文件中搜索包含 “pattern” 的行,并输出这些行。选项来计算 “pattern” 在文件中出现的次数。选项来列出包含 “pattern” 的文件名。选项来显示不包含 “pattern” 的行。目录及其子目录中搜索 “pattern”。选项只输出匹配的字符串,而不是整行。选项来使用扩展正则表达式。选项来高亮显示匹配的文本。命令的一些基本用法。

2024-11-04 10:16:42 709

原创 Unix 中文件权限设置

所有者(owner)、组(group)和其他(others):读(read)、写(write)和执行(execute)- 所有者(owner):读(read)、写(write)和执行(execute)- 所有者(owner):读(read)、写(write)和执行(execute)- 所有者(owner):读(read)、写(write)和执行(execute)- 所有者(owner):读(read)、写(write)和执行(execute)- 组(group):读(read)和执行(execute)

2024-11-01 19:45:01 408

原创 【3171. 找到按位或最接近 K 的子数组】

即 0 | 0= 0 , 1 | 0= 1 , 0 | 1= 1 , 1 | 1= 1。即 0 ^ 0=0 , 0 ^ 1= 1 , 1 ^ 0= 1 , 1 ^ 1= 0。运算规则:只有两个数的二进制同时为1,结果才为1,否则为0。运算规则:参加运算的两个数,如果两个相应位为“异”(值不同),则该位结果为1,否则为0。即 0 & 0= 0 ,0 & 1= 0,1 & 0= 0, 1 & 1= 1。运算规则:参加运算的两个数只要两个数中的一个为1,结果就为1。

2024-10-09 17:54:32 254 1

原创 入门篇-3 数据结构在编程语言中的应用

数据结构是编程语言中用于存储、组织和管理数据的方式,它们对于提高程序的效率和性能至关重要。它们在内存中不一定连续,支持动态的数据插入和删除,适用于需要频繁更新数据的程序,如实现堆栈和队列。它们在内存中连续存储,使得数据访问速度快,常用于需要快速索引的场景,如处理大量数据的科学计算和图像处理。:堆是一种特殊的树形数据结构,通常用于实现优先队列,支持快速的数据插入和删除操作。在实际编程中,深入理解各种数据结构的原理和特性,以及它们在不同编程语言中的实现方式,对于设计高效、可扩展的程序至关重要。

2024-10-09 17:20:52 487 1

原创 入门篇-2 为什么需要学习数据结构

选择合适的数据结构可以减少算法的时间复杂度,比如使用哈希表(Hash Table)可以快速检索数据,其平均时间复杂度为O(1),而使用列表(List)进行检索的时间复杂度为O(n)。无论你是初学者还是经验丰富的开发者,不断学习和实践数据结构,都将使你在编程艺术的道路上走得更远。例如,使用位图(Bit Map)可以高效地表示大量布尔值数据,只需少量的内存空间。良好的数据结构可以提高代码的逻辑清晰度,使得代码更易于阅读和维护。许多算法,如排序、搜索、图算法等,都需要依赖特定的数据结构来实现。

2024-10-09 16:27:11 511

原创 入门篇-4 数据结构在人工智能领域的应用

在处理图数据或进行图分析时,如图神经网络(GNNs)和网络分析,特定的图数据结构被用来表示节点和边,以及它们之间的关系。:在数据输入到模型之前,通常需要进行预处理,如归一化、标准化等,这些步骤涉及到数组和矩阵的操作,以及可能的链表和栈的使用。:数据库和数据仓库在机器学习中用于存储和管理数据,它们使用结构化的数据结构,如关系表和索引,以便于快速检索和分析。:在深度学习中,神经网络的构建依赖于复杂的数据结构,如张量和矩阵,这些结构用于存储和变换网络中的权重和激活值。

2024-10-09 16:03:42 532

原创 入门篇-1 数据结构简介

数据结构是计算机中存储、组织数据的方式。一个好的数据结构可以提高程序的性能,减少存储空间的使用,使得数据的操作更加直观和高效。

2024-10-09 16:00:06 506

原创 Kettle小tips

待续...

2024-09-18 15:56:00 164

原创 DM数据库TEXT字段查询报数据类型不匹配

kettle增量插入数据,作为变量id>?时报错,数据类型不匹配。字段用函数substr()后,解决报错。查看表id数据类型是text。

2024-08-09 16:44:34 548

原创 达梦数据库查主键

【代码】达梦数据库查主键。

2024-03-27 09:24:48 1079 2

原创 Flink依赖配置

在Maven项目的pom.xml中添加。

2024-03-12 13:25:25 491

原创 Flink示例

假设有以下两个订单流数据,数据字段分别为用户ID、购买的商品名称、商品数量。目标:合并两个流的数据,并筛选出商品数量大于2的订单数据。11> Order(2,笔记本,3)10> Order(2,手表,3)12> Order(1,尺子,3)1> Order(1,铅笔,4)2L,"笔记本",3。4L,"计算器",1。

2024-03-11 13:50:11 455

原创 python并发编程之多进程、多线程、异步和协程详解

总结起来,多进程适用于CPU密集型任务,多线程适用于IO密集型任务,异步和协程适用于IO密集型任务且需要高性能。在执行一个IO操作时,可以立即切换到执行其他任务,而不需要等待IO操作的完成。模块提供了多进程编程的功能,可以方便地创建和管理多个进程。多进程适用于CPU密集型任务,可以充分利用多核CPU的优势。在Python中,有多种并发编程的方式可供选择,包括多进程、多线程、异步和协程。模块提供了异步编程的功能,可以通过协程来实现异步操作。异步编程适用于IO密集型任务,可以提高程序的吞吐量。

2024-03-06 18:12:22 1209

原创 GoLevelDB构建数据字典

以上代码示例了如何使用 GoLevelDB 来插入数据、获取数据以及遍历数据字典。你可以根据需要,添加更多的数据插入操作和遍历操作,以生成你想要的数据字典。GoLevelDB 是一个开源的键值存储数据库,可以用于构建数据字典,下面是一些示例代码,展示了如何使用 GoLevelDB 来生成数据字典。首先,你需要在 Go 中导入 GoLevelDB 包,并创建一个数据库实例。函数来创建或打开一个数据库文件。

2024-02-27 10:08:50 520

原创 商业化运营关键指标

Average Revenue Per User

2024-02-14 16:08:39 1298

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除