论文笔记--GloVe: Global Vectors for Word Representation

1. 文章简介

  • 标题:GloVe: Global Vectors for Word Representation
  • 作者:Jeffrey Pennington, Richard Socher, Christopher D. Manning
  • 日期:2014
  • 期刊:EMNLP

2. 文章概括

  文章提出了一种新的单词表示的训练方法:Glove。该方法结合了基于统计方法和基于上下文窗口方法的优势,在多个下游任务上超越了当下SOTA方法的表现。

3 文章重点技术

3.1 两种常用的单词向量训练方法

  现有的两类常用的单词向量训练方法为

  • 基于矩阵分解的方法,如LSA会首先计算一个term-document矩阵,每一列表示每个文档中各个单词的出现频率,然后进行奇异值分解;HAL则会首先计算一个term-term共现矩阵。但此类方法会被频繁出现的the, and等单词影响,计算相似度的时候该类对语义影响很小的单词会占较大的比重。
  • 基于上下文窗口的方法,如Word2Vec[1]。此类方法没有用到语料中的统计信息,可能无法捕捉到数据中的重复现象。

3.2 GloVe

  为了解决上述两种方法存在的问题,文章提出了一种Global Vectors(GloVe)单词嵌入方法,可以直接捕获语料中的统计信息。
  首先,我们计算单词共现矩阵 X X X,其中 X i j X_ij Xij表示单词 j j j出现在单词 i i i的上下文的次数。令 X i = ∑ k X i k X_i = \sum_k X_{ik} Xi=kXik表示任意单词出现在单词 i i i上下文的总次数,则 P i j = X i j X i P_{ij} = \frac {X_ij}{X_i} Pij=XiXij表示单词 j j j出现在单词 i i i的上下文的概率。
  为了得到每个单词的嵌入 w i w_i wi,文章首先需要假设一种嵌入 w i , w j w_i, w_j wi,wj和共现矩阵之间的关系式。为此,文章给出一个示例:如下表所示,假设考虑单词i=“ice”,j=“steam”,则k="solid"时,由于"solid"和"ice"相关性更高,所以 P i k / P j k P_{ik}/P_{jk} Pik/Pjk应该大一点,下表中实验结果为8.9;如果k=“gas”,和"steam"的相关性更高,从而 P i k / P j k P_{ik}/P_{jk} Pik/Pjk应该小一点,下表中实验结果为 8.5 × 1 0 − 2 8.5 \times 10^{-2} 8.5×102;如果k="water"和二者均相关或k="fashion"和二者均不相关,则 P i k / P j k P_{ik}/P_{jk} Pik/Pjk应该接近1,如下表中的 1.36 1.36 1.36 0.96 0.96 0.96
cooccur
  为此,文章选择通过单词

<think>好的,我现在需要回答用户关于Flowable工作流引擎与达梦数据库兼容性配置的问题。首先,用户提到了几个引用内容,我需要仔细查看这些引用,看看里面有没有相关的配置步骤或注意事项。 根据引用[1],里面提到了引入达梦数据库驱动包、配置数据源以及修改Flowable代码支持达梦数据库的具体步骤,比如修改ProcessEngineConfigurationImpl和DbSqlSessionFactory类。这部分应该是配置的核心内容,需要详细说明。 引用[3]则提到在结合SpringBatch时可能遇到的兼容性挑战,包括驱动检查、SQL调整、数据类型映射等。虽然用户主要问的是配置教程,但这些问题也可能在配置过程中出现,所以可以作为注意事项或优化建议加入回答中。 接下来,我需要按照用户的要求,结构清晰地分步骤讲解配置流程。首先可能需要说明如何引入达梦的JDBC驱动,比如在Maven项目中添加依赖,或者手动导入jar包。然后配置数据源,可能是在Spring Boot的application.yml里设置url、用户名、密码等信息,并指定数据库类型为达梦。 接下来是修改Flowable的代码部分。引用[1]提到需要修改ProcessEngineConfigurationImpl类,设置数据库类型和模式策略,可能还需要调整SQL会话工厂类,比如DbSqlSessionFactory,来支持达梦的特定语法。这部分可能需要用户手动覆盖默认配置,或者通过扩展类来实现。 另外,引用[3]中提到的SQL语句调整和数据类型映射也是需要注意的地方。达梦数据库可能有些SQL语法与Flowable默认的H2或MySQL不同,需要检查并修改Flowable生成的SQL,确保兼容。比如分页查询的语法,或者某些函数的替换。 事务管理和序列生成策略可能也需要调整,达梦可能使用不同的机制来生成主键,需要配置Flowable使用达梦的序列方式。此外,表结构和索引优化可能涉及到性能调整,比如根据达梦的建议调整索引类型或字段长度。 错误处理和日志记录也是配置后的重要步骤,确保在出现问题时能够及时定位,比如启用详细日志记录达梦的SQL执行情况。 最后,建议用户参考官方文档和社区资源,进行充分的测试,包括单元测试和集成测试,确保配置的正确性。引用[4]提到Liquibase支持人大金仓,可能类似的步骤可以借鉴,但达梦需要特定的处理。 在生成相关问题时,需要围绕配置步骤、常见问题、优化方法、与其他组件的集成以及国产化替代方案等方面展开。这样可以帮助用户更全面地了解整个兼容性配置的过程和可能遇到的问题。</think>### Flowable工作流引擎与达梦数据库兼容性配置教程 #### 一、兼容性基础 Flowable原生支持主流数据库(如MySQL、Oracle等),但通过调整配置和代码适配,可实现对达梦数据库的兼容[^3]。需重点关注驱动兼容性、SQL语法适配和数据类型映射。 #### 二、配置步骤 1. **驱动包引入** - Maven项目添加达梦驱动依赖(版本需与数据库匹配): ```xml <dependency> <groupId>dm.jdbc</groupId> <artifactId>dm-driver</artifactId> <version>8.1.1.193</version> </dependency> ``` - 非Maven项目需手动下载`DmJdbcDriver18.jar`并加入类路径[^1]。 2. **数据源配置** 在`application.yml`中配置达梦连接参数: ```yaml spring: datasource: url: jdbc:dm://localhost:5236/flowable_db username: admin password: dameng123 driver-class-name: dm.jdbc.driver.DmDriver ``` 3. **引擎配置修改** - 修改`ProcessEngineConfigurationImpl`类,指定数据库类型: ```java configuration.setDatabaseType("dm"); configuration.setDatabaseSchemaUpdate("true"); // 自动创建表 ``` - 覆盖`DbSqlSessionFactory`的SQL生成逻辑,适配达梦分页语法(如`LIMIT`改为`TOP`)[^1][^3]。 4. **SQL语法调整** - 修改Flowable的默认SQL模板文件(位于`org/flowable/db`),替换不兼容的函数(如`SYSDATE()`改为`SYSDATE`)。 #### 三、关键问题处理 1. **数据类型映射** | Flowable类型 | 达梦类型 | 处理方式 | |-------------|-------------|-------------------------| | VARCHAR(255)| VARCHAR(50) | 扩展字段长度或修改建表脚本 | | BLOB | CLOB | 调整字段类型并验证二进制数据存储 | 2. **事务管理** 在Spring配置中显式指定事务管理器: ```java @Bean public PlatformTransactionManager transactionManager(DataSource dataSource) { return new DataSourceTransactionManager(dataSource); } ``` 3. **序列生成策略** 修改流程实例ID生成方式,使用达梦序列: ```sql CREATE SEQUENCE FLW_SEQUENCE START WITH 1 INCREMENT BY 1; ``` #### 四、验证与测试 1. 执行`mvn test`运行单元测试,检查流程部署、任务处理等核心功能。 2. 使用`SELECT * FROM V$DM_INI`监控数据库性能。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值