增强功能和新功能
- 支持Flink 1.10和Flink 1.9。
- 对UDF / UDTF功能的改进,Java和PyAlink具有一致的用法和行为。
- 发布到Maven Central和PyPI。
- 支持多版本的Kafka数据源连接器。
API变更
- 当前朴素贝叶斯组件实质为朴素贝叶斯应用在文本方面,调整其名称为朴素贝叶斯文本分类器组件,后续会发布面向一般场景的常用朴素贝叶斯算法组件。
- 修改并增强QuantileDiscretizer,OneHotEncoder和Bucketizer组件的参数及模型。
文档更新
- 更新文档和代码中的数据链接。
- 更新PyAlink安装说明。
修复和完善
- 解决LDA在线方法中的问题,并在FeatureLabelUtil中完善注释。
- 修复未清除KMeansAssignCluster初始数据的错误。
- 修复了读取大型csv文件和dd CsvFileInputSplit测试用例时的int溢出错误。
- 清理一些代码。
- 删除数据源不可访问的冗余测试用例。
- 修复PCA中的NEP。
PyPI支持
- 支持使用PyAlink安装
pip install pyalink
Maven依赖
Alink已同步到Maven Central,您可以轻松地将其添加到Maven项目。
对于Flink-1.10
<dependency>
<groupId>com.alibaba.alink</groupId>
<artifactId>alink_core_flink-1.10_2.11</artifactId>
<version>1.1.0</version>
</dependency>
<dependency>
<groupId>org.apache.flink</groupId>
<artifactId>flink-streaming-scala_2.11</artifactId>
<version>1.10.0</version>
</dependency>
<dependency>
<groupId>org.apache.flink</groupId>
<artifactId>flink-table-planner_2.11</artifactId>
<version>1.10.0</version>
</dependency>
对于Flink-1.9
<dependency>
<groupId>com.alibaba.alink</groupId>
<artifactId>alink_core_flink-1.9_2.11</artifactId>
<version>1.1.0</version>
</dependency>
<dependency>
<groupId>org.apache.flink</groupId>
<artifactId>flink-streaming-scala_2.11</artifactId>
<version>1.9.0</version>
</dependency>
<dependency>
<groupId>org.apache.flink</groupId>
<artifactId>flink-table-planner_2.11</artifactId>
<version>1.9.0</version>
</dependency>