- 博客(4)
- 收藏
- 关注
原创 NLP任务总结
作者:chen_h微信号 & QQ:862251340微信公众号:coderpai一:词法分析分词 (Word Segmentation/Tokenization, ws): 在对文本进行处理的时候,会对文本进行一个分词的处理,下面是一个常用的词库。新词发现 (New Words Identification, nwi):这个好理解,因为网络上总是有新的词汇出现,比如以前的’...
2020-03-23 16:25:22 503
原创 Flink学习(三):数据转换
作者:chen_h微信号 & QQ:862251340微信公众号:coderpaiFlink学习(一):流处理介绍Flink学习(二):实验一数据清洗Flink学习(三):数据转换无状态转换map()在第一个实验中,我们过滤了出租车事件流。 在同一代码库中,有一个GeoUtils类,提供了一个静态方法GeoUtils.mapToGridCell(float lon,fl...
2020-03-18 21:43:57 929 1
原创 Flink学习(二):实验一数据清洗
作者:chen_h微信号 & QQ:862251340微信公众号:coderpaiFlink学习(一):流处理介绍Flink学习(二):实验一数据清洗数据准备首先我们需要下载实验需要的数据,下载地址如下:wget http://training.ververica.com/trainingData/nycTaxiRides.gzwget http://training....
2020-03-16 14:40:39 2881
原创 Flink学习(一):流处理介绍
作者:chen_h微信号 & QQ:862251340微信公众号:coderpaiFlink学习(一):流处理介绍使用 Apache Flink 进行流处理在这个系列学习中,我们将重点关注四个关键概念:流数据的连续处理,事件时间,有状态流处理和状态快照。 在本节中,我们介绍这些概念。流处理流是数据的自然表达形式。 无论是来自 Web 服务器的事件,来自证券交易所的交易还是...
2020-03-14 16:22:40 951
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人