自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 NLP任务总结

作者:chen_h微信号 & QQ:862251340微信公众号:coderpai一:词法分析分词 (Word Segmentation/Tokenization, ws): 在对文本进行处理的时候,会对文本进行一个分词的处理,下面是一个常用的词库。新词发现 (New Words Identification, nwi):这个好理解,因为网络上总是有新的词汇出现,比如以前的’...

2020-03-23 16:25:22 503

原创 Flink学习(三):数据转换

作者:chen_h微信号 & QQ:862251340微信公众号:coderpaiFlink学习(一):流处理介绍Flink学习(二):实验一数据清洗Flink学习(三):数据转换无状态转换map()在第一个实验中,我们过滤了出租车事件流。 在同一代码库中,有一个GeoUtils类,提供了一个静态方法GeoUtils.mapToGridCell(float lon,fl...

2020-03-18 21:43:57 929 1

原创 Flink学习(二):实验一数据清洗

作者:chen_h微信号 & QQ:862251340微信公众号:coderpaiFlink学习(一):流处理介绍Flink学习(二):实验一数据清洗数据准备首先我们需要下载实验需要的数据,下载地址如下:wget http://training.ververica.com/trainingData/nycTaxiRides.gzwget http://training....

2020-03-16 14:40:39 2881

原创 Flink学习(一):流处理介绍

作者:chen_h微信号 & QQ:862251340微信公众号:coderpaiFlink学习(一):流处理介绍使用 Apache Flink 进行流处理在这个系列学习中,我们将重点关注四个关键概念:流数据的连续处理,事件时间,有状态流处理和状态快照。 在本节中,我们介绍这些概念。流处理流是数据的自然表达形式。 无论是来自 Web 服务器的事件,来自证券交易所的交易还是...

2020-03-14 16:22:40 951

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除