【KNIME经验】取字符串的末尾若干位字符

KNIME相关视频教程,请移步B站,搜索“星汉长空”,多谢支持!

背景:字符串操作是我们日常工作当中经常要进行的一类信息处理,本例将从字符串的末尾取一位字符,借这个案例给大家分享一下KNIME字符串处理节点的功能,节点丰富,功能繁多,我们从案例中体会,将来可以拓展应用到其他需求当中。

步骤1. 如图所示,在KNIME中加入Table Creator节点,输入任意多个字符串,这里是两行记录“洗发水”和“好的”。

步骤2. 方法一(图中绿色路线),我们使用字符串子串截取函数substr。拖入一个String Manipulation字符串处理节点,打开配置,可以看到这里有相当多的字符串处理函数,点击某一个函数,会在右边给出相应的函数解释,参数介绍,示例,从中可以体会字符串处理函数的功能。

步骤3. 方法一(图中绿色路线),在String Manipulation节点的下方Expression表达式框中输入公式,公式的形式为:substr(要处理的列名[可以通过双击左侧列名列表添加],截取的位置),如果只为substr函数传递两个参数,代表从截取位置开始,截取到字符串的结尾。

步骤4. 方法一(图中绿色路线),为了获取字符串的截取位置,我们需要使用length(列名)函数来获取字符串长度,然后通过减一,得到截取位置,这样就可以截取到字符串的最后一位字符,如图中表格所示,我们分别得到了“水”和“的”。

步骤5. 方法二(图中红色路线),我们的思路是,通过字符串分割节点(Cell Splitter By Position),将字符串分割成两部分,从而获取字符串的最后一位字符。为了从最后开始分割,需要首先倒转字符串,使用String Manipulation节点的reverse函数实现。

步骤6. 方法二(图中红色路线),拖入Cell Splitter By Position节点,打开配置,可以看到除了要选择需要分割的列名,主要有两个编辑框需要输入。上方的Split indices,comma separated主要是输入位置,下方的New column names,comma separated是为分割之后的字符串赋予相应的列名。由于分割位置和分割段数存在:段数=位置数+1的关系,所以上方的编辑框我们输入分割位置为“1”,也就是从倒转的字符串上从前往后,取第一位;下方的编辑框中就需要输入两列的名字“b,a”。同理,如果分割位置有两个,比如“1,3”,那么列名就应该有三个,比如“a,b,c”。

步骤7. 方法二(图中红色路线),通过步骤6的字符串分割,我们就获取了字符串的最后一位字符;但是别忘了,我们的字符都是倒着的,如果想把所有分割段的字符全部恢复,我们需要拖入String Manipulation(Multi Column)节点,对所有的列进行倒转,也就是reverse函数的处理。注意,在该节点的设置当中,我们reverse的是$$CURRENTCOLUMN$$(可以通过左侧列表双击加入),也就是当前列,即对所有列进行操作。

解释1. 何为KNIME?KNIME数据分析平台是一款强大开源的数据挖掘软件平台,可以固化数据处理的流程,在人与人,人与机器之间进行传递。

解释2. substr为什么有两种格式,两参数和三参数?本例介绍的是两参数的字符串子串截取方法,另有一个substr的三参数用法,其格式为:substr(要处理的列名[可以通过双击左侧列名列表添加],起始的位置,截取的字符串长度)。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值