SAS DM数据准备读书笔记1(分解字符串)

本文是关于SAS数据挖掘中数据准备阶段的读书笔记,重点关注如何分解字符串以提取单词。通过实例介绍了使用do while和scan函数的方法,并讨论了在商业项目中代码考虑全面性的重要性,如处理空字符串的情况。选择%do %while而非%do %to,是因为在不确定字符串内单词数量的情况下,需要条件终止循环。
摘要由CSDN通过智能技术生成

数据准备与分析的关系犹如大厨的刀工和厨艺的关系,任何一个大厨都有精湛的刀工。听说日本有个寿司店,在店里要做几十年的小工(练习刀工),才能让其动手做主菜。

 

前三章主要介绍一些基础概念的知识,代码介绍主要从第四章开始。

 

4.5分解字符串代码

 

【目的】将字符串里面的单词独立出来;

【主要方法】主要使用了do while 和scan函数

【代码解说】专业人员写代码会将很考虑很多可能条件,比如本段代码就考虑到如果输入一个空的字符串,要反馈什么。这些工作在自己一小短代码分析时没有感觉,但用于商业项目,减少人机交互工作就起了很大作用。考虑下为什么不用%do%to 而用 %do %while?是因为,我们不知道字符串有多少个单词,必须使用条件结束的方法。

初始值设置condition=0, 如果通过scan取出的单词为空,则将condition设置为1,结束循环。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值