个人感觉最主要是通过visualization来获取一些信息,
在这之前一般都要先提取出一些有用的feature,比如这里的时间字符串要先提取出“小时”这个信息
有时在丢到model之前需要extract一些feature,也需要drop一些没用的feature
比如24小时变化的曲线
工作日24h变话的曲线(想想也是对的,大部分是在上下班的时间)
</
个人感觉最主要是通过visualization来获取一些信息,
在这之前一般都要先提取出一些有用的feature,比如这里的时间字符串要先提取出“小时”这个信息
有时在丢到model之前需要extract一些feature,也需要drop一些没用的feature
比如24小时变化的曲线
工作日24h变话的曲线(想想也是对的,大部分是在上下班的时间)
</