阿里天池大数据竞赛——口碑商家客流量预测的竞赛已经结束了,作为一个刚参加这种项目竞赛的纯小白来说,走了不少的弯路,在数据处理的过程上花费了大量的时间和功夫,最后得到的效果也不好,不过从这个过程还是学习到了很多。
下面贴一个阿里官方给的一个demo,代码非常清晰简单,没有多余的数据处理和算法处理的过程,仅仅使用了pandas就把预测结果给得到了,而且得分还是较高的,参考意义非常大:
#coding=utf-8
import numpy as np
import pandas as pd
# your path to table user_pay
user_pay = 'user_pay.txt'
# load data
print('loading data...')
user_pay_df = pd.read_table(user_pay, sep=',', header=None, names=['