数据分析算法:
从算法的角度来说:序列的机器学习模型应该都适合,像马尔可夫链,最大熵,CRF等等
最小二乘法就可以做回归预测。复杂些的有时间序列分析相关的知识,也是数据挖掘的一个重要分支。
灰色模型 或者 主成份分析+相关性分析LR,ARIMA,GM(1,1),人工神经网络(如BPNN,ESN),SVR,SRN,LSTM,CW-RNN,深度学习等。
价格预测算法:
就是首先找到跟价格有关系的变量
然后按照之前的数据做主成分分析之类的
可以把相关性高的数据选出来,剔除一部分数据,一般5个左右就可以了,按照之前的数据做回归
回归其实有很多算法,时间序列,还有简单的回归,还有其它的,这个时候就是看需求和数据量了
一般还会留过去几年的数据做模型验证
数学分析的方法得到模型,因为参数都是通过公式出来的
数据:
国家统计局有统计年鉴,人大经济论坛数据也很多
有一些数据记录下
国内数据:链接:http://pan.baidu.com/s/1i5nyjBn 密码:26bm
好玩的数据集:链接:http://pan.baidu.com/s/1bSDIEi 密码:25zr
微软数据:链接:http://pan.baidu.com/s/1bpmo6uV 密码:286q
微博数据集:链接:http://pan.baidu.com/s/1jHCOwCI 密码:x58f
-遥感影像库:链接:http://pan.baidu.com/s/1dF63kDr 密码:7tnh
-1990-2016年股票数据:链接:http://pan.baidu.com/s/1i44IQ3N 密码:o9hj
各大企业电话邮箱创立时间:链接:http://pan.baidu.com/s/1i5PXPCp 密码:m4mo
98-09年经济普查:链接:http://pan.baidu.com/s/1o8wbzsu 密码:a093
各国各产业资产数据:链接:http://pan.baidu.com/s/1jI19qmi 密码:on7y
1953-2013统计年鉴:链接:http://pan.baidu.com/s/1mh5sHuC 密码:7ije
-2015全国人口普查:链接:http://pan.baidu.com/s/1i5mIj6t 密码:yad1
facebook大数据:链接:http://pan.baidu.com/s/1jHRb3Wq 密码:aezb
taiwind数据:链接:http://pan.baidu.com/s/1kV8YKXh 密码:984g
全球社交媒体:链接:http://pan.baidu.com/s/1qXXAQvU 密码:c8qc
京东2015自营:链接:http://pan.baidu.com/s/1i56uYFz 密码:oj4v
维基百科数据:链接:http://pan.baidu.com/s/1c2gMLUw 密码:4f3b
kaggle竞赛数据:链接:http://pan.baidu.com/s/1pLDAx6N 密码:i10y
生物数据:链接:http://pan.baidu.com/s/1pLLHQwr 密码:zfjs
- nasa数据:链接:http://pan.baidu.com/s/1i50pw49 密码:aawf
基因组数据:链接:http://pan.baidu.com/s/1pLTPwtP 密码:vgs8
新闻数据:链接:http://pan.baidu.com/s/1hsHSyzE 密码:pey9
- ImageNet数据:链接:http://pan.baidu.com/s/1dFBnsid 密码:s6jr
百肚数据:链接:http://pan.baidu.com/s/1hsr4ayg 密码:k76p
图像数据:链接:http://pan.baidu.com/s/1jHW1kAa 密码:qztt
google数据:链接:http://pan.baidu.com/s/1bpsugGn 密码:8bt4
分类练习数据:链接:http://pan.baidu.com/s/1pLuD3wJ 密码:4pxf
各大联赛世界杯数据:链接:http://pan.baidu.com/s/1jIO9TR4 密码:1v1q
自动驾驶数据:链接:http://pan.baidu.com/s/1miFcv5e 密码:y7uj