- 博客(14)
- 收藏
- 关注
转载 交叉验证(Cross-Validation)
转载自:http://blog.sina.com.cn/s/blog_688077cf0100zqpj.html详见:http://blog.sciencenet.cn/home.php?mod=space&uid=830496&do=blog&id=676326交叉验证(Cross-Validation): 有时亦称循环估计, 是一种统计学上将数据样本切割成较小子集的实用方法。于
2016-03-22 19:31:00 10548
转载 神经网络(优化算法)
神经网络(优化算法)人工神经网络(ANN),简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或计算模型。神经网络由大量的人工神经元联结进行计算。大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自适应系统。现代神经网络是一种非线性统计性数据建模工具,常用来对输入和输出间复杂的关系进行建模,或用来探索数据的模式。人工神经网络从以下四个方面去模拟人的智能行为:
2016-03-21 22:07:31 12162
原创 R语言获取历史股票数据
本文转载我自己写的文章,我个人网站DataAnswer:http://www.dataanswer.top(大数据博客和大数据问答的网站)上的文章。主要利用python获取股票数据,利用R来作图分析。
2016-03-20 19:00:53 5163 1
原创 Hbase总结
1、Hbase 是一个分布式的列式数据库:分布式、可扩展、面向列存储、存储松散数据的、向下提供存储,向上提供计算,数据存储与数据计算完美结合的数据库2、体系结构:主从服务器结构说明:一张完整的表可能是不保存在多个HRegion中一台机器一般一个HRegion服务器不涉及数据的直接删除和更新---都是追加,增加一个版本HFile的数量达到
2016-03-19 14:54:43 846 1
原创 R语言入门总结
1、R的简单语法:数据集:观测 变量记录 字段示例 属性 名义变量有序变量连续变量 数据结构:向量--只能同一类型的数据标量---一个数据,常用来存一个常数数组--维度可以大于2数据框---可以包含多种类型的数据,最常用的数据结构矩阵--只能同一类型数据列表---上面的任何一种结构的数据都可以放入列表中。
2016-03-19 11:29:45 1314
原创 数据分析入门
1、数据问题的处理流程: 一般的数据分析都是先从公司的具体业务问题出发,提出解决什么样的具体的业务问题,然而对于一般的业务问题提出来时都是比较抽象的,如“如何提高xx产品的销售量?”。对于抽象的业务问题,我们首先要做的就是把问题分解成具体的小问题,然后针对各个小问题分别取获取相应的数据来做具体分析。这些具体的数据来源一般包括从上级的邮件、公司的各项业务数据、运营数据、基础设施数据等。针对
2016-03-19 10:20:01 622
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人