![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据科学家的工具
elden_nie
这个作者很懒,什么都没留下…
展开
-
01-02 数据科学家如何获取帮助
1、问问题 (1)上课问老师问题 (2)在mooc上上传问题到信息版 2、通常最快速获取到答案的途径是你自己找到答案 (1)首先自己回答自己的问题这很重要 (2)如果你的问题可以在帮助文档或者google hit上搜索到,那你应该首先读文档或者直接google. (3)如果你在论坛上看到了你解决过的问题,你应该上传你的答案。 3、一些重要的帮助你的r语言的命令 (1原创 2015-05-02 21:22:58 · 357 阅读 · 0 评论 -
01_01 工具概览
1、数据科学家干什么? (1)定义问题。(2)定义理想的数据集。(3)决定目标数据。(4)获取数据。(5)清洗数据。(6)数据分析。(7)分析预测/模型化。(8)解释结果。(9)验证结果。 (10)综合陈述结果。(11)编写可重复使用的代码。(12)公布结果给众人。 2、数据科学家的编程公具和编程环境 主要是r语言以及对应的r-studio。 3、分享你的成果 利用gi原创 2015-05-02 21:08:16 · 281 阅读 · 0 评论 -
01 _04 R语言概览
1、R语言的内容 数据类型、子集、读取和存储数据、控制结构、函数、作用域、向量化操作、日期和时间、调试、模拟、优化 2、从文本整行读取数据 readLines可以用来整行整行地读取网页的整页数据 con x 3、寻找错误 如何知道你自己的函数出错了? (1)你的输入是什么?你如何调用你的函数? (2)你认为函数调用完后的是什么?输出、信息、或者其他答案原创 2015-05-03 16:56:02 · 365 阅读 · 0 评论 -
01_06 探索性数据分析概览
1、探索性数据分析内容 (1)图形分析的规则 (2)探索性图形 (3)R中的绘图系统:base,lattice,ggplot2 (4)系统聚类 (5)K-means聚类 (6)降维 2、加一个geom qplot(displ,hwy,data=mpg,geom=c("point","smooth")) 3、图形分析的规则 规则1:对比 规则2:分析因果关系、原创 2015-05-03 17:22:46 · 467 阅读 · 0 评论 -
01_03 获取答案
1、数据科学关键特点之一 数据科学是集数据分析、黑客技术、实际知识的交集。 2、黑客的主要特点 (1)愿意自己去找到答案 (2)知道自己该去哪儿找到答案 (3)不会被新的数据类型或者包吓到 (4)不害怕说自己不知道 (5)礼貌而冷酷 3、不同问题的答案的对应地点 (1)R语言 论坛上搜索、读帮助文档、网上搜索、询问技术好的朋友、将问题提交到stack overf原创 2015-05-03 16:54:36 · 345 阅读 · 0 评论 -
01_05 数据获取和清理概览
1、数据获取和清理的内容 (1)脏数据和干净数据 (2)下载文档 (3)读取数据(excel,xml,json,mysql,hdf5,web....) (4)合并数据 (5)重新构造数据 (6)汇总数据 (7)寻找和替换 (8)数据源 2、数据库连接和列举 ucsDb result result 3、合并数据——merge() mergeData2原创 2015-05-03 17:11:34 · 349 阅读 · 0 评论