大数据
文章平均质量分 76
望隐少年
这个作者很懒,什么都没留下…
展开
-
大数据系列博客准备开更:心有猛虎,何惧骄阳
本人目前从事和大数据无关的行业,但是准备年后跳槽到大数据研发。这个难度跨度应该说不小,但是我已经决心拿出最大的毅力去学。不过还有半年时间,我将着重提升对大数据的理解,力求把理解深化,把基础打牢固。 写博客是一种比较好的方式,可以解决我以前学完不知道学了什么的毛病。想给别人讲清楚,你就得用最简单的话让自己明白,同时内容压缩的越简短,也越容易被记住。 接下来的博客,我都尝试...原创 2018-09-23 15:27:04 · 246 阅读 · 0 评论 -
大数据(一)数据采集 2
每日牢骚: 写之前,先说两句题外话。第一是9月23日就想更新博客的,但是一直拖到现在,确实这两天有不可抗力。第二就是今天有个刺激,一个很不起眼的同事只学了三个月的机器学习就拿到了新浪的Offier,年薪25W,这让我坐不住了。也开始反思自己的学习方法,之前看视频的速度实在太慢了,不重要的内容也学了好久,可是光看不真去做项目熟悉,看再久视频还是学不会。 所以调整下学习方法:...原创 2018-09-26 23:10:22 · 2351 阅读 · 0 评论 -
大数据(一)数据采集 3
数据采集3:关于pandas的函数都在官方API有写,哪个参数不会用首先应该去查这个http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.interpolate.html -------------------------------------------------------------0---...原创 2018-09-27 03:33:03 · 18336 阅读 · 0 评论 -
大数据(一) 数据采集4(由于数据无法下载暂时未更新)
每日牢骚:既然数据一晚上都没搞下来,如果坚持下去既浪费时间,又破坏继续学的心情,得不偿失。直接把视频的意思先看懂,然后先直接学下面的课了,别为了那一点一点知识把整个大数据的学习进度都破坏了。 ————————————————————————————————————————数据采集最后一部分内容是一个练习题。 这个csv数据它有16个字段的,里面有些字段可能没有值,我们的...原创 2018-09-27 22:49:05 · 567 阅读 · 0 评论 -
pandas.DataFrame()的参数解释
pandas.DataFramepandas中的DataFrame可以使用以下构造函数创建 -pandas.DataFrame( data, index, columns, dtype, copy) data表示要传入的数据 ,包括 ndarray,series,map,lists,dict,constant和另一个DataFrameindex和columns 行索引和列索引...原创 2018-09-28 00:35:51 · 39376 阅读 · 2 评论 -
大数据(二)数据扒取 1
每日一骚:第一想问题要有目的性,紧紧盯着目标,如果没目标先想清楚目标,记不住就写下来。第二把简单的东西,说清楚作用和用法。第三把复杂的东西,原理说清楚 用法记清楚。概括地说清给别人,具体的步骤你自己记住就好。 通过玩剧本杀的游戏,我发现自己缺乏概括能力。总是喜欢复制别人的话,接下来我都用我自己的话。简单来说,概括就是把修辞去掉 把不是核心的东西去掉,让别人听个最主要的大概就...原创 2018-09-29 18:28:49 · 1003 阅读 · 0 评论