自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 数据科学家修炼之道

随着大数据时代的带来,数据科学家是一个非常热门的职业,然而要在任何方向做好,都需要花费太多的时间和精力。数据科学家是兼备数据工程师和统计分析师双重身份和技能的顶级数据工作者,在数据科学家成长的道路上,应该需要磨练那些技能呢?    一、理论部分:统计学+机器学习(决定你未来能走多远)    1、统计学天生就是和数据打交道的学科,专注于数据分析理论的研究,掌握好统计学的核心理论对数据科学家的

2016-11-04 19:35:24 1555

原创 像数据科学家一样思考

借助《数据统治世界》一书的开篇题目,我将我的博客命名为“像数据科学家一样思考”,希望和更多与我在数据科学方面志同道合的朋友一起交流。这篇文章是整个博客的概括,当然,我对博客意义的理解在于,博客更多的是记录,其次是分享。在我的价值观中,我始终坚持以下观点:数据科学家=统计机器学习+计算机+业务。我也将自己的博客按照上述等式的右边三个分为三类,其中统计学机器学习为理论部分,计算机为编程部分,业务这里主

2016-11-04 19:04:08 329

原创 让生命孤独的怒放——《晚安 北京》读后感

经朋友的推荐,“汪峰是当今音乐界非常有思想的一位音乐创作者”,怀着好奇,我毅然决然的买下了这本《晚安 北京》汪峰的代表作品,读完以后给我这二十多岁的年轻人一种独特而不同的启发。    从书籍的前半部分开始,汪峰自述自己音乐创作及生活的心路历程,给人以沿着向上飞的感觉。在当今的时代中,当音乐无法完全表达自己的思想时,文字自然起到了很多思想表达补充的作用,而透过不同行业的人的不同的文字创作,不仅可

2016-11-04 20:01:49 671

原创 读《白说》有感

“我没开微博,没用微信,只能确定这本书里的话是我说的。”——白岩松    和柴静的《看见》相比,白岩松的这本《白说》更偏重议论,更注重理性,却都是从一个新闻人的角度根据自己的经历谈论当今社会的各种现实问题。尽管新闻行业非常看重出身,也非常的辛苦,但之所有仍然有人坚持做新闻,最重要的是他们坚持“新闻能让世界变得更好,新闻的利大于弊”这样的信仰,选择发声而不是沉默。思考可能无用,话语也许无知,就当

2016-11-04 20:00:00 1093 1

原创 将轻松的留给生活,沉重的留给写作——读《灯下尘》(七堇年)

“人难免渴望美好的事物永存不移,但这种渴望显然是不可求、不可能的。也许恰恰是这种不可求、不可能,促使人不断追寻、又注定不断失落;所幸,这个过程能较好地填补活着的空无,并带来记忆的生动。而作为一个写作者,天性中的敏感使其对活着的感受更加细致、切肤,能够将那些快活与失落都溶解于文字。当文字成为某种呐喊,由此,我才能沉默地生活。”——七堇年    在继《被窝是青春的坟墓》之后,再读七堇年的另外一本书

2016-11-04 19:58:19 1081

原创 自由与社会

很多人说在欧洲旅游后,在不同国家看到各种奇形怪状的人,有趣的商店,各处的好风景,感觉像是溺水将毙的人越出水面之后喘的第一口气。    说中国的社会是一片充满了价值判断的现实深渊其实真的不夸张,太多太多的声音告诉你在该干什么,不该做什么,什么是对的,什么不对,人们的价值整齐划一:考好的学校,找好的工作,找好的对象,买好的房子,坐好的车,生好的娃,让娃考好的学校,找好的工作,娶好的老婆,买好的房子

2016-11-04 19:56:11 332

原创 读《麦田里的守望者》(塞林格)

小说和电影都可以帮助我们看到自己生活的另外一面,从而给我们的生活一定的启发;而小说和电影的区别在于,前者可以通过更强的故事背景描述给你很强的代入感,从而在过程中以及结尾能给你更深刻地启发;后者更多是通过视觉的冲击给你短暂的启发和想法,很少有电影能在短暂的2个小时给你带来整个人生记忆的思考与启发,但小说往往能,当然它也需要前期更长的时间去咀嚼。    《麦田里的守望者》是我的青春期最喜欢的一本小

2016-11-04 19:54:38 861

原创 《美丽新世界》读后感

《我们》、《一九八四》和《美丽新世界》并成为反乌托邦三部曲。《我们》饱满,《一九八四》激越,但《美丽新世界》或许更深刻,更接近可能的未来。作者预言了这样一个世界:从二战的动荡与秩序混乱过渡到秩序井然有序,甚至社会等级在出生时就已经决定的“美丽新世界”,在这个世界中性代替了爱情,社会极度稳定和幸福,甚至不良的情绪都可以通过"嗦吗"来消除。但是这样的“美丽新世界”确实恐怖的,人们没有了遭遇不幸的权利,

2016-11-04 19:53:25 1749

原创 互联网经济的未来

最近这几年互联网发展得非常迅速,但是事物的发展不可能都是一直向上。在最近的一些经济论坛上,很多互联网大佬发表了惊人之语。马云说“未来三年我们也许就不在了。”刘强东说“风口至少5年,但不是在互联网而是在传统企业。”很多数据也支撑这个观点,中国网民的增速下降到6%,互联网普及率到了50.3%,而美国也不过51%,互联网很难有更迅速的发展。BAT的营业收入从2012年起持续下滑。比尔盖茨已经不是世界首富

2016-11-04 19:52:09 537

原创 把脉中国房地产江湖

随着房贷首付比例下调,公积金利率上调,房产交易契税、营业税减免政策的出台,2015年中国房地产市场的去库存取得了较好的效果,尤其在二三线城市,房地产呈现出明显的回暖趋势。但是我们发现,从2015年到2016年,一线城市的房价呈现了过快上涨的趋势,二三线城市交易价格波动不大,处于健康和合理的状态。 可以得到如下三条结论:     1、一线城市一直是房地产市场的风向标,其非理性的状态显然不利于培育

2016-11-04 19:50:37 506

原创 论统计学与机器学习的关系与发展前景

如果说这个时代有两头“风口上的猪”,在我的视野中我觉得是统计学和机器学习这两大学科。本人本科统计学专业,主要研究统计学和机器学习两个方向,通过本科的几年积累,对这两门学科有着自己认为还算正确的理解,希望能和大家分享讨论。    统计学作为研究不确定性问题的一门理论学科,与数学有着千丝万缕的联系,也逐渐从数学中独立出来,与数学研究的确定性问题相对立。在非常强的数学理论基础上——概率论、数理统计、

2016-11-04 19:48:54 3848

转载 【R】提升R代码运算效率的11个实用方法

​众所周知,当我们利用R语言处理大型数据集时,for循环语句的运算效率非常低。有许多种方法可以提升你的代码运算效率,但或许你更想了解运算效率能得到多大的提升。本文将介绍几种适用于大数据领域的方法,包括简单的逻辑调整设计、并行处理和Rcpp的运用,利用这些方法你可以轻松地处理1亿行以上的数据集。 让我们尝试提升往数据框中添加一个新变量过程(该过程中包含循环和判断语句)的运算效率。下面的代码输出原始数

2016-11-04 19:45:31 447

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除