自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 2019年科技发展预测:云、大数据、AI、物联网和区块链,看你学哪样?

2019年科技发展预测:云、大数据、AI、物联网和区块链《福布斯》撰稿人Steve Wilkes近日发文称, 2018年是商用科技快速发展的一年,现代数据管理成为了很多企业的重要目标,云服务的采用率也大幅增加,一些战略并购案例以及人工智能和其他新技术的兴起已经证明了这一点。那么2019年又会有怎样的发展呢?以下是一些预测:云服务企业将更多地使用云服务,企业数据中心将更快地转向云服务...

2019-02-28 13:43:10 4658 2

原创 数据科学如何求职:投了6578份简历,喜提offer的我有6点建议,给备战春招的你

在过去的三年里,我看过无数的招聘广告,也面试了一系列的公司。因为我想知道在我完成硕士学位之后,我在职业方面会有哪些选择。也因此,我将这些我看过的招聘广告,面试过的公司都进行了分析。我现在已经是一家公司的数据科学家了,在过去的六个月里,我面试了很多想要进入我们公司的数据人。下面这些求职准备,是我们建议每个数据科学求职者去做的。01清楚自己的角色定位为了能够在面试过程中,清晰地体现对自...

2019-02-27 14:36:41 249

原创 大数据最核心的关键技术——32个算法,记得收藏!

奥地利符号计算研究所的Christoph Koutschan博士在自己的页面上发布了一篇文章,提到他做了一个调查,参与者大多数是计算机科学家,他请这些科学家投票选出最重要的算法,以下是这次调查的结果,按照英文名称字母顺序排序。   1、A* 搜索算法——图形搜索算法,从给定起点到给定终点计算出路径。其中使用了一种启发式的估算,为每个节点估算通过该节点的最佳路径,并以之为各个地点排定...

2019-02-26 11:03:07 241

原创 数据清洗&预处理入门完整指南

数据清洗&预处理入门完整指南凡事预则立,不预则废,训练机器学习模型也是如此。数据清洗和预处理是模型训练之前的必要过程,否则模型可能就「废」了。本文是一个初学者指南,将带你领略如何在任意的数据集上,针对任意一个机器学习模型,完成数据预处理工作。数据预处理是建立机器学习模型的第一步(也很可能是最重要的一步),对最终结果有决定性的作用:如果你的数据集没有完成数据清洗和预处理,那么你的模型...

2019-02-25 15:53:02 449

原创 学习大数据科学的五大误区

习大数据科学的五大误区,这是由作者在塞巴斯蒂安·福卡德(Dr. Sébastien Foucaud)博士的帮助下一起完成的,他在指导和领导学术界与行业领域的年轻数据科学家方面拥有20多年的经验。学习大数据科学的五大误区:一、Kaggle成才论你通过参加Kaggle比赛,练习了数据科学领域的各项技能。如果你能把决策树和神经网络结合起来那就再好不过了。说实话,作为一个数据科学家,你不需要做...

2019-02-24 22:00:10 182

原创 专业人士处理大数据所需的技能

专业人士处理大数据所需的技能数据分析师的工作包括收集、清理、可视化信息块,并将原始数据转换或建模为营销人员、开发人员、会计师使用。数据分析师的工作流程是由组织的需求定义的,但最终的可交付成果总是相同的:结构良好且易于检索的数据。数据分析师的工作包括收集、清理、可视化信息块,并将原始数据转换或建模为营销人员、开发人员、会计师使用。数据分析师的工作流程是由组织的需求定义的,但最终的可交付成...

2019-02-23 22:16:47 298

原创 大数据就业前景如何? 你看连学术打假都用得上!

“无实而享大名者必有奇祸。”“博士后”翟天临的悲剧印证了曾国藩的名言。读过研、读过博,现在都博士后了,居然不知道知网是什么东西?翟天临真的摊上事了。现在北大、北电都发布声明,建立调查小组了。为什么不识知网会成“翟天临涉嫌学术不端”的爆破口?皆是因为,当今几乎所有的研究生毕业论文都会经过中国知网的“学术不端检测”,哪怕是最后不被盲审。所以,不知道知网并不算学术不端,但你不知道...

2019-02-22 13:06:52 378

原创 数据科学太难?这些陷阱请避开,正能量很重要!

数据科学太难?这些陷阱请避开,正能量很重要!全文共2982字,预计学习时长6分钟很多人可能都会有这样的疑问:网上有这么多可用的资源,为什么保持学习数据科学的积极性这么难呢?无论你怎样学习数据科学,你总会遇到一些会扼杀积极性的挑战,碰上一些让你觉得自己很渺小而无能为力的工作,或者听到恶魔在你耳边低语,“这太难了,放弃吧。”但你不必独自面对这个难题。这篇文章将会提到一些打击学习积极性的...

2019-02-21 10:33:02 247

原创 想从事人工智能和大数据的学生们,这里有几条职业建议给你

全文共2168字,预计阅读时长4分钟人工智能、大数据的热度一直在延续。越来越多的企业把人工智能和大数据运用在自己的产品设计和长期规划中,相关职位的招聘待遇诱人且竞争火热;高校也积极扩展相关专业,培养出越来越多计算机科学出身的可用之才。在这样竞争激烈的环境之中,一些关于未来职业规划的建议肯定会对如今的学生、未来的科技骨干人才们有所帮助。IEEE 计算机学会 Computing Edge ...

2019-02-20 14:06:07 564

原创 【大数据技术】Apache Beam实战指南 | 手把手教你玩转大数据存储HdfsIO

关于 Apache Beam 实战指南系列文章随着大数据 2.0 时代悄然到来,大数据从简单的批处理扩展到了实时处理、流处理、交互式查询和机器学习应用。近年来涌现出诸多大数据应用组件,如 HBase、Hive、Kafka、Spark、Flink 等。开发者经常要用到不同的技术、框架、API、开发语言和 SDK 来应对复杂应用的开发,这大大增加了选择合适工具和框架的难度,开发者想要将所有的大数据...

2019-02-19 16:30:13 807 2

原创 四说大数据时代“神话”:从大数据到深数据

在机器学习领域一直有一个基础性的误解,即更大的数据会产生更好的学习效果。然而,更大的数据并不一定意味着能发现更深刻的信息。实际上,与数据的规模相比,数据的质量、价值和多样性更值得关注,即数据的“深度”重于“广度”。本文从四个角度思考了大数据时代的问题并提出了一些建议的做法以改善这些问题。最近一段时间,对大数据的炒作正在减弱。云计算,Hadoop 及其他类似的工具已经有效地解决了大数据的处理...

2019-02-18 11:46:48 223

原创 【大数据实战】苏宁大数据离线任务开发调度平台实践:设计与开发过程中的要点

1. 绪言在上一篇文章《苏宁大数据离线任务开发调度平台实践—任务调度模块 (上篇)》中,主要介绍了调度模块的架构设计、服务管理、重启恢复服务和 web 服务的设计细节,限于篇幅问题,今天我们接着详细阐述任务调度模块的核心服务—任务调度服务的设计以及开发实践过程中的关键功能点。2. 任务调度服务主要负责上线任务流的配置检查、生成任务流执行计划、按照执行计划生成任务流与任务实例,生成任...

2019-02-17 21:28:43 781

原创 2019年大数据发展将走向何方

2019.02.15 22:13 字数 3377 阅读 0评论 0喜欢 0编辑文章近日,包括CCF(中国计算机学会)大数据专家委员会、IDC公司(InternetDataCenter互联网数据中心)和Gartner公司等多家国内外知名信息技术研究机构均发布报告,对2019年乃至未来若干年的大数据产业发展趋势做出预测,并对大数据令人瞩目的应用领域进行乐观而谨慎的推断。CCF大数据专家...

2019-02-15 22:15:26 364

原创 深度强化学习算法SAC:让机器人完成任务只需几个小时!

在AI领域,深度强化学习(DRL)是个时髦的热词。 深度强化学习使得机器人能够直接从现实世界中的经验和交互中自动学习,因为它能够使用通用神经网络的特征表示来处理复杂的传感器输入。然而,许多现有的DRL算法需要数天或数周(或更多)的真实数据才能收敛到期望值。此外,这样的系统可能难以部署在复杂的机器人系统上(例如多足机器人),也存在在探索阶段容易损坏、超参数难以调整,并且出于对各种安全...

2019-02-14 22:46:04 4127

原创 2019年大数据从入门到精通应该具备的知识体系

 入门知识推荐书籍1、舍恩伯格的《大数据时代》;2、巴拉巴西的《爆发》;3、涂子沛的《大数据》;4、吴军《智能时代》;5、《大数据架构商业之路:从业务需求到技术方案》工具技能1、hadoop: 常用于离线的复杂的大数据处理2、Spark:常用于离线的快速的大数据处理3、Storm:常用于在线的实时的大数据处理4、HDFS:Hadoop分布式文件系...

2019-02-14 19:26:00 355 1

原创 做到这7步 ,做数据科学可以加薪一倍?

在过去十年中,METIS的高级数据科学家Jonathan Balaban帮助100多名学生、同事和朋友开启了新的职业生涯并找到了他们满意的工作。本篇文章中,他提到了职业生涯中应该知道的七条准则。虽然它们并不全面也没有先后关系,但这些简洁却十分有用的准则可以帮助你留下良好的第一印象并加速你的职业发展。1.获取关注首先,不建议你“像杠精一样进入你的新工作”,但你也不该默默无闻。记住,你不是一个...

2019-02-13 18:46:24 125

原创 2019年采用大数据发生重大变化的6个行业

如今,大数据的应用对几乎任何行业的发展都会产生积极的影响,而采用这项技术,一些行业比其他行业更有可能发生重大的变化。以下是采用大数据发生重大变化的6个行业。 1.网络安全黑客一直在不断改进攻击受害者和渗透网络的方法。而网络安全专家也不断努力加强安全防范。出于商业目的分析数据所使用的相同技术通常可用于检测网络安全攻击和减轻损害。可以采用大数据技术,因为采用了识别模式的专用工具。如...

2019-02-13 00:39:03 157

原创 数据科学大佬的简历上都有哪些技能?

如果你是一个数据科学的求职者,那么你一定想知道在你的简历上应该写些什么技能会有更大的概率接到面试。如果你想进入这个领域,你可能已经多次想要知道哪些技术可以成为一个有吸引力的候选人。本文将告诉你答案。01 Python现在是数据科学的首选语言有很多人争论:Python和R,哪个是数据科学的首选语言。市场需求报告告诉我们Python是现代的领导者。同样值得注意的是,R比SAS更少提及。因此...

2019-02-12 23:25:47 395

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除