![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
yinghe_one
旨在发现全球技术深度好文,拒绝热点浮躁浅文,对于外文,受限于鄙人英语水平和效率,都采用AI机器翻译,如果觉得翻译不好,可以直接看原文。
展开
-
你应该知道的10种Python文件系统方法
使用os和shutil操作文件和文件夹你可以编写Python程序来与文件系统进行交互来做很酷的事情。怎么做并不总是非常清楚。本文是当前和有抱负的开发人员和数据科学家的指南。我们将重点介绍10个基本的os和shutil命令,以便您可以编写脚本来自动化与文件系统的交互。像文件系统一样文件系统有点像房子。假设您正在进行春季清洁,您需要将笔记本盒从一个房间移动到另一个房间。目录就像...翻译 2019-03-01 00:48:02 · 987 阅读 · 0 评论 -
我们一直都在接受A / B测试
网络正在被无处不在的实践所重塑 - 这是一个严重的道德问题Testing出的解决方案是设计过程的核心部分,并且在网络上,即经常发生在A / B测试的形式:设计师展示一组设计给A用户,另一组设计给B用户,并测量它可以获取更接近期望的结果。并且不仅仅是测试A / B的布局 - 这些实验决定了从我们阅读的标题到我们看到的颜色的所有内容。但正如一篇新论文所讨论的那样,A / B测试可能存在道德问题。...翻译 2019-03-07 18:21:53 · 1165 阅读 · 0 评论 -
使用Neo4j和Java进行大数据分析 第2部分
本文的第一部分介绍了Neo4j及其Cypher查询语言。如果您已经阅读了第1部分,那么您已经了解了为什么Neo4j和其他图形数据库特别受社交图形或网络中用户之间关系建模的影响。您还在开发环境中安装了Neo4j,并概述了使用此数据存储的基本概念 - 即节点和关系。然后,我们使用Cypher查询语言对Neo4j中的一个家庭进行建模,包括年龄,性别和家庭成员之间的关系等个人属性。我们创建了一些朋友来...翻译 2019-03-15 13:21:11 · 1082 阅读 · 0 评论 -
使用Neo4j和Java进行大数据分析 第1部分
几十年来,关系数据库一直主导着数据管理,但它们最近已经失去了NoSQL的替代品。虽然NoSQL数据存储不适合每个用例,但它们通常更适合大数据,这是处理大量数据的系统的简写。四种类型的数据存储用于大数据:键/值存储,例如Memcached和Redis 面向文档的数据库,如MongoDB,CouchDB和DynamoDB 面向列的数据存储,如Cassandra和HBase 图形数据库,如Ne...翻译 2019-03-12 15:11:26 · 1938 阅读 · 0 评论 -
深入浅出学习决策树(二)
接着上篇文章深入浅出学习决策树(一)继续介绍决策树相关内容。回归问题中的决策树在预测数值变量时,构造树的想法保持不变,但质量标准会发生变化。其中n是叶子中的样本数,Yi是目标变量的值。简单地说,通过最小化均值周围的方差,我们寻找以这样的方式划分训练集的特征,即每个叶子中的目标特征的值大致相等。例让我们生成一些由函数分配并带有一些噪音的数据。然后我们将在其上训练一...翻译 2019-03-18 22:58:35 · 1178 阅读 · 0 评论 -
专为实时而构建:使用Apache Kafka进行大数据消息传递 第2部分
在Apache Kafka简介的前半部分,您使用Kafka开发了几个小规模的生产者/消费者应用程序。从这些练习中,您应该熟悉Apache Kafka消息传递系统的基础知识。在下半部分,您将学习如何使用分区来分布负载并横向扩展应用程序,每天处理多达数百万条消息。您还将了解Kafka如何使用消息偏移来跟踪和管理复杂的消息处理,以及如何在消费者失败时保护您的Apache Kafka消息传递系统免于失败。...翻译 2019-03-22 17:00:02 · 918 阅读 · 0 评论 -
你究竟能用Python做什么?
中英文模式阅读中文模式阅读英文模式阅读What exactly can you do with Python? Here are Python's 3 main applications.你究竟能用Python做什么?这是Python的3个主要应用。If you're thinking of learning Python --- or if you recently s...翻译 2019-04-04 18:17:37 · 2023 阅读 · 1 评论 -
你不了解你的健康数据会让你生病
你不能选择摆脱一个渴望了解你健康的一切的影子系统——如果你不知道,你可能会选择分享更多Fast CompanyBlockedUnblockFollow发布于3月22日"HIPAA存在很多漏洞:关于哪些信息实际受到保护,谁受到保护,以及您是否通过自己的同意放弃了这种保护。"图片来源:Andrii Panchyk / iStock / Getty Images Plusby珍妮特比...翻译 2019-03-28 20:09:02 · 1103 阅读 · 0 评论 -
Python列表推导(list comprehension)VS 生成器表达式(generator expression)
你知道以下语法之间的区别吗?[x for x in range(5)](x for x in range(5))tuple(range(5))本文将向您介绍这里的区别。关于列表的5个事实首先,对列表进行简短回顾(在其他编程语言中通常称为“数组”):列表是一种可以表示为元素集合的数据。一个简单的列表如下所示:[0, 1, 2, 3, 4, 5]列表将所有可能类型的数...翻译 2019-04-29 19:46:39 · 1413 阅读 · 0 评论