数据学习
文章平均质量分 79
数据学习(Datalearner)
关注数据科学 关注科技行业 关注人工智能 关注一切促进人类生活美好的新技术
展开
-
《Effective Java 第三版》笔记之二 当构造参数很多的时候考虑使用builder
来源:https://www.datalearner.com/blog/1051525961464023静态工厂和构造方法都有一个缺点:当有很多可选参数的时候,其扩展性并不是很好。例如,考虑这样一个类,它表示食物包装上的营养物质标签。这些标签有一部分是必须的字段——例如分量大小、每个包装容器包含的分量大小、每份物质包含的卡路里等,还有一部分是可选字段——例如总的脂肪含量、饱和脂肪含量、反式脂肪...原创 2018-09-20 19:56:15 · 576 阅读 · 0 评论 -
《Effective Java 第三版》笔记之一 创建静态工厂方法而不是使用构造器
来源:https://www.datalearner.com/blog/1051525857070904《Effective Java》是一本非常优秀的关于Java编程思想的书籍,第二版出版于2009年,已经过时了。第三版也在2018年推出了,本系列博客讲述第三版中的各项内容。一般情况下,Java类提供实例化的方法是提供一个可以被公共访问的构造方法。但是每个编程的人员都应当了解另一种提供实...原创 2018-09-20 19:46:32 · 693 阅读 · 0 评论 -
抛弃Spark?Flink会是下一代大数据计算引擎吗?
原文来自:数据学习(DataLearner)——关注大数据、人工智能和编程技术的原创博客Apache Spark是目前应用最广泛、最流行的大数据计算平台之一,在2.X版本中,Apache Spark已经开始摒弃RDD的数据模型,采用Spark SQL的Dataset作为统一的数据模型来构建更加高效的计算框架。然而,2015年成为Apache顶级项目的Apache Flink却被很多人认为是未来...原创 2018-09-26 11:39:50 · 4676 阅读 · 0 评论 -
Git的简介和使用
本文来自数据学习网(https://www.datalearner.com),专注于机器学习方法、数据挖掘技术和编程技术,原文地址:https://www.datalearner.com/blog/1051521123408432Git是一个版本控制系统,用来追踪计算机文件的变化的工具,也是一个供多人使用的协同工具。它是一个分布式的版本控制系统,本文将简单介绍如何使用。简单来说,就是你要和你的...原创 2018-03-16 10:54:14 · 4488 阅读 · 2 评论 -
给初学者的深度学习简介
深度学习是计算机领域中目前非常火的话题,不仅在学术界有很多论文,在业界也有很多实际运用。本篇博客主要介绍了三种基本的深度学习的架构,并对深度学习的原理作了简单的描述。本篇文章翻译自Medium上一篇入门介绍。深度学习是计算机领域中目前非常火的话题,不仅在学术界有很多论文,在业界也有很多实际运用。原创 2017-10-16 19:56:50 · 25317 阅读 · 2 评论 -
推荐系统之概率矩阵分解的详细推导过程(Probabilistic Matrix Factorization,PMF)
概率矩阵分解是目前在推荐领域很流行的模型。本文主要是讲述详细推导过程。原创 2017-10-13 09:27:14 · 13507 阅读 · 4 评论 -
一个简洁高效的文本预处理工具-HFUTUtils的使用
这是合肥工业大学管理学院学生创建一个工具程序集合,方便我们平时处理数据。针对文本处理的内容较多。主要是方便大家对数据进行预处理工作。具体的项目地址请见 https://github.com/df19900725/HFUTUtils 。本项目使用jdk8+,使用maven的方式管理引入的jar包。在Github下面直接下载了jar包,引入到你的项目中,然后在pom.xml中添加本项目的依赖就可以了。本原创 2017-06-14 08:35:16 · 860 阅读 · 0 评论 -
生成对抗网络简介
本文是Aylien上的一篇博客。之前,我们已经有一篇关于生成对抗网络的简介(Generative Adversarial Networks 生成对抗网络的简单理解),配合之前使用TensorFlow搭建深度神经网络(TFboys:使用Tensorflow搭建深层网络分类器)原创 2017-06-19 19:57:49 · 2925 阅读 · 1 评论 -
贝叶斯统计分析中的基本概念和基本方法
贝叶斯统计非常有用,也有一些基本的概念。这篇博客介绍了各种分布/概率的相关概念,并做了简单的介绍。原创 2017-06-19 16:06:21 · 7772 阅读 · 0 评论 -
XLNet基本思想简介以及为什么它优于BERT
前几天刚刚发布的XLNet彻底火了,原因是它在20多项任务中超越了BERT。这是一个非常让人惊讶的结果。之前我们也说过,在斯坦福问答系统中,XLNet也取得了目前单模型第一的成绩(总排名第四,前三个模型都是集成模型)。这里介绍了基本思想以及它和BERT的对比https://www.datalearner.com/blog/1051561733099489...转载 2019-07-05 14:51:33 · 788 阅读 · 0 评论