自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 资源 (1)
  • 论坛 (2)
  • 收藏
  • 关注

转载 XLNet基本思想简介以及为什么它优于BERT

前几天刚刚发布的XLNet彻底火了,原因是它在20多项任务中超越了BERT。这是一个非常让人惊讶的结果。之前我们也说过,在斯坦福问答系统中,XLNet也取得了目前单模型第一的成绩(总排名第四,前三个模型都是集成模型)。这里介绍了基本思想以及它和BERT的对比https://www.datalearner.com/blog/1051561733099489...

2019-07-05 14:51:33 511

原创 抛弃Spark?Flink会是下一代大数据计算引擎吗?

原文来自:数据学习(DataLearner)——关注大数据、人工智能和编程技术的原创博客Apache Spark是目前应用最广泛、最流行的大数据计算平台之一,在2.X版本中,Apache Spark已经开始摒弃RDD的数据模型,采用Spark SQL的Dataset作为统一的数据模型来构建更加高效的计算框架。然而,2015年成为Apache顶级项目的Apache Flink却被很多人认为是未来...

2018-09-26 11:39:50 3814

原创 Git的简介和使用

本文来自数据学习网(https://www.datalearner.com),专注于机器学习方法、数据挖掘技术和编程技术,原文地址:https://www.datalearner.com/blog/1051521123408432Git是一个版本控制系统,用来追踪计算机文件的变化的工具,也是一个供多人使用的协同工具。它是一个分布式的版本控制系统,本文将简单介绍如何使用。简单来说,就是你要和你的...

2018-03-16 10:54:14 2760

原创 深度学习技巧之Early Stopping(早停法)

原文来自:深度学习技巧之Early Stopping(早停法) - 数据学习官方网站原创博客一、早停法简介(Early Stopping)当我们训练深度学习神经网络的时候通常希望能获得最好的泛化性能(generalization performance,即可以很好地拟合数据)。但是所有的标准深度学习神经网络结构如全连接多层感知机都很容易过拟合:当网络在训练集上表现越来越好,错误率越来越低的...

2018-10-08 20:14:47 52613 4

原创 《Effective Java 第三版》笔记之二 当构造参数很多的时候考虑使用builder

来源:https://www.datalearner.com/blog/1051525961464023静态工厂和构造方法都有一个缺点:当有很多可选参数的时候,其扩展性并不是很好。例如,考虑这样一个类,它表示食物包装上的营养物质标签。这些标签有一部分是必须的字段——例如分量大小、每个包装容器包含的分量大小、每份物质包含的卡路里等,还有一部分是可选字段——例如总的脂肪含量、饱和脂肪含量、反式脂肪...

2018-09-20 19:56:15 394

原创 《Effective Java 第三版》笔记之一 创建静态工厂方法而不是使用构造器

来源:https://www.datalearner.com/blog/1051525857070904《Effective Java》是一本非常优秀的关于Java编程思想的书籍,第二版出版于2009年,已经过时了。第三版也在2018年推出了,本系列博客讲述第三版中的各项内容。一般情况下,Java类提供实例化的方法是提供一个可以被公共访问的构造方法。但是每个编程的人员都应当了解另一种提供实...

2018-09-20 19:46:32 542

原创 Java爬虫入门简介(四)——抓包工具的使用以及使用HttpClient模拟用户登录的访问

原文地址:http://www.datalearner.com/blog/1051509365677137网络爬虫需要解决的一个重要的问题就是要针对某些需要用户名和密码访问的页面可以模拟用户自动登录。在这一篇博客中我们将介绍如何使用Chrome浏览器自带的抓包工具分析页面并模拟用户自动登录。我们会以CSDN的用户登录为例,讲述如何使用抓包工具获取登录方式并使用HttpClient工具模拟登陆访问。在

2017-10-31 21:11:50 10444 3

原创 给初学者的深度学习简介

深度学习是计算机领域中目前非常火的话题,不仅在学术界有很多论文,在业界也有很多实际运用。本篇博客主要介绍了三种基本的深度学习的架构,并对深度学习的原理作了简单的描述。本篇文章翻译自Medium上一篇入门介绍。深度学习是计算机领域中目前非常火的话题,不仅在学术界有很多论文,在业界也有很多实际运用。

2017-10-16 19:56:50 23673 2

原创 推荐系统之概率矩阵分解的详细推导过程(Probabilistic Matrix Factorization,PMF)

概率矩阵分解是目前在推荐领域很流行的模型。本文主要是讲述详细推导过程。

2017-10-13 09:27:14 11231 4

原创 使用Spring Security进行自动登录验证

在之前的博客使用SpringMVC创建Web工程并使用SpringSecurity进行权限控制的详细配置方法 中,我们描述了如何配置一个基于SpringMVC、SpringSecurity框架的网站系统。在这篇博客中,我们将继续描述如何使用Spring Security进行登录验证。

2017-09-25 14:47:35 3889

原创 使用SpringMVC创建Web工程并使用SpringSecurity进行权限控制的详细配置方法

使用SpringMVC框架搭建Web项目工程是目前非常流行的web项目创建方式。同时Spring Security也为我们提供了登录验证和权限控制等内容。在这篇博客中,我们将详细描述如何从0开始配置一个基于SpringMVC框架和SpringSecurity权限控制的网站。

2017-09-25 10:20:26 4412

原创 Java爬虫入门简介(三)——HttpClient保存使用Cookie登录

在使用HttpClient作为客户端请求数据的时候,我们常常需要以一个用户的身份多次请求一个网站内的多种资源。例如,我一次登录后,后面希望以这个身份继续访问不用重新登录。这里就可以使用cookie了。

2017-09-22 20:03:37 7358 2

原创 Beta分布及其应用

贝塔分布(Beta Distribution)是一个连续的概率分布,它只有两个参数。它最重要的应用是为某项实验的成功概率建模。在本篇博客中,我们简要介绍Beta分布及其相关性质、应用等。

2017-09-20 09:13:54 13405

原创 Android开发入门基础

Android是基于Linux的修改版本的移动操作系统。 大多数Android代码是在开源Apache许可证下发布的。本文将简单介绍Android开发入门知识。

2017-09-18 16:16:08 13500 10

原创 Eclipse使用Maven插件的介绍

使用Maven作为构建工具,管理项目和依赖非常方便。这篇博客将简要介绍在Eclipse中如何使用Maven插件

2017-09-05 16:07:21 1776

原创 编程项目构建工具简介

在进行编程操作的时候,我们常常会遇到很多与编程无关的项目管理工作,如下载依赖、编译源码、单元测试、项目部署等操作。一般的,小型项目我们可以手动实现这些操作,然而大型项目这些工作则相对复杂。构建工具是帮助我们实现一系列项目管理、测试和部署操作的工具。

2017-09-03 12:30:11 2240 2

原创 Eclipse的Web开发环境搭建——从零开始入门介绍

原文地址:http://www.datalearner.com/blog/1051504188229579使用Eclipse进行Web系统开发是一种非常流行的方式。本文将讲述如何从零开始搭建Eclipse的Web开发环境。一JDK安装二Tomcat安装三Eclipse安装四服务器环境设置五界面字体设置六代码缩进设置七代码自动提示设置

2017-08-31 22:06:19 23718 1

原创 CentOS搭建SVN服务器及使用Eclipse连接SVN服务器

原文地址:http://www.datalearner.com/blog/1051504185419831SVN是Subversion的简称,是一个开放源代码的版本控制系统,相较于RCS、CVS,它采用了分支管理系统,它的设计目标就是取代CVS。互联网上很多版本控制服务已从CVS迁移到Subversion。说得简单一点SVN就是用于多个人共同开发同一个项目,共用资源的目的。

2017-08-31 21:18:54 973

原创 Java爬虫入门简介(二) —— Jsoup解析HTML页面

上一篇博客我们已经介绍了如何使用HttpClient模拟客户端请求页面了。这一篇博客我们将描述如何解析获取到的页面内容。上一节我们获取了 http://www.datalearner.com/blog_list 页面的HTML源码,但是这些源码是提供给浏览器解析用的,我们需要的数据其实是页面上博客的标题、作者、简介、发布日期等。在这篇博客里,我们将简单介绍Jsoup解析HTML页面的操作。

2017-08-25 22:05:51 4774 1

原创 Java爬虫入门简介(一) —— HttpClient请求及其使用方法

原文地址:http://www.datalearner.com/blog/1051501160659926数据是科研活动重要的基础。本系列博客将讲述如何使用Java工具获取网络的数据。我们讲述一下爬虫的基本原理。再说明如何使用HttpClient请求路径,包括带参数请求,设置Headers等。

2017-07-27 21:06:48 7845 3

原创 生成对抗网络简介

本文是Aylien上的一篇博客。之前,我们已经有一篇关于生成对抗网络的简介(Generative Adversarial Networks 生成对抗网络的简单理解),配合之前使用TensorFlow搭建深度神经网络(TFboys:使用Tensorflow搭建深层网络分类器)

2017-06-19 19:57:49 2514 1

原创 贝叶斯统计分析中的基本概念和基本方法

贝叶斯统计非常有用,也有一些基本的概念。这篇博客介绍了各种分布/概率的相关概念,并做了简单的介绍。

2017-06-19 16:06:21 5940

原创 一个简洁高效的文本预处理工具-HFUTUtils的使用

这是合肥工业大学管理学院学生创建一个工具程序集合,方便我们平时处理数据。针对文本处理的内容较多。主要是方便大家对数据进行预处理工作。具体的项目地址请见 https://github.com/df19900725/HFUTUtils 。本项目使用jdk8+,使用maven的方式管理引入的jar包。在Github下面直接下载了jar包,引入到你的项目中,然后在pom.xml中添加本项目的依赖就可以了。本

2017-06-14 08:35:16 629

log4j 2使用教程

最新版log4j 2的使用教程,简明扼要,非常好用

2016-01-10

新浪微博爬取数据的下拉数据获取问题

发表于 2013-04-01 最后回复 2013-11-04

[myeclipse的数据库配置(sql server2008)]

发表于 2011-02-06 最后回复 2013-04-01

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除