自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 资源 (10)
  • 收藏
  • 关注

原创 神经网络中的Attention-5.训练和评估Seq2Seq

在上一篇文章中,我们研究了Cho et al. (2014) 和Pytorch实现的Seq2Seq模型。在这篇文章中,让我们看看如何用准备好的数据训练模型,并定性地评估它。创建编码器/解码器模型首先,让我们分别创建编码器和解码器模型。尽管它们是共同训练和评估的,但为了使代码具有更好的可读性和可理解性,我们分别定义和创建它们。仅仅作为参考,我们在前面的帖子中设置了超参数,如下所示。 MAX_SENT_LEN: 源(英文)句子的最大句子长度 ...

2021-12-21 21:54:22 783

翻译 神经网络中的Attention-5.训练和评估Seq2Seq

在上一篇文章中,我们研究了Cho et al. (2014) 和Pytorch实现的Seq2Seq模型。在这篇文章中,让我们看看如何用准备好的数据训练模型,并定性地评估它。创建编码器/解码器模型首先,让我们分别创建编码器和解码器模型。尽管它们是共同训练和评估的,但为了使代码具有更好的可读性和可理解性,我们分别定义和创建它们。仅仅作为参考,我们在前面的帖子中设置了超参数,如下所示。 MAX_SENT_LEN: 源(英文)句子的最大句子长度 ...

2021-12-21 21:51:01 425

翻译 神经网络中的Attention-4.Seq2Seq的实现

在上一篇文章中,我们看到了如何为Seq2Seq准备机器翻译数据。在这篇文章中,让我们用Pytorch和准备好的数据来实现Cho et al. (2014) 描述的Seq2Seq模型。数据预处理在数据处理之后,我们有四个包含学习Seq2Seq模型的关键信息的变量。在之前的文章中,我们将它们命名为eng_words, deu_words, eng_sentences, deu_sentences。eng_words和deu_words包含源语(英语)和目标语(德语)句子中独特的单词。在我处理过的数据

2021-11-07 19:27:37 259

翻译 神经网络中的Attention-3.为机器翻译Seq2Seq准备数据

在上一篇文章中,我们首先研究了Sequence-to-Sequence(Seq2Seq)。在这篇文章中,在用Python实现Seq2Seq模型之前,让我们看看如何为神经机器翻译准备数据。问题-神经机器翻译机器翻译的任务是将一种语言(如法语)的句子自动转换成另一种语言(如英语)的句子。我们要转换的句子(词)通常称为源句(词)。被转换成的句子(词)就是目标句子(词)。下面的图表展示了从法语到英语的翻译,第一个源词是“On”、“y”和“va”,而目标词是“Let’s”和“go”。神

2021-10-26 21:02:30 181

翻译 神经网络中的Attention-2.Sequence-to-Sequence (Seq2Seq)

在之前的文章中,介绍了注意力机制,并概述了它的(不那么短的)历史。在这篇文章中,将解释Sequence-to-Sequence (Seq2Seq)架构,它带来了神经机器翻译的重大突破,并推动了Attention的发展。动机-序列问题深度神经网络是在各种任务中对非线性数据进行建模的高效工具。在图像分类、句子分类等多种任务中,深度神经网络已被证明是有效的。然而,传统的架构,如多层感知机,在建模序列,如信号和自然语言的效率较低。因此,Seq2Seq被提出来将序列输入映射到序列输出。Se

2021-10-16 20:06:57 654

翻译 神经网络中的Attention-1.介绍

Attention可以说是当今深度学习领域最强大的概念之一。基于基本的常识,我们在处理大量信息时,通常会“关注”某一部分。这个简单而强大的概念彻底改变了这个领域,不仅在自然语言处理(NLP)任务方面带来了许多突破,而且在推荐、医疗保健分析、图像处理、语音识别等领域也带来了很多突破。因此,在本系列文章中,将阐述神经网络中注意力机制的发展,重点放在应用和现实世界的部署上。将尝试用Pytorch从头开始实现尽可能多的注意网络——从数据导入和处理到模型评估和解释。注意机制

2021-10-15 09:47:11 483

原创 Linux下conda虚拟环境离线迁移

一、 使用conda pack命令将已经安装好的虚拟环境打包成压缩文件PS。如果遇到如下问题,在该虚拟环境下使用conda install packagename 安装相应的包即可解决。二、将压缩文件env_name.tar.gz压缩包拷贝至目标主机相同版本的Anaconda安装路径的envs路径下进行解压,并通过命令行conda activate env_name激活该环境即可完成迁移。...

2021-08-18 15:17:01 771

原创 Python中Timedelta转换为Int或Float

一、Pandas处理import pandas as pddataSet['t'] =dataSet['time'].astype('timedelta64[D]').astype(float)dataSet['t'] .head()二、Numpy处理import numpy as npdataSet['t']=(dataSet['time']/np.timedelta64(1, 'D')).astype(float)dataSet['t'] .head()三、区别..

2020-08-04 10:08:50 5702

原创 pandas获取datetime中的年份和月份

df['year'] = pd.DatetimeIndex(df['ArrivalDate']).yeardf['month'] = pd.DatetimeIndex(df['ArrivalDate']).month或者df['year'] = df['ArrivalDate'].dt.yeardf['month'] = df['ArrivalDate'].dt.month

2020-07-31 16:27:18 4334

原创 用pandas.to_datetime进行日期解析

import pandas as pddf=pd.pd.read_csv()df['Date'] = pd.to_datetime(df['Date'], format='%d/%m/%y')

2020-07-31 12:10:55 999

原创 深度学习入门教程-1.4 神经网络如何学会预测

咱们已经知道了什么是神经元,而且知道了神经网络如何进行预测,那么它是如何学会这种能力的呢?下面咱们就来说一说。上节说到,神经元之所以可以进行预测,主要是通过公式Y = (x1 * w1 + x2 * w2 + x3 * w3) + b计算来进行的。但是,权重(w1,w2,w3)和偏差b是怎么得来的呢?你很能要说,你这不是废话吗?是你设定的撒。非也,上节只是为了讲解方便,咱们人工设定了权重和偏差的值。但是,实际中在运用神经网络时,并不是这样的。试想下,如果参数都是人...

2020-07-21 19:13:46 743

原创 深度学习入门教程-1.3 神经网络如何进行预测

上一节中我们介绍了神经网络的输入,即如何将图片输入到神经网络中去。那么神经网络是如何根据这些数据进行预测的呢?也就是我们将一张图片输入到神经网络之后,神经网络是如何预测这张图中是否有猫的呢?这个预测的过程其实可以看作是基于一个简单的公式:z = dot(w,x) + b。这个公式中的x代表输入的特征向量,假设特征向量有3个特征,那么x就可以用(x1,x2,x3)来表示。w表示权重,它对应于每个输入的特征,可以认为代表了每个特征的重要程度。b表示偏差,是调整神经元被激活的容易程度。...

2020-07-14 09:56:54 3432 1

原创 深度学习入门教程-1.2 神经网络的输入

前面大概讲了什么是神经网络。那么这节就来说下如何将数据(图片、语音、视频等等)输入到神经网络中。下面是一张金发美女的图片,图片一般有RGB、CMYK等色彩模式,咱们就拿RGB来说。为了存储RGB的图像,因为图像有三个通道,因此计算机会存储一个三维矩阵,为了理解方便,咱们暂且看作三个独立的矩阵。这三个矩阵分别与此图像的红色、绿色和蓝色相对应(世界上的所有颜色都可以通过红绿蓝三种颜色调配出来)。如果图像的大小是64 * 64个像素(一个像素就是一个颜色点,一个颜...

2020-07-07 09:33:44 4086

原创 深度学习入门教程-1.1 神经网络是什么

到底什么是人工神经网络?前面提到,人工神经网络是从大脑的理解中汲取灵感而形成的。在我们的大脑中,有数十亿个神经元,它们连接成了一个神经网络。人工神经网络,结构也有些类似。许多个神经元(下图中的⚪)相连,构成了一个神经网络。人类大脑神经元细胞接收来自外部多个强度不同的刺激,并在神经元细胞内进行处理,然后转化为一个输出,传导给下一个神经元。人工神经元也类似,但是在处理的机制和工作原理和大脑神经元没什么关系。人工神经元输入的是数据,输出的还是数据。...

2020-07-01 17:01:21 305

原创 深度学习入门教程-引言

学习机器学习也有不短的时间了,从开始的不短踩坑、爬坑,到现在已经做了一些业务场景的应用和落地,虽然小有收获,但是学无止境,尤其是在机器学习、深度学习这种领域。不过,这些时间的学习和实践,学习相关心得和经验倒是积累了不少,为了避免对这方面感兴趣的初学者少走弯路,也为了使自己能更加深入对知识点的理解,所以尝试把自己学到的通过简单易懂的言语表述出来。这是对于自己也是一个新的尝试,更是一个挑战,由于能力所限,文中可能会有不准确之处,还望指正。今天先来个引言,简单介绍下人工智能、机器学习、深度学这三者之间的关系,

2020-06-28 11:09:27 248

原创 安装tensorflow2.2后import出现:ImportError: DLL load failed:找不到指定的模块

在使用pip install tenorflow安装完tensorflow2.2后,执行import tensorflow as tf出现如下错误信息:ImportError: DLL load failed: 找不到指定的模块。During handling of the above exception, another exception occurred:Traceback (most recent call last): File "<stdin>", lin

2020-05-21 10:00:58 3034 3

原创 Pandas读文件的时候,以特定格式读取日期或时间date_parse

Excel或csv上的日期+时间格式通常是:2018/4/10 16:32因此,在读文件的时候,最好提前设定时间的格式。import pandas as pddateparse = lambda dates: pd.datetime.strptime(dates, '%Y/%m/%d %H:%M')datapd=pd.read_csv("D:\data.csv",parse_dates=True,date_parser=dateparse,index_col=0)有时候手写日期会.

2020-05-15 15:07:57 4778 2

原创 Windows 10 下fbprophet的安装

在Windows 10环境安装fbprophet简直时折磨,无论是pip安装还是下载源码安装,都会报各种VC编译器错误,在尝试安装各种VC编译器版本后依然报错,在被折磨24小时之后,终于放弃。最后两条命令搞定,实在是………………由于是在Anaconda中使用,所以直接进入 Anaconda prompt,两步直接搞定:1、执行conda install pystan会出现Proceed (y/n)?y遇到输入y即可。2、执行conda install..

2020-05-12 10:26:08 543 1

原创 RemoveError requests is a dependency of conda 问题解决

在执行conda命令时报错RemoveError: ‘requests’ is a dependency of conda and cannot be removed from conda’s operating environment.按照网上的各种办法,包括执行conda update conda还是继续报错,经过多番尝试,在执行conda update --force conda之后,问题解决。...

2020-05-12 09:57:02 2256 4

原创 机器学习应用之客户工单智能分拣

常言道:"不以提升业务价值为目的的搞技术都是耍流氓。"那么,下面咱们就来用机器学习中NLP(自然语言处理)的中文文本分类技术来进行一个客户问题智能分拣方面的实战项目。先来简单描述下所应用的业务场景:当今大型的IT产品多采用分布式开发模式,分为多个不同的子系统,由多个不同的团队(可能在不同的地域)共同开发。一旦用户在使用过程中出现问题,首先会由客服人员进行识别是哪个子系统的问题,然后再将问题...

2019-05-09 21:39:58 881

原创 白话机器学习

学习机器学习已经两月有余,从刚开始接触时的一脸懵懂,到现在能用开源的机器学习框架解决一些简单的实际应用,也算是小有进步。期间,也曾对做的机器学习应用进行了一些交流分享,而交流时看到听众在听到特征工程、数据模型、参数调优等机器学习处理过程时茫然的表情,便有些疑惑不解。会后细想,究其原因可能是机器学习涉及到数学基础科学、数据科学、计算科学等多个方面,是多个学科的结合,是一个全新复杂的领域。对于一些...

2019-04-18 20:45:09 416

原创 AI-未来已来 把握现在

近几年来,人工智能(AI)一直都是各大媒体的热点话题,机器学习、深度学习和人工智能都频繁的出现在各种文章中。就算是在平时和朋友的聊天中,也经常会聊到AI的话题。然而,除了AI的热度,究竟什么是人工智能、机器学习、深度学习?这三者之间又有什么关系呢?却鲜有人能分的清楚,下面就先来个科普,说下这个话题。人工智能人工智能诞生于二十世纪五十年代,当时计算...

2019-04-12 14:05:27 490

Python 深度学习

深度学习经典书籍,Keras之父、Google人工只能研究员,Francois Chollet执笔,深度学习领域力作 通俗易懂,帮助读者建立关于机器学习和深度学习核心思想的直觉

2019-02-21

FreeMarker设计指南.pdf

FreeMarker设计指南,pdf格式,清晰。

2010-12-30

linux_unix常用命令速查手册

linux_unix常用命令速查手册,方便使用。

2010-12-30

jQueryAPI_CHM.CHM

jQueryAPI_CHM.CHM,chm格式的帮组文档。

2010-12-30

Hibernate 参考指南

很好的Hibernate Framework学习资料,PDF格式,内容全面,适合初学者和想要深入学习的程序员。

2010-06-10

Spring Framework开发参考手册

极为经典的Spring Framework学习资料,内容全面,既适合初学者入门,也适合资深开发者作为查询手册。PDF格式。

2010-06-10

Tuxedo培训教程

很好的Tuxedo入门教程,全面易懂!PDF格式!

2010-06-09

Java夜未眠chm格式

本书是一本散文集。作为一名资深Java程序设计师,作者用清新自然的笔触记录下自己学习、工作生活中的所见所思。书中收录的文章内容贴近程序员的生活,令读者产生强烈共鸣。此外,书中部分文章也以轻松的风格介绍了学习Java技术时的一些常见问题,并介绍了一些优秀的Java书籍,能够帮助读者兴趣盎然地学习Java技术。 本书适合于Java程序员、专业软件开发者、程序设计爱好者阅读。

2010-01-23

Effective C++ 3rd edition.chm

Effective C++ Third Edition 55 Specific Ways to Improve Your Programs and Designs By Scott Meyers

2009-07-22

程序员面试宝典.PDF

C++程序员找工作必备,欧立奇著的那本,PDF格式。

2009-07-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除