自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

spring_willow的博客

再不学习就死定了

  • 博客(10)
  • 资源 (3)
  • 收藏
  • 关注

原创 NLP-python3 translate()报错问题-TypeError: translate() takes exactly one argument (2 given)

学习笔记,备忘录。。。TypeError: translate() takes exactly one argument (2 given)使用translate()函数删除指定字符,报错内容为函数内只需要一个参数,但提供了两个。原因是python2.7版本之后translate()内的参数从两个变成了一个。实例1:去掉文本中的标点符号import stringold...

2018-05-11 10:06:56 38406

原创 NLP-数据预处理后的特征选择

学习笔记,,备忘录。。。 内容来源:知乎:特征工程到底是什么?实际应用中的数据往往很多,并存在不相关的特性,特性之间也可能存在相互依赖。通过特征选择剔除不相关或冗余的特征,减少特征个数,减少运行时间的目的。数据预处理后,需要选择有意义的特征,然后再输入机器学习的算法和模型进行训练。一、相关系数法计算各个特征对目标值的相关系数,选择更加相关的特征。原始数据: ...

2018-05-09 23:41:35 1886

原创 NLP-离散特征值的数据处理问题

学习笔记,备忘录。。。 来源:特征工程到底是什么?离散特征值离散特征值有两种数据类型:取值大小有意义:eg.尺寸:L,XL,XXL将大小值通过字典进行存储取值大小无意义:eg.颜色:红、黄、蓝使用get_dummies()方法处理 pandas.get_dummies(data,prefix=None,prefix_sep=’‘,dummy_na=Fal...

2018-05-09 17:19:11 1641

原创 NLP-中文文本去除标点符号

简单记录一下中文文本如何去除标点和特殊符号的问题。。。目录目录一、回顾一下英文如何去除符号等预处理问题①去除特殊符号②去除数字③词形归一④停止词⑤将上述内容综合二、中文文本去除标点符号1.背景知识2.示例说明1:使用Zhon库中的符号集①命令行中安装Zhon库②代码③结果④问题说明3.示例说明2:自定义特殊符号集进行去除...

2018-05-06 01:10:39 19278 5

原创 NLP-读取csv文件

赛题:问题相似度计算 网址:金融大脑-金融智能NLP服务目录目录1.数据格式:2.读取文件:3.更改列名4.获取某一列的信息5.对整个文件进行分割1.数据格式:行号\t句1\t句2\t标注,举例:1 花呗如何还款 花呗怎么还款 1 行号指当前问题对在训练集中的第几行; 句1和句2分别表示问题句对的两个句子; ...

2018-05-05 16:22:25 1505 3

原创 NLP-使用tensorflow构建神经网络——卷积层和池化层细节说明

背景介绍本文内容是使用CNN进行文本分类,主要记录文本分类问题中使用tensorflow进行神经网络构建的内容。此篇承接上一篇的NLP-使用tensorflow构建神经网络——嵌入层细节部分说明。目录背景介绍目录一、CNN模型图二、卷积和池化代码三、细节说明之tf.truncated_normal;tf.concat;tf.reshape①tf.truncated...

2018-05-04 23:43:56 1631

原创 NLP-使用tensorflow构建神经网络——嵌入层细节部分说明

背景介绍本文内容是使用CNN进行文本分类(垃圾邮件分类),代码来源:https://github.com/dennybritz/cnn-text-classification-tf,github上还有许多相似代码,可自行查找。 主要记录文本分类问题中使用tensorflow进行神经网络构建的内容。目录背景介绍目录一、初始化备注:tf.constant()二...

2018-05-03 21:52:25 2914

原创 Python-使用pyplot模块绘图

图表能帮助我们更好的反映出数据的信息,无论是论文还是博客都需要用到,所以非常有必要先学习一下。matplotlib.pyplot在python中,使用matplotlib库中的pyplot模块进行绘图。1.最简单的使用import matplotlib.pyplot as pltplt.plot([4,3,2,1])plt.show()输出结果: 说...

2018-05-02 22:44:18 1196

原创 NLP-epoch和batch

epoch和batch到底是个什么鬼?背景说明先上个简单的代码记录一下我此刻懵懵的状态: 问个问题: 从图中可以看到我现在正在看一个关于CNN文本分类的代码,github上有很多。该代码是data_helper.py 文件中的一个函数,该函数是一个batch样本生成器,这里面就涉及到了神经网络里经常用到的batch_size和epoch,它们的含义究竟是什么呢? 一句话回...

2018-05-01 20:14:50 2143

原创 Python-random生成随机数:shuffle()&permutaion()等

shuffle()和permutation()使用python编辑器的控制台进行如下实验:In[2]: import numpy as npIn[3]: a=np.arange(8)In[4]: aOut[4]: array([0, 1, 2, 3, 4, 5, 6, 7])In[5]: np.random.shuffle(a)In[6]: aOut[6]: array...

2018-05-01 10:48:49 640 1

Integration of artificial intelligence activities

Integration of artificial intelligence activities in software development processes and measuring effectiveness of integration

2017-12-20

myeclipse2017破解

用于破解myeclipse2017。。。。。。。。。。。。。。。。。。。。。。。。。

2017-12-04

jaxen-1.1.6.jar+dom4j.1.6.1.jar

Dom4j解析xml文档,支持包jaxen-1.1.6.jar,解决java.lang.NoClassDefFoundError: org/jaxen/JaxenException

2017-11-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除