自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (1)
  • 收藏
  • 关注

原创 10 大基本排序 --python

1 冒泡:相邻的元素作比较 def bubble_sort(num): for i in range(1,len(num)-1): for j in range(len(num)-i):#后面的i个排序已完成了,不用再排了 if num[j]>num[j+1]: num[j],num[j+1] = num[...

2019-08-21 12:13:43 177

原创 keras----CNN评论分析

相比用tensorflow我更倾向用keras,理由:1. keras使用对于我来说更加简便。2. keras自带优化模型工具较好 3. 代码相对要简单一点 在keras我用了3个模型,分别是cnn、RNN、cnn_rnn 文本预处理: 对于文本我们一般想到的都是去除标点符号和停用词,这里说明一点,之前我认为我的训练数据过少,打算不去停用词,这样训练会有更多的词汇和特征,但其实去除停用词可以...

2019-03-10 16:45:28 313

原创 集成学习

在我调试代码时,在后期可能是因为文本处理太多,总是导致过拟合现象,经过查阅资料,发现有很多种处理过拟合的方法 防止过拟合的方法: (1) 正则化 (2) 数据增强,(这个方法我是根据CNN处理图片的方式,将每一行文本的内容打乱,这样我们的数据集就会增大将近1倍,这里需要注意的是,测试集放的数据在数据集中只有一个,该方法对数据的准确率作用不明显,大约提高1%) (...

2019-03-10 16:45:15 229

原创 svm旅游内容等级分类

处理文本: 使用的全国高校应用创新大赛的数据集,共有两万条 http://117.50.29.62/ 注意:文本的编码格式,一般为utf-8或者gb18030, 经常报错的: 1 UnicodeDecodeError: 'gbk' codec can't decode byte 0xfd in position 3061: illegal multibyte sequence 解...

2019-03-10 16:44:56 481

原创 tensorflow——CNN旅游文本分类

CNN基本介绍 1. CNN(卷积神经网路)是在近两年才用在文本处理上面的,本次实验中用tensorflow和keras分别实现了文本处理。 tensorflow中,主要分为词嵌入层、卷积层、池化层和全连接层,要真正理解CNN首先要弄明白每个参数的作用,以及他每一步作用的方式和物理意义。(盗图) 根据此图来讲解释CNN在文本的实现: 1 CNN将文本内容按字读取,然后统计每个字出现的...

2019-03-10 16:44:24 746

原创 word2vec和胶囊网络

word2vec wordvec两种方式:cbow和skip-gram,两者在本质上是差不多的,只不过一个是用中间词预测周围侧,一个是用周为词预测中间词。 两种模型: 基于Hierarchical Softmax 构造哈夫曼树,将问题变为多个二分类 基于Negative Sampling模型 参考文献: https://blog.csdn.net/itplus/article/det...

2019-03-10 16:43:47 177

原创 在线选课系统

一、数据库设计 需注意:  1. 考虑实体与实体之间的关系,如继承(学生和老师继承用户的属性,但他们分别是各自的)2. 考虑变量的类型与大小(如Id的类型设置为varchar(23),其中前三位是类型(stu),中间17位为时间戳,后面的3位1到999的随机数)、上传时间的类型设置为char(17)3. 数据库的字段最好用全部用大写,否则使用时要用双引号包含,数据库的值如果包含字母和数字时,用单引...

2018-05-16 18:57:52 4446 2

原创 Mybatis

1. id属性与定义的接口方法名一样,Mybatis通过这种方式将接口方法与xml中定义的sql语句联系在一起         接口方法只可以重载的,但是id不能重复,在同名方法中,增加一个RowBound类型的参数用于实现分页查询         resultMap用来配置java对象的属性和查询结果列对应的关系 <select id="selectById" resultMap="...

2018-05-12 09:00:08 223

原创 使用元数据来浏览数据库中的所有表

元数据:描述数据库或其组成部分的数据 package dbcconnection; import java.awt.BorderLayout; import java.awt.Component; import java.awt.EventQueue; import java.awt.GridBagConstraints; import java.awt.GridBagLayout; imp

2018-01-10 17:52:50 281

原创 mysql数据库连接

package Test; import java.nio.file.*; import java.sql.*; import java.io.*; import java.util.*; public class TestDB { public static void main(String[] args) throws IOException{ // TODO Auto-gene...

2018-01-09 14:50:08 198

香港城市大学语料库;微软亚洲研究院语料库;北京大学语料库;

香港城市大学语料库(1 772 202 字,训练集)、微软亚洲研究院语料库(1 089 050 字,训练集)、北京大学语料库(1 833 177 字,训练集

2019-02-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除