![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Java
一个叫欧维的程序员在此写博客
这个作者很懒,什么都没留下…
展开
-
Java --- JDK下载位置
下载网站原创 2020-12-02 14:03:03 · 79 阅读 · 0 评论 -
DL4J---导入Keras模型进行使用
使用Java深度学习框架DL4J导入Keras模型应工作需要,需要使用Java来调用Keras构建的深度学习模型注: DL4J框架对 Keras 后端TensorFlow版本具有要求:TensorFlow版本2.0以下作后端所支持的 Keras 构建的h5模型可成功导入,预测TensorFlow版本2.0作后端所支持的 Keras 构建的h5模型无法成功导入,预测血泪史由于笔者使用的是...原创 2019-12-23 18:23:58 · 872 阅读 · 0 评论 -
Java---工具包
Java—工具包为避免重复造轮子而浪费时间,将编写代码过程中遇到的问题及解决办法进行总结。java中List集合中任意两个位置的数据互相调换Collections.swap(list,loc1,loc2);...原创 2019-10-29 14:54:39 · 166 阅读 · 0 评论 -
Java---SimHash原理与实现
Java—SimHash原理与实现SimHash 原理原理链接SimHash 实现package GetSimilar;import java.io.BufferedReader;import java.io.FileInputStream;import java.io.InputStreamReader;import java.math.BigInteger;import j...原创 2019-11-26 16:31:58 · 1397 阅读 · 1 评论 -
Java---利用互信息方式进特征选择,用于文本分类
Java—利用互信息方式进特征选择任务定义 原始材料:多个类别文件,每个文件包含若干样本 目标:从每个类别文件中提取若干词语,这些词具有**类区分度**,即在类A中常出现,在类B中不常出现。 方法:使用互信息方式进行词语提取。步骤1、构建字典:Map<词语,出现的该词的文档数>。 构建两种字典:大字典---所有文本;小字典---单个类别文件。 逐个读取文件夹内的每个类...原创 2019-10-29 14:48:57 · 582 阅读 · 0 评论 -
Java---Lucene根据条件查询文档
Lucene根据条件查询文档紧接上一篇博客Java—Lucene索引库建立模拟搜索引擎,根据输入条件对文档进行查询,并按一定规则排序返回结果import java.io.IOException;import java.nio.file.Paths;import java.text.ParseException;import java.util.ArrayList;import jav...原创 2019-10-24 16:01:04 · 259 阅读 · 0 评论 -
Java---Lucene索引库建立
构建Lucene索引库针对JSON格式的文本,构建Lucene索引库,数据格式如下:import java.io.BufferedReader;import java.io.FileInputStream;import java.io.IOException;import java.io.InputStreamReader;import java.nio.file.Path;imp...原创 2019-10-24 15:56:29 · 200 阅读 · 0 评论 -
Java---递归算法题
该篇文章为遇到的递归算法题笔记一、输入整数N,返回如下结果public static String zigzag(int n) { if (n == 1) return "*"; if (n == 2) return "**"; return "<" + zigzag(n-2) +">...原创 2019-09-15 21:27:31 · 306 阅读 · 0 评论 -
Java---正向、逆向和双向最大匹配算法
完成正向、逆向和双向最大匹配算法import java.io.*;import java.util.*;/** * 正向最大匹配 * 逆向最大匹配 * 双向最大匹配 */public class TwoMaxMatch { private static final int MAX_LENGTH = 5; public static void main(String[] a...原创 2019-08-22 10:49:44 · 907 阅读 · 9 评论 -
Java---划分训练集与测试集
使用Java完成文本数据的训练集与测试集划分如:总数据1000条文本数据,划分成训练集800条,测试集200条public class data_split { /** 测试集比例 */ public static double test_percent = 0.2; public static void main(String[] args) throws Exception { ...原创 2019-08-20 17:40:43 · 651 阅读 · 0 评论 -
Java---根据停用词表对文本进行过滤
根据停用词表内的停用词,删除文本中的包含的这些停用词1、先构建停用词的Map表,方便后续判断 词 是否在该Map表内2、对句子进行分词,过滤import java.io.BufferedReader;import java.io.FileInputStream;import java.io.IOException;import java.io.InputStreamReader;im...原创 2019-08-19 16:13:04 · 1054 阅读 · 0 评论 -
DL4J---实现Word2Vec模型构建
本文实现使用 Java深度学习框架DL4J 完成Word2Vec模型的建立。将训练语料保存在 all_data.txt文件内,格式为每一行一条样本,且经过分词、过滤处理。如://原文本样本String raw = "超半数省份出台供给侧改革方案,降低要素成本成难点。";//分词过滤后,空格相间隔String washed = "超 半数 省份 出台 供给 侧 改革 方案 降低 要素 成...原创 2019-08-15 15:51:56 · 630 阅读 · 0 评论 -
Java---根据正则表达式获取文本内的日期
你好!本方法为根据正则表达式获取文本内存在的日期。由于网站中存在各种类型的日期格式,笔者根据实际匹配情况进行统计,编写方法以匹配大多数日期格式。代码如下:/** * * @param content 包含日期的原文本 * @return 文本中包含的日期,返回匹配列表 */public static List<String> getTime(String co...原创 2019-08-15 09:25:35 · 904 阅读 · 0 评论 -
Java---获取文本信息熵
Java--获取文本信息熵本文实现方法:在已知语料(content)下获取文本(element)的信息熵。实例:我们获取了一个网站内的所有文本(content),要计算其中每个标题(element)的信息熵值。过程:首先,对语料(content)进行分词过滤,统计每个词的词频,占比,以此作为该词的概率值。然后,对要计算信息熵的文本(element)进行同样的分词操作,根据分词获取对应的概...原创 2019-08-15 09:08:19 · 669 阅读 · 0 评论 -
Java---连接MySQL数据库
Java连接MySQL数据库准备工作连接代码准备工作你好! 本示例在Maven项目下实现,连接需导入相应的Jar包,poem代码如下:// 对应的Jar包 <dependency> <groupId>com.jfinal</groupId> <artifactId>jfinal</artifactId> <...原创 2019-07-22 09:42:48 · 93 阅读 · 0 评论