自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(53)
  • 资源 (9)
  • 收藏
  • 关注

原创 【MySQL 05】使用Java对MySQL进行操作(创建数据库)

package org.Mysql;import java.sql.Connection;import java.sql.DriverManager;import java.sql.ResultSet;import java.sql.SQLException;import java.sql.Statement;public class mysqlDemo { public static

2016-08-30 23:52:00 1552

原创 【MySQL 04】命令行查询乱码问题

首先,将乱码显示显式出来,主要是中文乱码:第一步:找到安装mysql的目录找到 my.ini 文件;第二步:使用记事本打开my.ini文件,将默认编码设置为utf-8:第三步:在mysql数据库cmd中输入:show variables like’%char%’;第四步:改变原有数据库的编码方式:第五步:改变后的编码方式:第六步:重新查询:MySQL中涉及的几个字符集character-set-se

2016-08-30 23:48:28 466

原创 【MySQL 03】各种数据库对应的jar包、驱动类名和URL格式

1、各种数据库对应的jar包 数据库类型 对应的Jar文件 Oracle 8i classes12.zip 或 ojdbc14.jar Sybase jconn2.jar 或 jconn3.jar Mysql mysql-connector-java-3.1.1-alpha-bin.jar 或 mysql-connector-java-5.0.2-beta-bin.ja

2016-08-30 22:18:53 3343

原创 【MySQL 02】数据库总结

/* 启动MySQL */net start mysql/* 连接与断开服务器 */mysql -h 地址 -P 端口 -u 用户名 -p 密码/* 跳过权限验证登录MySQL */mysqld --skip-grant-tables-- 修改root密码密码加密函数password()update mysql.user set password=password('root');SHO

2016-08-30 21:45:54 765 1

原创 【Eclipse 02】解决Eclipse中文乱码

使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题,Eclipse提供了灵活的设置文件编码格式的选项,我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式:Workspace、Project、Content Type、File。1. 设置Workspace的编码格式:Windows->Preferences… 打开”首选项”窗口,点击左侧导航树到G

2016-08-30 09:54:45 733

原创 【Lucene02】索引的相关概念

一、重要类 (1)IndexWriter:索引过程中的核心组件,用于创建新索引或者打开已有索引,以及向索引中添加、删除、更新被索引文档的信息。 (2)Document:代表一些域(field)的集合。 (3)Field及其子类:一个域,如文档创建时间,作者,内容等。 (4)Analyzer:分析器。 (5)Directory:可用于描述Lucene索引的存放位置。二、文

2016-08-29 21:23:57 551

原创 【Lucene02】索引和搜索建立

1、索引 1、创建索引库IndexWriter 2、根据文件创建文档Document 3、向索引库中写入文档内容对文档建立索引,Lucene提供了5个类:Document, Field, IndexWriter, Analyzer, Directory. 1、Document      用来描述文档的,这里的文档可以指一个 HTML 页面,一封电子邮件,或者是一个文本文件

2016-08-29 20:29:45 649

原创 【Lucene01】索引的建立&Luke的配置使用

在Lucene对文本进行处理的过程中,可以大致分为三大部分: 1、索引文件:提取文档内容并分析,生成索引 2、搜索内容:搜索索引内容,根据搜索关键字得出搜索结果 3、分析内容:对搜索词汇进行分析,生成Quey对象。索引文件基本步骤如下: 1、创建索引库IndexWriter 2、根据文件创建文档Document 3、向索引库中写入文档内容packa

2016-08-29 20:02:09 1632

原创 POI 输出word列表的内容(Doc2String)

对于word列表,如何从列表中将数据输出,这是在查询的过程中首先需要做的:package org.algorithm;import java.io.File;import java.io.FileInputStream;import java.util.ArrayList;import java.util.List;import org.apache.poi.hwpf.HWPFDocument

2016-08-26 11:18:54 731

原创 输出txt列表的内容(Txt2String)

对于txt列表,如何从列表中将数据输出,这是在查询的过程中首先需要做的:package org.algorithm;import java.io.BufferedReader;import java.io.File;import java.io.FileReader;import java.util.ArrayList;import java.util.List;public class

2016-08-26 10:34:45 1047

原创 Lucene token解析

Lucene模块分析: Lucene的 analysis 模块主要负责词法分析及语言处理而形成Term. Lucene的 index 模块主要负责索引的创建,里面有IndexWriter. Lucene的 store 模块主要负责索引的读写。 Lucene的 QueryParser 主要负责语法分析。 Lucene的 search 模块主要负责对索引的

2016-08-25 20:24:23 1446

原创 Lucene自带的分词器分词操作

Lucene自带的分词器分词操作: SimpleAnalyzer StopAnalyzer WhitespaceAnalyzer StandardAnalyzerpackage org.algorithm;import java.io.BufferedReader;import java.io.File;import java.io.FileReader;import

2016-08-25 11:14:00 1456

原创 IKAnalyzer分词(本地文件)

对本地文件进行分词,主要是通过加载本地文件,将txt文本里的以字符串形式导入,然后进行分词处理。package org.algorithm;import java.io.BufferedReader;import java.io.File;import java.io.FileReader;import java.io.IOException;import java.io.StringRe

2016-08-25 10:10:38 843

原创 IKAnalyzer分词(直接输入文本)

IKAnalyzer是一个开源基于JAVA语言的轻量级的中文分词第三方工具包,采用了特有的“正向迭代最细粒度切分算法“,支持细粒度和智能分词两种切分模式。1、采用IKSegmenter进行独立IK分词(1)直接读取字符串package org.algorithm;import java.io.IOException;import java.io.StringReader;import org.w

2016-08-25 00:20:54 2011 1

转载 详解HttpURLConnection

请求响应流程设置连接参数的方法setAllowUserInteraction setDoInput setDoOutput setIfModifiedSincesetUseCaches setDefaultAllowUserInteraction setDefaultUseCaches设置请求头或响应头HTTP请求允许一个key带多个用逗号分开的values,但是HttpURLC

2016-08-24 22:34:52 355

原创 【垂直搜索引擎搭建15】HtmlParser中Filter方法(本地URL地址)

package org.algorithm;import java.io.BufferedReader;import java.io.File;import java.io.FileReader;import java.io.IOException;import org.htmlparser.Node;import org.htmlparser.NodeFilter;import org.

2016-08-24 21:39:58 452

原创 【垂直搜索引擎搭建14】HtmlParser中Filter方法(URL网络地址)

1、TagNameFilterimport java.io.IOException;import org.htmlparser.Node;import org.htmlparser.NodeFilter;import org.htmlparser.Parser;import org.htmlparser.filters.TagNameFilter;import org.htmlparser.

2016-08-24 20:52:17 512

原创 【垂直搜索引擎搭建13】HtmlParser中Visitor实践

使用NodeVisitor方式访问html结点package com.javaeye.suo.htmlparser.samples;import org.htmlparser.Parser;import org.htmlparser.Remark;import org.htmlparser.Tag;import org.htmlparser.Text;import org.htmlparse

2016-08-24 19:45:20 599

原创 【垂直搜索引擎搭建12】htmlparser简介

1、相关资料官方文档:http://htmlparser.sourceforge.net/samples.html API:http://htmlparser.sourceforge.net/javadoc/index.html2、使用HtmlPaser的关键步骤(1)通过Parser类创建一个解释器(2)创建Filter或者Visitor(3)使用parser根据filter或者visitor来

2016-08-24 18:36:06 385

原创 【垂直搜索引擎搭建11】使用htmlparser获取页面的字符编码encoding

1,确定目标。对于html页面来说,一般都有确定编码的语句:<meta http-equiv=”Content-Type” content=”text/html; charset=gb2312″ />可以通过这一行的特征来取出网页的编码。2,选出特征。      1)它是meta标签       2)具有http-equiv属性值为Content-Type       3)将属性content中

2016-08-24 17:04:59 782 1

原创 【垂直搜索引擎搭建10】HtmlParser中Filter实践

Filter种类: 判断类Filter: TagNameFilter HasAttributeFilter HasChildFilter HasParentFilter HasSiblingFilter IsEqualFilter 逻辑运算Filter: AndFilter NotFilter OrFilter XorF

2016-08-24 16:15:14 588

转载 【Java菜鸟 06】Java总结篇系列:Java泛型

一. 泛型概念的提出(为什么需要泛型)?首先,我们看下下面这段简短的代码:public class GenericTest { public static void main(String[] args) { List list = new ArrayList(); list.add("qqyumidi"); list.add("corn");

2016-08-24 13:51:47 416

转载 【Java菜鸟 05】java中的 FileWriter类 和 FileReader类的一些基本用法

1、FileWriter类(字符输出流类)(1)构造方法:       FileWriter fw = new FileWriter(String fileName);//创建字符输出流类对象和已存在的文件相关联。文件不存在的话,并创建。                   如:FileWriter fw = new FileWriter(“C:\demo.txt”);      FileWri

2016-08-24 09:46:43 529

原创 【Java菜鸟 04】Java中的File类详解

Java.io.File类主要是完成了文件夹管理的命名、查询文件属性和处理目录等操作,它不进行文件夹内容的读取操作。1、构造函数: File file = new File(inputPath); //inputPath为创建的file对象的路径信息public class FileDemo { public static void main(String[] args){

2016-08-23 22:12:42 1661

原创 【Java菜鸟 03】InputStreamReader 和BufferedReader

1、BufferedReaderDemo.javapackage org.algorithm;import java.io.*;/* * (为了读取) * public class BufferedReader extends Reader * * 从字符输入流中读取文本,缓冲各个字符,从而实现字符、数组和行的高校读取; * 可以指定缓冲区的大小,或者可使用默认的大小。 * * B

2016-08-23 20:04:30 479

原创 【机器学习理论】第4部分 凸函数

凸函数一直是一个头疼的事,并不是凸函数有多难,而是凸函数的定义一直是个模棱两可的概念,为了方便记忆,现在对凸函数及其相关定义进行总结。凸函数图像:                      由函数图像更加清晰地辨别凸函数的形状,然后对定义的认识才能更加的清晰。凸函数定义:       为函数f(x)定义域内的任意两个实数,且,恒有 ,则称f(x) 是定义域上的凸函数。凸函数的判定: f(

2016-08-23 19:56:39 14203 2

原创 【机器学习实战07】理解SVM

http://blog.csdn.net/shijing_0214/article/details/50982602

2016-08-22 19:41:21 668

原创 【机器学习实战07】SVM--LibSVM工具包的使用

LIBSVM是台湾大学林智仁(LinChih-Jen)教授等开发设计的一个简单、易于使用和快速有效的SVM模式识别与回归的软件包,他不但提供了编译好的可在Windows系列系统的执行文件,还提供了源代码,方便改进、修改以及在其它操作系统上应用;该软件对SVM所涉及的参数调节相对比较少,提供了很多的默认参数,利用这些默认参数可以解决很多问题;并提供了交互检验(Cross Validation)的功能。

2016-08-22 19:22:01 5363

原创 【机器学习实战06】贝叶斯网络

1、概率知识条件概率:事件A在另外一个事件B已经发生条件下的发生概率。表示:P(A|B)记作 “在B条件下A的概率”乘法定理:设P(A)>0,则有                               全概率公式:如果事件B1,B2,B3….Bn构成一个完备事件组,即两两互不相容,其和为全集,且P(Bi)>0,则对任一事件A来说:

2016-08-21 18:03:43 2403 2

原创 【机器学习实战05】PCA降维算法

1、数据简化使得数据更易使用 降低很多算法的计算开销 去除噪声 使得结果易懂2、降维方法 1:主成分分析法( PrincipalComponentAnalysis, P C A )       在 PCA中,数据从原来的坐标系转换到了新的坐标系,新坐标系的选择是由数据本身决定的。第一个新坐标轴选择的是原始数据中方差最大的方向,第二个新坐标轴的选择和第一个坐标轴正交且具

2016-08-20 15:38:58 1008

原创 【机器学习实战04】k-均值聚类算法

1、聚类定义 聚类是一种无监督学习,它将相似的对象归为一类,簇内的对象越相似,聚类的效果越好。k-均值首先发现k个不同的簇,且每个簇的中心采用簇中所含值的均值计算而成。2、开发机器学习应用程序的步骤 (1)收集数据:收集各种样本数据,为了节省时间,可以使用公开的可用数据源 (2)准备输入数据:确保数据格式符合要求,本书采用的格式是Python语言的List。 (3)数据分

2016-08-20 14:38:48 2555

原创 【Python 01】使用UE配置Python编程环境

一直在使用UE来进行python编程,觉得在UE下进行python编程使用起来还是很方便地,现在特来总结一下:1、首先是python环境搭建 (1)下载python2.7 https://www.python.org/getit/ (2)安装python 直接双击安装包,就可以运行 next: 一路安装下去就可以了(3)环境变量配置 配置完成之后,在cmd命令行输入python

2016-08-18 16:33:12 7895

原创 【疯狂Java】Java面向对象1

1、java语言提供了定义类、成员变量、方法等最基本的功能。 2、java也支持面向对象的三大特征:封装、继承、多态 3、java提供了private、protected、public三个访问控制修饰符 4、提供extends关键字来让子类继承父类,子类继承父类就可以继承到父类的成员变量和方法 5、类和对象是面向对象的核心 6、对于一个类定义来说,可以包含三个最常见的成员:构造器、成员变量

2016-08-15 20:16:35 392

原创 【疯狂Java】Java基础2

1、顺序结构 1、每句代码以分号结束。 2、从上向下一条执行,上一条执行结束后下一条才会执行。 3、有的方法执行完成的慢,有的完成的快。2、分支结构package Java;import com.rupeng.game.*;public class IfTest01 implements Runnable{ public static void main(String

2016-08-15 20:04:03 677

原创 【疯狂Java】Java基础1

1、注释 使用“//”注释一行代码,//之后的代码会被编译器忽略。 /**/注释多行代码2、变量 程序由指令和数据组成。指令就是所谓的方法,制定程序做什么,数据是方法中执行的内容,来达到一个什么样的效果。 (1)数据放在“内存”中,为了重复使用某些数据,就把这个数据贴上标签,以后再使用的过程中直接拿到标签就可以了,如果需要更改这个数据的值,直接修改标签就可以了,所以数据都会改变。 (2)变

2016-08-15 19:35:32 446

原创 【疯狂Java】开发工具、eclipse配置、游戏引擎搭建

1、开发工具使用eclipse来进行开发,首先要安装JDK,搭建java开发环境,对环境变量的设置等。其中主要注意的问题就是操作系统的位数,对于32位的操作系统就使用32位的eclipse,64位的使用64位eclipse,在这里我使用的是64位eclipse。问题:32位,64位的查看位置: 右键–我的电脑–属性: 打开属性设置,就可以看到系统类型中会显示操作系统类型,这里显示为64为操作系统

2016-08-15 18:55:42 3165

原创 【机器学习实战03】决策树

1、基本概念 决策树是一类常见的机器学习方法,决策树是基于树结构来进行决策的。       一般的,一颗决策树包含一个根节点,若干个内部节点和若干个叶节点,叶节点对应于决策结果,其他每个节点则对应于一个属性测试;每个节点包含的样本集合根据属性测试的结果被划分到子节点中;根节点包含样本全集,从根节点到每个叶节点的路径对应了一个判定测试序列。2、决策树算法 (1)计算信息熵from math im

2016-08-15 16:26:46 890 1

原创 【机器学习实战02】手写识别系统

利用k-近邻分类器来进行手写识别系统的构造:       这里构造器只能识别数字0-9,需要识别的数字已经被处理成文本格式。      目录trainingDigits中包含大约2000个例子,每个数字大约有200个样本;目录testDigits中包含大约900个测试数据。       使用目录trainingDigits中的数据训练分类器,使用目录testDigits中的数据测试分类器的效果。

2016-08-15 15:38:40 1950 1

原创 【机器学习实战02】使用k-近邻算法改进约会网站的配对效果

程序流程:1.收集数据:提供文本文件2.准备数据:使用Python解析文本文件3.分析数据:使用Matplotlib画二维扩散图4.测试算法:使用提供的部分数据作为测试样本。测试样本和非测试样本的区别在于:测试样本是已经完成分类的数据,如果预测分类与实际类别不同,则标记为一个错误5.使用算法:产生简单的命令行程序,然后可以输入一些特征数据以判断结果本样本共有三种特征:每年获得的飞行常客里程数:The

2016-08-15 14:56:36 733

原创 【机器学习实战01】机器学习基础

机器学习思维导图:

2016-08-15 13:27:24 698

ourbestModel_highscore3500

斯坦福大学的学生基础性地教导系统去了解和回应自然语言提示,例如“climb down the ladder”或“get the key”,从而使该系统成为OpenAI gym中的最高评分算法。可以点击算法视频观看算法演示。 http://mp.weixinbridge.com/mp/wapredirect?url=https://drive.google.com/file/d/0B2ZTvWzKa5PHSkJvQVlsb0FLYzQ/view&action=appmsg_redirect&uin=Nzk3MTk3MzIw&biz=MzA5MzQwMDk4Mg==&mid=2651042109&idx=1&type=1&scene=0

2019-04-14

《大规模基于构件的软件开发》PDF版本

csdn中有很多这本书的版本,但全部都是pdg超星下载的,这个是带目录标签的PDF完全版,真实有效,绝不虚假!

2018-09-08

tensorflow api 英文版

tensorflow api 英文版, 高清版。。。。。。。。。。。

2018-02-09

tensorflow_whitepaper2015

tensorflow whitepaper2015, google paper 。。。。

2018-02-09

停用词表stopwords

文本分析--停用词集合(结合哈工大停用词表、四川大学机器智能实验室停用词库、百度停用词表等)http://blog.csdn.net/kevinelstri/article/details/70227981

2017-08-15

文本分析--停用词集合(结合哈工大停用词表、四川大学机器智能实验室停用词库、百度停用词表等)

综合多种停用词表,进行合并去重处理,http://blog.csdn.net/kevinelstri/article/details/70227981

2017-04-18

聚类内部评价标准--IEEE论文

2010IEEE论文,聚类内部评价标准

2017-03-14

股票数据集

股票数据集,google扒下来的

2017-03-13

MP3的多媒体文件结构

mp3由头部和数据构成,mp3格式也是压缩比率最大的格式,它将音频中75%到90%人类听不到的声音全部过滤掉了,音频质量也就不能很高了

2017-03-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除