- 博客(8)
- 资源 (26)
- 问答 (1)
- 收藏
- 关注
原创 ictclas分词系统的使用,java调用,附带连接mysql进行读写。
1.进入官网下载 ictclas2013下载包,目前更新到0416版,ictclas2013-Win-32-jni或者64位的。如果系统是32位的就下载32位的,如果是64位的系统,那就要看你安装的java虚拟机是32位还是64位。若是32为jdk,还是要下载使用32位的JNI,而且Eclipse也用32位的。2.准备文件 打开ictclas2013文件,需要的数据是:Data,Bin,Text
2015-08-23 21:40:30 1492 1
原创 用python进行数据预处理,过滤特殊符号,英文和数字。(适用于中文分词)
要进行中文分词,必须要求数据格式全部都是中文,需求过滤掉特殊符号、标点、英文、数字等。当然了用户可以根据自己的要求过滤自定义字符。 实验环境:python、mysql实验目的:从数据库读取数据,过滤点无用字符,然后存入到数据库一个表里面。代码如下:# -*- coding: UTF-8 -*-import MySQLdb as mdbimport redef createStatistic
2015-08-23 21:14:47 41991 2
原创 python 读取本地txt,存入到mysql
准备工作:成功安装python2.7、pycharm、python的mysql包–mysqldb、mysql 5.6 数据:本地文件,名称 a.txt代码如下:# -*- coding: UTF-8 -*-import MySQLdb as mdbimport timestart=time.time()def createTrain(): try: #将con设定为全
2015-08-17 19:01:55 8596
转载 sql中的in与not in,exists与not exists的区别
1、in和existsin是把外表和内表作hash连接,而exists是对外表作loop循环,每次loop循环再对内表进行查询,一直以来认为exists比in效率高的说法是不准确的。如果查询的两个表大小相当,那么用in和exists差别不大;如果两个表中一个较小一个较大,则子查询表大的用exists,子查询表小的用in;例如:表A(小表),表B(大表)select * from A where cc
2015-08-15 10:04:58 659
转载 SQL 模糊查询
在进行数据库查询时,有完整查询和模糊查询之分。一般模糊查询语句如下:SELECT 字段 FROM 表 WHERE 某字段 Like 条件其中关于条件,SQL提供了四种匹配模式:1,% :表示任意0个或多个字符。可匹配任意类型和长度的字符,有些情况下若是中文,请使用两个百分号(%%)表示。比如 SELECT * FROM [user] WHERE u_name LIKE ‘%三%’将会把u_name为
2015-08-14 09:43:04 676
转载 matlab 更改可用内存(最快速有效方法)
一直搜索如何调大或者减小matlab的可用内存,找了很多方法,试验了很多次。觉得下面的这种方式是最简单快捷的:首先先查看一下matlab的内存情况,在matlab命令行输入memory即可。1、查找matlab根路径.在matlab命令行中敲入:matlabroot 显示根路径,如:C:\MATLAB7 2.查看当前Java虚拟机最大堆内存, 敲入:java.lang.Runtime.get
2015-08-11 19:50:10 23310 4
转载 java读取txt文件
package com.campu;import java.io.BufferedInputStream;import java.io.BufferedReader;import java.io.File;import java.io.FileInputStream;import java.io.InputStreamReader;import java.io.Reader;/** *
2015-08-11 16:30:10 744
原创 Apriori挖掘频繁模式,关联规则(附代码实现 java+mysql)
Apriori算法在数据挖掘中主要挖掘频繁模式和关联规则,这个算法比较简单,但是开销很大,需要扫描数据库。预备知识: 支持度(Support)的公式是:Support(A->B)=P(A U B)。支持度揭示了A与B同时出现的概率。如果A与B同时出现的概率小,说明A与B的关系不大;如果A与B同时出现的非常频繁,则说明A与B总是相关的。支持度: P(A∪B),即A和B这两个项集在事务集D中同时出现的
2015-08-11 11:59:09 4443 5
ACM程序设计
2016-11-16
Multi-View K-Means Clustering on Big Data
2016-04-06
图像可视化的综述+原文+译文
2015-10-18
如何进行机器学习算法的实验?
2015-10-30
TA创建的收藏夹 TA关注的收藏夹
TA关注的人