自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 资源 (2)
  • 收藏
  • 关注

原创 kmp算法

next数组改进的next数组

2014-08-21 10:20:22 428

转载 Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱

曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python。离开腾讯创业后,第一个作品课程图谱也是选择了Python系的Flask框架,渐渐的将自己的绝大部分工作交给了Python。这些年来,接触和使用了很多Python工具包,特别是在文本处理,科学计算,机器学习和数据挖掘领域,有很多很多优秀的Py

2014-08-11 23:01:08 1160

原创 数据挖掘软件

数据挖掘项目:设计一数据挖掘系统图形用户界面,嵌入下列功能:  频繁模式挖掘,选择一组供演示的数据集(二维或多维),设计结果演示窗口。  分类,选择一组供演示的数据集(二维或多维),设计结果演示窗口。  聚类,选择一组供演示的数据集(二维或多维),设计结果演示窗口。  离群点挖掘,选择一组供演示的数据集(二维或多维),设计结果演示窗口。

2014-08-11 22:44:11 622

原创 论坛热点发现系统

.数据获取-通过网络爬虫实现网络爬虫利用 java 技术,可以通过 htmlparse +httpclient 或者直接利用 java 正则+URL 实现。文中实现使用后者。过程中保存爬下来的页面可实现 BBS 快照功能。当然快照也可以可以 java 的其它

2014-08-11 22:10:51 954

转载 TF-IDF java实现

最近在学习推荐系统,在文本分类中要得到特征词,首先要获取tf-idf模型,搜索中也会用到tf-idf,有必要深入学习。首先来简单回顾一下tf-idf.词频(TF)=某个词在文章中出现的次数词频(TF)=某个词在文章中出现的次数/文章的总词数或者:词频(TF)=某个词在文章中出现的次数/该文出现次数最多的词的出现次数逆文档率:TF-IDF:TF-IDF

2014-08-11 22:05:12 1129

原创 Java 正则

平衡组/递归匹配注意:这里介绍的平衡组语法是由.Net Framework支持的;其它语言/库不一定支持这种功能,或者支持此功能但需要使用不同的语法。 有时我们需要匹配像( 100 * ( 50 + 15 ) )这样的可嵌套的层次性结构,这时简单地使用\(.+\)则只会匹配到最左边的左括号和最右边的右括号之间的内容(这里我们讨论的是贪婪模式,懒惰模式也有下面的问题)。假如原来的字符串里

2014-08-11 21:46:39 456

原创 8皇后问题 非递归实现

#include "stdio.h"#include "math.h"#define M 8int place(int i,int x[]){ int j; for(j=1;j<i;j++) if(x[i]==x[j]||abs(i-j)==abs(x[i]-x[j])) return 0; return 1;}int main(){ int k; int

2014-08-11 13:23:40 768

转载 “22221111”题目详解

#include using namespace std;class A{ public: int a;};class B:public A{ public: int b;};void setA(A *data, int i){ data[i].a = 2; // 打印修改的地址 cout<<"I

2014-08-11 13:17:30 530

转载 寻找表达式

题目描述:现在有一个序列123……N,其中N介于3和15之间,要求在序列之间加入+、-或者空格,使得该序列组成的数学表达式的运算结果为0。输入:输入可能包含多个测试样例。对于每个测试案例,输入整数N(3输出:对应每个测试案例,输出所有使得表达式结果为0的组合,当有多个组合时,按字典序进行排序输出。样例输入:36样例输出:1+2-31 2+3-4-

2014-08-11 13:16:39 533

原创 xilinx zynq 7000 PS PL test

1.Ps测试 l Cpu测试,大量操作寄存器(数据访问的时候不需要访问内存),以汇编代码实现。 然后比较输入结果和希望得到的结果,如果不一样,则说明在操作寄存器的过程中出现错误或寄存器出现问题。 l  Memory测试, 分两部分DDR和RAM。 测试DDR从0x00100000测试采用方式测试,同理测试RAM从0xFFFF0000。注入一些

2014-08-11 12:51:26 1563

转载 xilinx zynq 7000 hello world

让ZYNQ输出"HELLO,WORLD"非常简单,ZEDBOARD.ORG网站上已有ZedBoard_CTT_v14.1文档,大家按照文档中的步骤就能通过串行接口看到输出了。如果不太明白也可以到BAIDU上搜索ZEDBOARD,很多前辈已经把输出"HELLO,WORLD"的步骤图文并茂的一步一步给出了。图1就是main函数的截图,可以看到该函数非常的简单,首先初始化 平台,然后利用“重定向把pri

2014-08-11 12:47:10 2259

原创 快排 partition

int Partition1(int arr[], int lhs, int rhs) {  int pivot = arr[rhs];  int i = lhs - 1;    int temp;  for (int j = lhs; j <= rhs-1; ++j)  {  if (arr[j]    {  ++i;    temp 

2014-08-10 12:42:51 618

转载 计算机视觉、机器学习相关领域论文和源代码集合

一、特征提取Feature Extraction:·         SIFT [1] [Demo program][SIFT Library] [VLFeat]·         PCA-SIFT [2] [Project]·         Affine-SIFT [3] [Project]·         SURF [4] [OpenSURF] [M

2014-07-15 10:23:17 508

数据挖掘原件

jar包。可用于学习。软件可直接运行在装有JVM的机器上。

2014-08-11

热点发现系统

里面有3个工程不是很全,大家可以参考下,分词工程,聚类发现工程,向量化工程,其中爬虫大家就针对自己的需求写个吧。

2014-08-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除