- 博客(13)
- 资源 (2)
- 收藏
- 关注
转载 Python 网页爬虫 & 文本处理 & 科学计算 & 机器学习 & 数据挖掘兵器谱
曾经因为NLTK的缘故开始学习Python,之后渐渐成为我工作中的第一辅助脚本语言,虽然开发语言是C/C++,但平时的很多文本数据处理任务都交给了Python。离开腾讯创业后,第一个作品课程图谱也是选择了Python系的Flask框架,渐渐的将自己的绝大部分工作交给了Python。这些年来,接触和使用了很多Python工具包,特别是在文本处理,科学计算,机器学习和数据挖掘领域,有很多很多优秀的Py
2014-08-11 23:01:08 1160
原创 数据挖掘软件
数据挖掘项目:设计一数据挖掘系统图形用户界面,嵌入下列功能: 频繁模式挖掘,选择一组供演示的数据集(二维或多维),设计结果演示窗口。 分类,选择一组供演示的数据集(二维或多维),设计结果演示窗口。 聚类,选择一组供演示的数据集(二维或多维),设计结果演示窗口。 离群点挖掘,选择一组供演示的数据集(二维或多维),设计结果演示窗口。
2014-08-11 22:44:11 622
原创 论坛热点发现系统
.数据获取-通过网络爬虫实现网络爬虫利用 java 技术,可以通过 htmlparse +httpclient 或者直接利用 java 正则+URL 实现。文中实现使用后者。过程中保存爬下来的页面可实现 BBS 快照功能。当然快照也可以可以 java 的其它
2014-08-11 22:10:51 954
转载 TF-IDF java实现
最近在学习推荐系统,在文本分类中要得到特征词,首先要获取tf-idf模型,搜索中也会用到tf-idf,有必要深入学习。首先来简单回顾一下tf-idf.词频(TF)=某个词在文章中出现的次数词频(TF)=某个词在文章中出现的次数/文章的总词数或者:词频(TF)=某个词在文章中出现的次数/该文出现次数最多的词的出现次数逆文档率:TF-IDF:TF-IDF
2014-08-11 22:05:12 1129
原创 Java 正则
平衡组/递归匹配注意:这里介绍的平衡组语法是由.Net Framework支持的;其它语言/库不一定支持这种功能,或者支持此功能但需要使用不同的语法。 有时我们需要匹配像( 100 * ( 50 + 15 ) )这样的可嵌套的层次性结构,这时简单地使用\(.+\)则只会匹配到最左边的左括号和最右边的右括号之间的内容(这里我们讨论的是贪婪模式,懒惰模式也有下面的问题)。假如原来的字符串里
2014-08-11 21:46:39 456
原创 8皇后问题 非递归实现
#include "stdio.h"#include "math.h"#define M 8int place(int i,int x[]){ int j; for(j=1;j<i;j++) if(x[i]==x[j]||abs(i-j)==abs(x[i]-x[j])) return 0; return 1;}int main(){ int k; int
2014-08-11 13:23:40 768
转载 “22221111”题目详解
#include using namespace std;class A{ public: int a;};class B:public A{ public: int b;};void setA(A *data, int i){ data[i].a = 2; // 打印修改的地址 cout<<"I
2014-08-11 13:17:30 530
转载 寻找表达式
题目描述:现在有一个序列123……N,其中N介于3和15之间,要求在序列之间加入+、-或者空格,使得该序列组成的数学表达式的运算结果为0。输入:输入可能包含多个测试样例。对于每个测试案例,输入整数N(3输出:对应每个测试案例,输出所有使得表达式结果为0的组合,当有多个组合时,按字典序进行排序输出。样例输入:36样例输出:1+2-31 2+3-4-
2014-08-11 13:16:39 533
原创 xilinx zynq 7000 PS PL test
1.Ps测试 l Cpu测试,大量操作寄存器(数据访问的时候不需要访问内存),以汇编代码实现。 然后比较输入结果和希望得到的结果,如果不一样,则说明在操作寄存器的过程中出现错误或寄存器出现问题。 l Memory测试, 分两部分DDR和RAM。 测试DDR从0x00100000测试采用方式测试,同理测试RAM从0xFFFF0000。注入一些
2014-08-11 12:51:26 1563
转载 xilinx zynq 7000 hello world
让ZYNQ输出"HELLO,WORLD"非常简单,ZEDBOARD.ORG网站上已有ZedBoard_CTT_v14.1文档,大家按照文档中的步骤就能通过串行接口看到输出了。如果不太明白也可以到BAIDU上搜索ZEDBOARD,很多前辈已经把输出"HELLO,WORLD"的步骤图文并茂的一步一步给出了。图1就是main函数的截图,可以看到该函数非常的简单,首先初始化 平台,然后利用“重定向把pri
2014-08-11 12:47:10 2259
原创 快排 partition
int Partition1(int arr[], int lhs, int rhs) { int pivot = arr[rhs]; int i = lhs - 1; int temp; for (int j = lhs; j <= rhs-1; ++j) { if (arr[j] { ++i; temp
2014-08-10 12:42:51 618
转载 计算机视觉、机器学习相关领域论文和源代码集合
一、特征提取Feature Extraction:· SIFT [1] [Demo program][SIFT Library] [VLFeat]· PCA-SIFT [2] [Project]· Affine-SIFT [3] [Project]· SURF [4] [OpenSURF] [M
2014-07-15 10:23:17 508
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人