大数据
paul123456789io
这个作者很懒,什么都没留下…
展开
-
zynq 网上资料
摘要: 在前几篇博客中,我们用ZED平台完成了对USB摄像头的视频采集,Qt的视频显示。在此基础上,我们更希望能把视频存储成视频文件,像DV机一样。MJPG是一种比较简单且易于实现的视频视频编码格式,而AVI封装则是非常流行的视频封装。本篇将介绍MJPG的编码格式和视频的AVI封装,并在ZedBoard上实现对视频的压缩和存储。阅读全文posted @ 2013-03-28 22:46 超转载 2016-12-07 11:41:31 · 614 阅读 · 0 评论 -
数据挖掘-基于机器学习的SNS隐私策略推荐向导分类器的C++及WEKA实现与评估
本文接《基于机器学习的SNS隐私保护策略推荐向导的设计与实现》,详细解析基于机器学习的SNS隐私策略推荐向导分类器的C++及WEKA实现与评估结果,本文完整C++程序及Java工程下载链接见点击打开链接,对数据挖掘和SNS感兴趣的朋友可以下载跑一下,有任何问题欢迎交流:)基于机器学习的SNS隐私策略推荐向导分类器的C++及WEKA实现与评估1 SNS朋友数据预处理与统计要实现对朋友转载 2017-04-13 14:01:51 · 526 阅读 · 0 评论 -
数据挖掘—概念学习Candidate-Elimination算法的C++实现
Candidate-Elimination算法是数据挖掘中的一种概念学习算法,部分解决Find-S的不足,可以输出所有与训练样本一致的概念,同时利用概念间偏序关系来指导搜索,其伪代码描述如下[cpp] view plain copyInitialize Gto the set of most-general hypotheses in H转载 2017-04-13 11:51:40 · 533 阅读 · 0 评论 -
WEKA使用教程(经典教程转载)
目录 1. 简介2. 数据格式3.数据准备4. 关联规则(购物篮分析)5. 分类与回归6. 聚类分析1. 简介 WEKA的全名是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis),它的源代码可通过http://www.cs.waikato.ac.nz/ml/weka得到。同时weka也是新西兰的一种鸟名转载 2017-04-13 11:37:41 · 4189 阅读 · 0 评论 -
使用Weka进行数据挖掘
http://blog.sina.com.cn/s/blog_72995dcc01016mxn.html1.简介数据挖掘、机器学习这些字眼,在一些人看来,是门槛很高的东西。诚然,如果做算法实现甚至算法优化,确实需要很多背景知识。但事实是,绝大多数数据挖掘工程师,不需要去做算法层面的东西。他们的精力,集中在特征提取,算法选择和参数调优上。那么,一个可以方便地提供这些功能的工具,便是十分必转载 2017-04-13 11:34:27 · 446 阅读 · 0 评论 -
Sphinx中文入门指南——新手可先看此文
Sphinx中文入门指南——新手可先看此文2009年02月9日 — admin本文主要介绍Sphinx的入门使用,新手观看,老鸟指正!* 1、简介* 1.1.Sphinx是什么* 1.2.Sphinx的特性* 1.3.Sphinx中文分词* 2、安装配置实例* 2.1 在GNU/Linux/unix系统上安装o 2.1.1 sphinx安转载 2017-01-21 17:00:58 · 661 阅读 · 0 评论 -
简单总结笔试和面试中的海量数据问题
最近在笔试和面试中遇到了很多关于海量数据的问题,在此进行简单的记录,写一篇方便自己下次学习的处理海量数据的文章及在线笔记,同时也希望对你有所帮助。当然,海量数据最出名的还是七月July,但这里我是想直接从实际题目出发,并参考及摘抄了他们那些大牛的文章及自己的想法进行简单总结记录。一. 原题重现 2015年9月27日百度笔试论述题二选一,其中第一道是关于MapReduc转载 2017-02-09 11:35:09 · 3460 阅读 · 1 评论 -
一次查询性能提高40倍的经历
背景说明数据库:MongoDB数据集: A:字段数不定,这里主要用到的两个UID和DateB:三个字段,UID、Date、Actions。其中Actions字段是包含260元素JSON数组,每个JSON对象有6个字段。共有数据800万条左右。业务场景:求平均数 通过组合条件从A数据表查询出(UID,Date)列表,最多可能包含数万条记录;然后用第1步的结果从B中查询出对转载 2017-02-09 11:12:15 · 333 阅读 · 0 评论 -
创业公司做数据分析(六)数据仓库的建设
作为系列文章的第六篇,本文将重点探讨数据处理层中数据仓库的建设。在第二篇运营数据系统一文,有提到早期的数据服务中存在不少问题,虽然在做运营Dashboard系统时,对后台数据服务进行了梳理,构建了数据处理的底层公共库等,但是仍然存在一些问题:中间数据流失,计算结果没有共享。比如在很多数据报告中都会对同一个功能进行数据提取、分析,但是都是各自处理一遍,没有对结果进行共享。数据分散在多个数据源转载 2017-02-09 10:55:59 · 935 阅读 · 1 评论