![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据 数据挖掘
文章平均质量分 68
曼陀罗彼岸花
毕业小硕,主研机器视觉,图像处理方向,专注于图像分类,识别,机器视觉方面的研究,愿结识广大同道中人,共同学习!
展开
-
算法的力量
李开复 2006年5月算法是计算机科学领域最重要的基石之一,但却受到了国内一些程序员的冷落。许多学生看到一些公司在招聘时要求的编程语言五花八门,就产生了一种误解,认为学计算机就是学各种编程语言,或者认为,学习最新的语言、技术、标准就是最好的铺转载 2014-09-01 15:57:09 · 640 阅读 · 0 评论 -
无处不在的推荐系统
这篇博客由微软主要研究者Thore Graepel执笔并发表。博客正文好的推荐任何地方都用得着。无论是找一部你可能喜欢的电影,或者一本你可能感兴趣的书籍,甚至是寻求facebook或linkedin上志同道合的朋友,自动推荐系统将会是个得力助手。刚开始自动推荐系统只限于网络用户,如今,随着微软Azure机器学习的不断普及,越来越多的人可以享受到自动推荐系统的优质服务,小到个人大到企转载 2015-04-29 09:40:29 · 967 阅读 · 0 评论 -
提供大数据分析服务以及机器学习API的公司
最近看到的几个提供大数据分析服务以及机器学习API的公司Everstring:http://www.everstring.com/团队很强大。------------Clarifai: http://www.clarifai.com/CV领域的创业公司,基于DL的结果非常好,公司价值就不知道了。------------转载 2015-05-19 11:25:32 · 2585 阅读 · 0 评论 -
Hadoop 通俗理解
什么是Hadoop?维基百科上面,Hadoop的定义是:一个用java语言编写的便于大型数据集合的分布式储存和计算的软件框架。简单来说,这是计算机领域的一个开源软件,任何程序开发者都可以看到它的源代码,并且进行编译。它的出现让大数据的储存和处理一下子变的快了很多,也便宜了很多。Hadoop是怎么做到将大数据储存和处理变得又快又便宜的?这个讲起来可以讲三天三夜呢。不过举个原创 2015-07-12 17:07:41 · 3343 阅读 · 0 评论 -
算法与数据结构学习资料及面试
数据结构与算法设计是CS相关专业的必修课,也是IT公司笔试面试的重点。网上这方面的资料多如牛毛,我列出了一些我认为非常值得推荐的资源,供有需求的读者研习之用。1、法国鲁昂大学(University of Rouen )Thierry Lecroq 教授关于字符串(模式)匹配算法的介绍内容http://igm.univ-mlv.fr/~lecroq/string/原创 2016-01-20 17:56:25 · 1342 阅读 · 1 评论 -
数据挖掘在医学、金融、安防方面的应用
收集了数据挖掘在医学和金融方面的应用:数据挖掘在医学上的应用数据挖掘在金融和医学方面的商业应用金融企业如何利用大数据洞察客户附:鲍忠铁金融行业大数据应用和互联网金融资深专家,星展银行中国科技副总裁专栏:http://www.36dsj.com/archives/tag/baozhongtie原创 2015-05-25 11:37:26 · 1237 阅读 · 0 评论 -
大数据应用于市场与用户研究
大数据应用于市场与用户研究传统的用户研究包括品牌研究、客户满意度研究、商圈研究、市场细分、渠道研究、产品定价研究以及产品测试,这些研究大多数用市场调研的方法来实现。市场调研由于调研方法带来的诸多问题,导致结果的代表性、准确性以及研究的效率都存在不同程度的挑战。我们相信,随着大数据的发展,大数据将对市场与用户研究方法将带来革命性的变化。本文将介绍大数据目前在市场与用户研究方面的应转载 2015-05-24 10:57:35 · 2914 阅读 · 0 评论 -
大数据概念、算法、应用
一、 大数据基本概念大数据Big Data是指大小超出了常用的软件工具在运行时间内可以承受的收集,管理和处理数据能力的数据集;大数据是目前存储模式与能力、计算模式与能力不能满足存储与处理现有数据集规模产生的相对概念。大数据的预处理主要完成对已接收数据的辨析、抽取、清洗等操作。(1)抽取:因获取的数据可能具有多种结构和类型,数据抽取过程可以帮助我们将这些复杂的数据转化转载 2015-05-24 11:06:40 · 7454 阅读 · 0 评论 -
大数据建模
一、大数据建模数据挖掘是利用业务知识从数据中发现和解释知识(或称为模式)的过程,这种知识是以自然或者人工形式创造的新知识。当前的数据挖掘形式,是在20世纪90年代实践领域诞生的,是在集成数据挖掘算法平台发展的支撑下适合商业分析的一种形式。也许是因为数据挖掘源于实践而非 理论,在其过程的理解上不太引人注意。20世纪90年代晚期发展的CRISP-DM,逐渐成为数据挖掘过程的一种标准化过转载 2015-05-24 11:10:04 · 5876 阅读 · 1 评论 -
大数据存储
一、三只小猪的故事解释大数据存储大数据的部署实施需要结合具体的应用场景。实际上,企业大数据的存储处理可以用 “三只小猪盖房子”(分别使用稻草、木头和砖头)的故事来说明,这个故事能更形象地反映数据存储环境下与交付服务(成本)相对应的不同保护级别(完整性和可靠性)。财务数据、对外报告和法规遵从性数据需在“砖房”(BRICKS)环境中存储处理。这些数据需要可靠的硬件基础设施,并与其原原创 2015-05-24 11:35:45 · 1586 阅读 · 0 评论 -
大数据定义、思维方式及架构模式
一、大数据何以为大数据现在是个热点词汇,关于有了大数据,如何发挥大数据的价值,议论纷纷,而笔者以为,似乎这有点搞错了原因与结果,就象关联关系,有A的时候,B与之关联,而有B的时候,A却未必关联,笔者还是从通常的4个V来描述一下我所认为的大数据思维。1、大数据的量,数据量足够大,达到了统计性意义,才有价值。笔者看过的一个典型的案例就是,例如传统的,收集几千条数据,很难发现血缘原创 2015-05-21 16:40:25 · 4685 阅读 · 0 评论 -
大数据在营销中的应用
对很多企业来说,大数据的概念已不陌生,但如何在营销中应用大数据仍是说易行难。其实,作为大数据最先落地也最先体现出价值的应用领域,网络营销的数据化之路已有成熟的经验及操作模式。一、获取全网用户数据首先需要明确的是,仅有企业数据,即使规模再大,也只是孤岛数据。在收集、打通企业内部的用户数据时,还要与互联网数据统合,才能准确掌握用户在站内站外的全方位的行为,使数据在营销中体现应有的价值。转载 2015-05-21 16:49:01 · 4691 阅读 · 0 评论 -
大数据思维的十大原理----当样本数量足够大时,你会发现其实每个人都是一模一样的
大数据思维的十大原理----当样本数量足够大时,你会发现其实每个人都是一模一样的大数据思维原理是什么?笔者概括为10项原理。一、数据核心原理从“流程”核心转变为“数据”核心大数据时代,计算模式也发生了转变,从“流程”核心转变为“数据”核心。Hadoop体系的分布式计算框架已经是“数据”为核心的范式。非结构化数据及分析需求,将改变IT系统的升级方式:从简单增量到架转载 2015-05-21 16:30:42 · 2793 阅读 · 0 评论 -
How-Old.net背后的技术
How-Old.net背后的技术引言为了展现开发者在Azure的帮助下能轻松迅速地打造智能应用,我们在Azure上用新发布的人脸识别APIs为2015年微软开发者大会的第二天展示搭建了How-Old.net。借助人脸识别API这个网站可以分析用户上传的照片中人物的性别和年龄。这个API的人脸定位功能及性别识别功能大致准确,然而年龄预测结果并不是非常准确,但How-Old.n原创 2015-05-07 15:29:59 · 3057 阅读 · 0 评论 -
基于Hadoop MapReduce模型的数据分析平台研究设计
基于Hadoop MapReduce模型的数据分析平台研究设计前言拖了5天终于看完了两篇论文,对相关数据分析平台搭建技术也有了进一步的了解。对自己这几天的笔记做了一个整理,既是为了方便自己以后查看,也是为以后的实际平台搭建建立依据。其实感觉还是挺苦逼的,这大过年的亲戚都坐在旁边包饺子,而我……还在为自己的拖延症买单。本笔记主要记录以下两个方面:Hadoop Ma转载 2015-05-08 09:47:00 · 5679 阅读 · 0 评论 -
美团推荐算法实践
美团推荐算法实践前言推荐系统并不是新鲜的事物,在很久之前就存在,但是推荐系统真正进入人们的视野,并且作为一个重要的模块存在于各个互联网公司,还是近几年的事情。随着互联网的深入发展,越来越多的信息在互联网上传播,产生了严重的信息过载。如果不采用一定的手段,用户很难从如此多的信息流中找到对自己有价值的信息。解决信息过载有几种手段:一种是搜索,当用户有了明确的信息需求转载 2015-05-07 11:06:37 · 776 阅读 · 0 评论 -
协同过滤算法
引子:一个人想看电影的时候常常会思考要看什么电影呢。这个时候他可能会问周围爱好的人求推荐。现在社会每天都会产生海量的信息。面对这么多信息好多人都不知道什么信息是自己需要的。推荐系统正是起了这么一个作用。推荐系统的应用随处可见。网络购物是一个典型的例子,电子商务的运营商往往会根据用户在网站的行为推荐用户可能会购买的商品。豆瓣FM是做的一个非常好的电台,这个电台能够根据用户的历史行为学习出用户喜欢歌曲原创 2015-03-31 10:07:03 · 785 阅读 · 0 评论 -
机器学习语言理解
博主主页:http://www.flickering.cn/ads/2014/06/我们是这样理解语言的-1文本分析平台textminer/系列文章[我们是这样理解语言的-1]文本分析平台TextMiner[我们是这样理解语言的-2]统计语言模型[我们是这样理解语言的-3]神经网络语言模型[我们是这样理解语言的-4]说说中文分词[我们是这样理解语言的原创 2015-08-28 17:48:00 · 1151 阅读 · 0 评论