数据挖掘
文章平均质量分 71
BigBzheng
机器学习、深度学习、数据挖掘、NLP
展开
-
常用的七种数据挖掘的方法
利用数据挖掘进行数据分析常用的方法主要有分类、回归分析、聚类、关联规则、特征、变化和偏差分析、Web页挖掘等, 它们分别从不同的角度对数据进行挖掘。 ① 分类。分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别。它可以应用到客户的分类、客户的属性和特征分析、客户满意度分析、客户的购买趋势预测等,如一个汽原创 2016-03-19 15:22:02 · 740 阅读 · 0 评论 -
面试机器学习、大数据岗位时遇到的各种问题
自己的专业方向是机器学习、数据挖掘,就业意向是互联网行业与本专业相关的工作岗位。各个企业对这类岗位的命名可能有所不同,比如数据挖掘/自然语言处理/机器学习算法工程师,或简称算法工程师,还有的称为搜索/推荐算法工程师,甚至有的并入后台工程师的范畴,视岗位具体要求而定。机器学习、大数据相关岗位的职责自己参与面试的提供算法岗位的公司有 BAT、小米、360、飞维美地、宜信、猿题库 等,根原创 2016-08-14 09:31:16 · 2546 阅读 · 0 评论 -
ML 工程师需了解的 10 大算法
毫无疑问,机器学习/人工智能的子领域在过去几年越来越流行。由于大数据是目前科技领域最热门的趋势,基于这些大规模的数据,机器学习在预测和计算建议方面变得不可思议的强大。最常见的机器学习的例子就是 Netflix(一家在线影片租赁提供商)的算法,它能基于你过去看过的电影来推荐电影,或着 Amazon 的算法,它能基于你过去买的书,来推荐书给你。那么如果你想进一步了解机器学习,你应该怎样开始原创 2016-08-14 09:28:40 · 816 阅读 · 0 评论 -
搞机器学习要哪些技能
1. 前言本来这篇标题我想的是算法工程师的技能,但是我觉得要是加上机器学习在标题上,估计点的人会多一点,所以标题成这样了,呵呵,而且被搜索引擎收录的时候多了一个时下的热门词,估计曝光也会更多点。不过放心,文章没有偏题,我们来说正经的。今天就说说机器学习这个最近两年计算机领域最火的话题,这不是一篇机器学习的技术文章,只是告诉大家机器学习里面的坑实在是太多,而且很多还没入门或者刚刚入门的朋友们转载 2016-08-22 22:10:38 · 976 阅读 · 5 评论 -
【python gensim使用】word2vec词向量处理中文语料
word2vec介绍word2vec官网:https://code.google.com/p/word2vec/word2vec是google的一个开源工具,能够根据输入的词的集合计算出词与词之间的距离。 它将term转换成向量形式,可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。 word2vec计算的是余弦值,距离范围为0-1之...转载 2016-08-17 22:30:53 · 3226 阅读 · 1 评论 -
深度学习之-Dropout的讲解(5)
原文地址:http://blog.csdn.net/hjimce/article/details/50413257作者:hjimce一、相关工作 本来今天是要搞《Maxout Networks》和《Network In Network》的,结果发现maxout和dropout有点类似,所以就对dropout做一下相关的总结,了解一下其代码层面的实现。 Dropout是2转载 2016-05-08 19:41:00 · 4742 阅读 · 0 评论 -
深度学习之caffe环境搭建(3)
ubuntu 系统下的Caffe环境搭建原文地址:http://blog.csdn.net/hjimce/article/details/48781693作者:hjimce对于caffe的系统一般使用linux系统,当然也有windows版本的caffe,不过如果你一开始使用了windows下面的caffe,后面学习的过程中,会经常遇到各种错误,网上下载的一些源码、模型也往往不能快速的转载 2016-05-07 17:28:54 · 3105 阅读 · 0 评论 -
深度学习之卷积神经网络入门(2)
卷积神经网络入门学原文地址:http://blog.csdn.net/hjimce/article/details/47323463作者:hjimce卷积神经网络算法是n年前就有的算法,只是近年来因为深度学习相关算法为多层网络的训练提供了新方法,然后现在电脑的计算能力已非当年的那种计算水平,同时现在的训练数据很多,于是神经网络的相关算法又重新火了起来,因此卷积神经网络就又活了起来。转载 2016-05-07 17:27:51 · 7460 阅读 · 0 评论 -
深度学习相关资料(1)
一、学习清单1、综合类(1)收集了各种最新最经典的文献,神经网络的资源列表:https://github.com/robertsdionne/neural-network-papers 里面包含了深度学习领域经典、以及最新最牛逼的算法,如果把这个列表学过一遍,基本已然达到了大神级别。(2)机器学习学习清单:https://github.com/ujjwalkarn/Machine-L原创 2016-05-07 17:11:12 · 1342 阅读 · 0 评论 -
基于R-CNN的物体检测
基于R-CNN的物体检测原文地址:http://blog.csdn.net/hjimce/article/details/50187029作者:hjimce一、相关理论 本篇博文主要讲解2014年CVPR上的经典paper:《Rich feature hierarchies for Accurate Object Detection and Segmentation》,这篇转载 2016-05-07 17:06:26 · 863 阅读 · 0 评论 -
CNN应用之性别、年龄识别
原文地址:http://blog.csdn.net/hjimce/article/details/49255013作者:hjimce一、相关理论 本篇博文主要讲解2015年一篇paper《Age and Gender Classification using Convolutional Neural Networks》,个人感觉这篇文献没啥难度,只要懂得Alexnet,实现这篇文转载 2016-05-07 10:28:49 · 1853 阅读 · 0 评论 -
七步教你精通Python机器学习
开始。这是最容易令人丧失斗志的两个字。迈出第一步通常最艰难。当可以选择的方向太多时,就更让人两腿发软了。从哪里开始? 本文旨在通过七个步骤,使用全部免费的线上资料,帮助新人获取最基本的 Python 机器学习知识,直至成为博学的机器学习实践者。这篇概述的主要目的是带领读者接触众多免费的学习资源。这些资源有很多,但哪些是最好的?哪些相互补充?怎样的学习顺序才最好?我假定本原创 2016-03-19 21:23:12 · 858 阅读 · 0 评论 -
迁移学习和微调深度卷积神经网络
这是由几个部分组成的博客系列,我将在此系列中聊一聊我对深度学习的经验及认识。在第一部分,我讨论了不同的有代表性的框架的优劣,以及我选择 Theano(与 Lasagne)作为我的平台的原因。第二部分是基于我将要在 2016 年度数据科学论坛(The Data Science Conference)上的发言内容整理的。我将在这部分讲解深度卷积神经网络(DCNN:Deep Convolut翻译 2016-08-30 20:59:32 · 11604 阅读 · 2 评论