自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

大数据挖掘DT数据分析

手把手带你玩各种数据分析案例,涵盖数据分析工具使用,数据挖掘算法原理与案例,深度学习,机器学习,R语言,Python编程,爬虫。

  • 博客(24)
  • 收藏
  • 关注

转载 机器学习、深度学习 知识点总结及面试题

向AI转型的程序员都关注了这个号???大数据挖掘DT数据分析  公众号: datadw1、反向传播思想:计算出输出与标签间的损失函数值,然后计算其相对于每个神经元的梯度,根据梯度方向更新权值。(1)将训练集数据输入到ANN的输入层,经过隐藏层,最后达到输出层并输出结果,这是ANN的前向传播过程;(2)由于ANN的输出结果与实际结果有误差,则计算估计值与实际值之间的误差,并将该误差从输出层向隐藏层反

2017-12-31 00:00:00 829

转载 普通程序员如何转型AI 工程师

AI领域人才奇缺,炙手可热的AI专业应届生年薪30万起步,AI毕业生基本不用找工作,都已经被企业早早预定。AI人才究竟有多紧缺?据腾讯研究院《全球人工智能人才白皮书》报告数据,目前全球AI领域人才仅约30万,全球367所具有AI研究方向的高校,每年毕业AI领域学生仅约2万人,这个数据甚至远未达到国内500万AI人才需求,更不用说全球的AI人才缺口了。不仅是人才短缺、市场对AI人才的白热化渴求,20

2017-12-30 00:00:00 1624

转载 百度×科赛 PaddlePaddle AI 大赛开赛啦

2017年12月28日,百度 PaddlePaddle AI 大赛正式开赛了!在上篇「百度和科赛,想让AI与你更近一些」中曾提到,PaddlePaddle AI 大赛“希望参赛选手使用PaddlePaddle深度学习框架、利用BROAD数据集、利用K-Lab,着手解决一些行业中的真实问题,从而让AI真正应用于行业、服务于行业。”本次大赛,我们将目光放在这样一个行业——电视综艺。在电视综艺的拍摄录制

2017-12-29 00:00:00 2717

转载 Coursera上Python课程(公开课)汇总

向AI转型的程序员都关注了这个号???大数据挖掘DT数据分析  公众号: datadwPython是深度学习时代的语言,Coursera上有很多Python课程,从Python入门到精通,从Python基础语法到应用Python,满足各个层次的需求,以下是Coursera上的Python课程整理,仅供参考,这里也会持续更新。密歇根大学的“Python for Everybody Specializ

2017-12-28 00:00:00 11683

转载 数据挖掘工程师:如何通过百度地图API抓取建筑物周边位置、房价信息

向AI转型的程序员都关注了这个号???大数据挖掘DT数据分析  公众号: datadw本文代码在公众号 datadw 里 回复 地图   即可获取。1.需求描述对于数据挖掘工程师来说,有时候需要抓取地理位置信息,比如统计房子周边基础设施信息,比如医院、公交车站、写字楼、地铁站、商场等,一般的爬虫可以采用python脚本爬取,有很多成型的框架如scrapy,但是想要爬百度地图就必须遵循它的JavaS

2017-12-27 00:00:00 1345

转载 python常用可视化技巧

向AI转型的程序员都关注了这个号???大数据挖掘DT数据分析  公众号: datadw我们在对数据进行预处理时,常常需要对数据做一些可视化的工作,以便能更清晰的认识数据内部的规律。 这里我们以kaggle案例泰坦尼克问题的数据做一些常用的可视化的工作。首先看下这个数据集: import pandas as pdimport numpy as npimport matplotlib.pyplot a

2017-12-25 00:00:00 649

转载 利用OpenCV的人脸检测给头像带上圣诞帽

向AI转型的程序员都关注了这个号???大数据挖掘DT数据分析  公众号: datadw本文代码在公众号 datadw 里 回复 圣诞   即可获取。我们来看下效果原图:效果:   原理其实很简单:采用一张圣诞帽的png图像作为素材,        利用png图像背景是透明的,贴在背景图片上就是戴帽子的效果了。人脸检测的目的主要是为了确定贴帽子的位置,类似ps中自由变换的功能,检测到人脸中间的位置,

2017-12-23 00:00:00 1288

转载 百度和科赛,想让AI与你更近一些

2017年7月,百度正式开放无人驾驶技术平台Apollo、智能语音开放平台DuerOS。同时,百度的无人车也吃到了历史上第一张开给无人驾驶汽车的罚单。百度大脑每天被调用2188亿次,已开放了超过80个核心的AI能力,已有37万多个合作伙伴加入了百度大脑开放平台。“All in AI”,是百度2017年扛起的旗帜。从巨额资金研发投入,到招揽世界级顶尖AI科学家,再到如今AI应用落地——首都机场的“刷

2017-12-22 00:00:00 898

转载 京东商品评论情感分析:数据采集与词向量构造方法

向AI转型的程序员都关注了这个号???大数据挖掘DT数据分析  公众号: datadw最近实习期间在做一个对新闻文本情感分析的项目。在此,用京东的商品评论练手,从数据采集到模型实现完整地写一遍,以备未来回顾所需。事实上,我采用的方法并不困难,甚至有点naive,所以权且作为练手吧。本文代码在公众号 datadw 里 回复 京东   即可获取。数据采集在这里为了避免人工标注的麻烦,使用的是京东iPa

2017-12-20 00:00:00 2801

转载 一战成名,用户贷款风险预测 参赛代码与数据集分享

向AI转型的程序员都关注了这个号???大数据挖掘DT数据分析  公众号: datadw队伍名“一战成名” 最终线上排名第七。 任务融360与平台上的金融机构合作,提供了近7万贷款用户的基本身份信息、消费行为、银行还款等数据信息,需要参赛者以此建立准确的风险控制模型,来预测用户是否会逾期还款。赛题:用户贷款风险预测(算法竞赛)http://www.pkbigdata.com/common/cmpt/

2017-12-19 00:00:00 5024 4

转载 用深度学习keras的cnn做图像识别分类,准确率达97%

向AI转型的程序员都关注了这个号???大数据挖掘DT数据分析  公众号: datadwKeras是一个简约,高度模块化的神经网络库。可以很容易和快速实现原型(通过总模块化,极简主义,和可扩展性)同时支持卷积网络(vision)和复发性的网络(序列数据)。以及两者的组合。无缝地运行在CPU和GPU上。keras的资源库网址为https://github.com/fchollet/kerasolive

2017-12-17 00:00:00 19434

转载 keras实战︱人脸表情分类与识别:人脸检测+情绪分类

向AI转型的程序员都关注了这个号???大数据挖掘DT数据分析  公众号: datadw脸识别热门,表情识别更加。但是表情识别很难,因为人脸的微表情很多,本节介绍一种比较粗线条的表情分类与识别的办法。本次讲述的表情分类是识别的分析流程分为:1、加载pre-model网络与权重;2、利用opencv的函数进行简单的人脸检测;3、抠出人脸的图并灰化;4、表情分类器检测一、表情数据集主要来源于kaggle

2017-12-16 00:00:00 6395

转载 [比赛记录] 主流机器学习模型模板代码+经验分享[xgb, lgb, Keras, LR]

向AI转型的程序员都关注了这个号???大数据挖掘DT数据分析  公众号: datadw最近打各种比赛,在这里分享一些General Model,稍微改改就能用的XGBoost调参大全: http://blog.csdn.net/han_xiaoyang/article/details/52665396 XGBoost 官方API: http://xgboost.readthedocs.io/en/

2017-12-15 00:00:00 10908 1

转载 R语言入门:大数据人才缺口巨大,现在学习还不晚

数据时代已经到来,但数据分析、数据挖掘人才却十分短缺,据全球顶尖管理咨询公司麦肯锡(McKinsey)一份详细分析报告显示:预计到 2018 年,大数据或者数据工作者的岗位需求将激增,其中大数据科学家的缺口在 14 万到 19 万之间,对于懂得如何利用大数据做决策的分析师和经理的岗位缺口则将达到 150 万!先来了解一下数据分析,就是以商业目的为驱动,所开展的获取数据、处理数据、分析数据、展示数据

2017-12-14 00:00:00 1044

转载 用keras对国产剧评论文本的情感进行预测

向AI转型的程序员都关注了这个号???大数据挖掘DT数据分析  公众号: datadwRNN即循环神经网络,其主要用途是处理和预测序列数据。在CNN中,神经网络层间采用全连接的方式连接,但层内节点之间却无连接。RNN为了处理序列数据,层内节点的输出还会重新输入本层,以实现学习历史,预测未来。 RNN的两个主要改进是LSTM(长短时记忆网络)和GRU(门控循环单元),二者为基本神经单元增加了额外的功

2017-12-13 00:00:00 1325 1

转载 AI系列免费公开课

AI领域人才奇缺,炙手可热的AI专业应届生年薪30万起步,AI毕业生基本不用找工作,都已经被企业早早预定。         AI人才究竟有多紧缺?据腾讯研究院《全球人工智能人才白皮书》报告数据,目前全球AI领域人才仅约30万,全球367所具有AI研究方向的高校,每年毕业AI领域学生仅约2万人,这个数据甚至远未达到国内500万AI人才需求,更不用说全球的AI人才缺口了。         不仅是人才短

2017-12-12 00:00:00 583

转载 神经网络中的激活函数具体是什么?为什么ReLu要好过于tanh和sigmoid function?

向AI转型的程序员都关注了这个号

2017-12-11 00:00:00 412

转载 TensorFlow实现深度学习算法的教程汇集:代码+笔记

向AI转型的程序员都关注了这个号

2017-12-10 00:00:00 1154 1

转载 上百份文字的检测与识别资源,包含数据集、code和paper

向AI转型的程序员都关注了这个号

2017-12-07 00:00:00 396

转载 排行榜top7的代码和说明文档分享_2017知乎机器学习算法挑战赛

大数据挖掘DT数据分析  公众号: datadw排行榜top7的代码和说明文档地址:在公众号 datadw 里 回复 知乎   即可获取。任务描述:参赛者需要根据知乎给出的问题及话题标签的绑定关系的训练数据,训练出对未标注数据自动标注的模型。大赛主页 https://biendata.com/competition/zhihu/

2017-12-06 00:00:00 768

转载 阿里流行音乐趋势预测-深度学习LSTM网络实现代码分享

向AI转型的程序员都关注了这个号

2017-12-05 00:00:00 871

转载 从0到1 | 0基础/转行 如何用3个月学会机器学习|数据科学

写这篇文章的初衷也是因为现在好多朋友都想了解如何入门/转行 机器学习或数据科学,搭上人工智能这列二十一世纪的快车。再加上这个问题每隔一阵子就会有人提及,因此想写篇文章来个一劳永逸。文章的宗旨:指出学习中的一些误区提供客观可行的学习表给出进阶学习的建议目标读者是:零基础,对人工智能感兴趣的读者有基础,想将机器学习/数据分析和自己

2017-12-04 00:00:00 447

转载 9个比赛7进top10,阿里天池大数据竞赛思路分享

向AI转型的程序员都关注了这个号

2017-12-03 00:00:00 2361 1

原创 京东JData算法大赛-高潜用户购买意向预测(github源码)

向AI转型的程序员都关注了这个号

2017-12-02 00:00:00 4560 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除