自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

数据分析

专注大数据、人工智能、移动/互联网、IT科技、电商/金融、数据分析/挖掘等领域的综合信息服务与分享平台。

  • 博客(1045)
  • 收藏
  • 关注

转载 干货 :超详细的AI 专家路线图!

本文约1800字,建议阅读6分钟本文将提供一组思路清晰、简单易懂的人工智能专家路线图。这个学习路线图几乎涵盖了人工智能领域的所有内容,点点鼠标,就能链接所需知识。想从事人工智能领域的研究,盲目地在网上购买了一本又一本的参考资料,学习视频刷了一遍又一遍…… 反过头来看,这些方法可能作用并不是很大,却消耗了大量的时间和金钱。这时,一种提纲式的学习途径就显得尤为重要了。如果你...

2022-05-30 08:12:59 309

转载 分享 :理解和管理社交媒体算法的4个想法

作者:Veronica Combs翻译:赵茹萱 校对:郑强本文约3700字,建议阅读10+分钟没有单一的解决方案能够让所有社交媒体算法都更加易于分析和理解。试想一下,如果科技公司必须公布有关算法如何工作的数据,而软件工程师在高等教育时期必须学习社会科学课程,那将会发生什么?麻省理工学院斯隆管理学院(MIT Sloan School of Management)教...

2022-05-25 07:53:51 625

转载 特征选择:11 种特征选择策略总结

来源:DeepHub IMBA本文约4800字,建议阅读10+分钟本文与你分享可应用于特征选择的各种技术的有用指南。太多的特征会增加模型的复杂性和过拟合,而太少的特征会导致模型的拟合不足。将模型优化为足够复杂以使其性能可推广,但又足够简单易于训练、维护和解释是特征选择的主要工作。“特征选择”意味着可以保留一些特征并放弃其他一些特征。本文的目的是概述一些特征选择策略:删除...

2022-05-18 08:08:01 750

转载 干货 :10 种聚类算法的完整 Python 操作示例

来源:海豚数据科学实验室本文约7000字,建议阅读14分钟本文将介绍一篇关于聚类的文章,10种聚类介绍和Python代码。聚类或聚类分析是无监督学习问题。它通常被用作数据分析技术,用于发现数据中的有趣模式,例如基于其行为的客户群。有许多聚类算法可供选择,对于所有情况,没有单一的最佳聚类算法。相反,最好探索一系列聚类算法以及每种算法的不同配置。在本教程中,你将发现如何在 ...

2022-05-13 08:03:32 1080

转载 干货 :浅谈云音乐活动数据分析体系

据不完全统计,云音乐仅2021年Q4就有近1000个活动在线,那么问题来了:怎样描述活动表现?如何评价活动好坏?怎么计算活动ROI?1背景云音乐平台上每天都有大大小小许多的活动,有些是服务于具体业务的垂直类活动:内容向:歌曲批量推广(恋恋记事簿);营收向:会员折扣促销;社区向:话题推广;用户运营向:深夜营地。还有一些活动看似与平台关系不大,放之四海皆可用,却广受拥趸,成就...

2022-05-11 08:10:00 285

转载 干货 :假设检验中的第一类错误和第二类错误

来源:Deephub Imba本文约3500字,建议阅读9分钟本文对统计假设检验期间发生的 Type-I和 Type-II 错误的直观而详细的解释。我们每天都在为选择进行自己的假设,并且按照自己认为最好的方向做出选择,所以假设在我们的生活中是无处不在的,例如:A 路是否会比 B 路花费更少的时间,X 的平均投资回报率是否高于 Y 的投资,以及电影 ABC 是否比电影 X...

2022-05-06 08:39:38 2804 1

转载 怎样考察报表工具的开发效率?

工具,本身就是为了解决各种重复性工作效率低下的问题而诞生的产物,报表工具也是工具,所以它的诞生,它的使命,也是为了提效!是为了提升数据信息化项目中报表的开发效率而诞生的但不同的工具,开发方式不同,效率自然也分高下。效率高的,不仅做起来简单方便,还能给项目上节省很多成本;效率低的,开发起来费事费力,不仅工程师受不了,常年累月无形中浪费掉的人工成本,企业也受不了那怎么才能选一...

2022-04-29 08:18:30 113

转载 干货 :时间信息编码为机器学习模型特征的三种方法(附链接)

作者:Eryk Lewinson 翻译:张睿毅 校对:张睿毅本文约4200字,建议阅读10分钟本文我们主要使用非常知名的Python包,以及依赖于一个相对不为人知的scikit-lego包。设置和数据在本文中,我们主要使用非常知名的Python包,以及依赖于一个相对不为人知的scikit-lego包,这是一个包含许多有用功能的库,这些功能正在扩展scikit-le...

2022-04-27 08:49:36 1401

转载 7种不同的数据标准化(归一化)方法总结

来源:DeepHub IMBA本文约1500字,建议阅读5分钟本文总结了 7 种常见的数据标准化(归一化)的方法。数据的归一化是数据预处理中重要的的一步,很多种方法都可以被称作数据的归一化,例如简单的去除小数位,而更高级归一化技术才能对我们训练有所帮助,例如 z-score 归一化。所以本文总结了 7 种常见的数据标准化(归一化)的方法。Decimal place no...

2022-04-22 07:51:13 4336

转载 年薪四十万起,这个证书厉害了!

真诚的向大家推荐,《腾讯课堂数据分析师认证课程》,该课程也是腾讯课堂指定认证课程。专为在校学生、0~3年职场新人量身定制,真正体系化、专业化帮大家提升数据分析能力,成为大厂抢手的数据分析人才。10种商业模型面对不同的场景,应用不同分析模型解决问题5W2H分析模型、AARRR分析模型、RFM客户价值模型、A/B 测试模型、用户分成模型、SWOT分析模型、购物篮分析模型、波士...

2022-04-18 08:06:38 143

转载 知识 :卷积神经网络性能优化

转自:AI蜗牛车、极市平台作者丨黎明灰烬来源|https://zhuanlan.zhihu.com/p/80361782引言卷积(Convolution)是神经网络的核心计算之一,它在计算机视觉方面的突破性进展引领了深度学习的热潮。卷积的变种丰富,计算复杂,神经网络运行时大部分时间都耗费在计算卷积,网络模型的发展在不断增加网络的深度,因此优化卷积计算就显得尤为重要。随着技...

2022-04-15 08:02:38 708

转载 这个小清新统计可视化工具太赞了~~

最近小编在查阅资料的时候发现一个超喜欢的可视化绘制工具-R-smplot,本来想着忙完这段时间给大家直播的时候再系统介绍,但随着对这个工具的学习,还是决定现在就推荐给大家。好了,话不多说,我们直接开始,今天推文的主要内容如下:R-smplot包简单介绍R-smplot包案例介绍R-smplot包简单介绍R-smplot包,sm为simple(简单)的简称,意为使R进行可...

2022-04-13 07:46:01 302

转载 统计、可视化两不误,这个多达19种可视化技能一定要掌握~~

小伙伴们非要私信要R语言的统计可视化工具,推给你~~今日小编继续给大家推荐优质绘图工具,帮助小伙伴们更好的是实现不同领域中可视化作品的快速绘制。今天的主角为R-grafify包,其包含5大类共19种可视化图表,舒适和符合出版要求的配色更是为这个可视化包填色,下面就通过以下两个方面介绍下整个优质可视化工具。R-grafify介绍R-grafify样例介绍R-grafify介...

2022-04-07 07:33:44 185

转载 超赞的6个免费在线可视化资源,推荐收藏~~

这一期,小编就给大家推荐如何去实现那么多种图表的在线可视化技巧(由于小编使用R进行可视化绘制较多,这里主要介绍关于R语言的)。主要内容如下:优质在线可视化书籍介绍优质在线可视化技巧介绍优质在线可视化书籍介绍这一部分小编主要介绍一下关于使用R或R-ggplot2包进行可视化绘制的优质在线可视化书籍,介绍的每一本在线书籍都有非常多的示例和基础的绘制代码,详细内容如下:Fund...

2022-04-05 08:22:47 339

转载 考研最卷的专业,我们替你查到了!

作为高考之后第二次改变人生的重要机会,考研一直都是一个热门话题,一届届毕业生前仆后继而来,有欣喜上岸的,也有越挫越勇的,一战、二战、三战…不管是为了曾经的理想,还是不可知的未来,考研,似乎成了进入社会的保命符,无数人拼命想拿到这张通行证。在清博舆情系统中,而我们也可以看出大家对考研真的是又爱又恨。而随着考研大军的日益壮大,各个专业的内卷情况也越来越严重。今年的国家线一出,...

2022-03-31 08:20:00 264

转载 超简单的统计结果可视化工具,推荐~~

小编在查阅资料时发现一个宝藏可视化包-R-see,该包可以将数据的统计计算结果、模型参数、预测结果以及性能估算等使用合理的可视化方式展现,帮助使用者利用可视化来获得更多信息、可交流和全面的科学报告。话不多说,接下来就让小编带大家感受下这个包的魅力(其中可能涉及统计分析知识,后期和Python一起讲解,本期只关注其可视化部分)R-see包工作原理得益于easystats项目...

2022-03-30 07:22:25 930

转载 2022帆软BI数据分析大赛重磅来袭!瓜分20W奖金!

近期看到2022 帆软 BI 数据分析大赛,感觉非常不错,我建议所有喜欢数据分析,想学数据分析的朋友都报名参加,理由非常直接:免费报名,报表实战锻炼能力主办方贴心提供工具、数据源结识到各行业的数据精英同行专属导师答疑 + 4 场直播贯穿全程赢取求职内推权益,助力你的职业发展40W 助学基金 + 奖项权益等你来拿越早报名,你就越多时间准备,更多详情请查看下方的介绍。点击下...

2022-03-29 08:20:00 522

转载 太强了!60 种可视化图表制作工具和使用场景(推荐收藏)

可视化图表种类如此之多,什么场景下应该用什么图表展示,是一个让人头秃的难题。数据可视化的爱好者Severino Ribecca,他在自己的网站上收录了 60 种可视化图表样式以及它们分别适用于什么样的场景,并且推荐了相应的制作工具。值得一看。点阵图点阵图表 (Dot Matrix Chart) 以点为单位显示离散数据,每种颜色的点表示一个特定类别,并以矩阵形式组合在一起。...

2022-03-29 08:20:00 1819

转载 干货 :数据科学家指南:梯度下降与反向传播算法

作者:Richmond Alake翻译:陈之炎校对:zrx本文约3300字,建议阅读5分钟本文旨在为数据科学家提供一些基础知识,以理解在训练神经网络时所需调用的底层函数和方法。人工神经网络[ANN)是人工智能技术的基础,同时也是机器学习模型的基础。它们模拟人类大脑的学习过程,赋予机器完成特定类人任务的能力。数据科学家的目标是利用公开数据来解决商业问题。通常,利用...

2022-03-24 17:51:39 1199

转载 数据哪里找?200个源数据网站全给你!

作者:王术,发表于知乎来源:https://www.zhihu.com/question/22698541/answer/22367802;部分内容来自网络01 搜索引擎搜索引擎是我们信息资料搜集的最重要的渠道之一,用搜索引擎查找信息资料需要使用恰当的关键词和一些搜索技巧。目前国内主要的搜集引擎有如下10个,近期还有较多行业型搜索冒出来,需找专业型行业资料可以使用行业型搜...

2022-03-22 08:05:14 10779

转载 推荐 :主成分分析用于可视化(附链接)

作者:Adrian Tam, Ray Hong, Jinghan Yu, Brendan Artley;翻译:汪桉旭;校对:吴振东本文约3300字,建议阅读5分钟本文教你了解了如何使用主...

2022-03-15 07:50:03 347

转载 机器学习理论基础到底有多可靠?

知其然,知其所以然。机器学习领域近年的发展非常迅速,然而我们对机器学习理论的理解还很有限,有些模型的实验效果甚至超出了我们对基础理论的理解。目前,领域内越来越多的研究者开始重视和反思这个问...

2022-03-10 16:43:11 105

原创 一个老师的困惑SPSS解决了

傍晚,在老家当老师的老同学突然微信我。说:“你这个做数据的,有没有什么方式帮我快速处理分析一些学生相关的数据?” 。我想了想回复说:“目前,互联网行业常用的是Python,传统行业常用的是...

2022-03-08 20:35:11 240

转载 终于来了!腾讯数据分析证书!

真诚的向大家推荐,《腾讯课堂数据分析师认证课程》,该课程也是腾讯课堂指定认证课程。专为在校学生、0~3年职场新人量身定制,真正体系化、专业化帮大家提升数据分析能力,成为大厂抢手的数据分析人...

2022-03-07 08:10:40 546

转载 六个深度学习常用损失函数总览:基本形式、原理、特点

来源:极市平台本文共4500字,建议阅读8分钟本文将介绍机器学习、深度学习中分类与回归常用的几种损失函数。机器学习中的监督学习本质上是给定一系列训练样本,尝试学习的映射关系,使得...

2022-03-02 08:23:05 255

转载 滑雪最烧钱的地方,在医院骨科

2022 年的北京冬奥会,不仅点燃了大家的冰雪运动热情,还带火了一众上市公司——冰雪概念股、冰墩墩概念股,还有骨科概念股。前两个被看好能理解,但骨科概念股也从一众比谷爱凌跳得还秀的股票中脱...

2022-02-22 08:15:37 288

转载 推荐 :增强数据库管理:一份简单的综述

作者:Mayuresh Joshi翻译:王可汗 校对:赵茹萱本文约1300字,建议阅读6分钟本文教你如何利用LSTM网络预测股价走势,并对开盘和收盘价进行可视化。一个高效设计的数...

2022-02-18 08:23:19 127

转载 推荐 :5个只有少数程序员知道的用例

作者:Shalitha Suranga 翻译:闫晓雨 校对:赵茹萱本文约2900字,建议阅读6分钟。Python不仅能够应用于数据科学和Web后端——还可以做更多的事。照片由Chr...

2022-02-16 08:08:58 224

转载 超全!52个数据可视化图表鉴赏~~

一、数据可视化是关于数据视觉表现形式的科学技术研究。其中,这种数据的视觉表现形式被定义为,一种以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量。它是一个处于不断演变之中的概念...

2022-02-10 10:59:38 4895

转载 浅析机器学习算法的应用场景!

本文约3200字,建议阅读10分钟本篇文章介绍了机器学习算法的应用场景。在学习算法的过程里,难免有疑问:k近邻、贝叶斯、决策树、svm、逻辑斯蒂回归和最大熵模型、隐马尔科夫、条件随机场、...

2022-02-08 08:40:40 4372

转载 推荐 :浅谈用户全生命周期管理

导读:今天我们邀请到了云音乐的张毅老师,给大家分享他对于用户全生命周期运营的思考和总结,从定义到周期划分,用户分层定义,到后续运营策略方式,系统建设、数据体系等逐步探讨。一、用户生命周期定...

2022-01-25 08:20:26 1614

转载 推荐 :一个好的事件跟踪字典是什么样的?

作者:Crystal Widjaja 翻译:殷之涵 校对:王可汗本文约7700字,建议阅读15+分钟本文将从作者的亲身经历循序渐进地带你定位大多数事件分析出错的根本原因并给出解决...

2022-01-20 08:07:10 221

转载 概述:机器学习和大数据技术在信贷风控场景中的应用

本文约5400字,建议阅读10分钟;内容来源:知乎;本文简要概述在当前大数据和机器学习技术如何在信贷风控场景下的常见应用。似乎一夜之间,所有的互联网公司在对外的宣传稿中都会提及自己使用机器...

2022-01-18 08:04:21 1748

转载 推荐 :为什么大多数分析工作都以失败告终

作者:Crystal Widjaja 翻译:殷之涵 校对:王可汗本文约5400字,建议阅读11分钟本文将从作者的亲身经历循序渐进地带你定位大多数事件分析出错的根本原因并给出解决...

2022-01-14 08:16:58 319

转载 可视化图表不会做!?这6个免费在线可视化资源送给你

介绍完优秀的可视化类别网站后(可视化图表种类不清楚?这两个宝藏参考网址推荐给你~~),这一期,小编就给大家推荐如何去实现那么多种图表的在线可视化技巧(由于小编使用R进行可视化绘制较多,这里...

2022-01-10 08:10:12 775

转载 可视化图表种类还不清楚?快来看看这两个宝藏网站吧~~

有很多读者私信小编“有啥系统介绍可视化类型的学习和参考资料?”。小编平时在绘制可视化作品时,也会对种类繁多的可视化图表选择和系统绘制无从下手。今天,小编就推荐平时自己参考的可视化表种类网站...

2022-01-06 08:21:39 392

转载 大数据告诉你,中国今年最火打卡圣地竟然是它!

有没有发现,年轻人越来越追捧传统文化了?河南卫视推出《唐宫夜宴》后,一时间几个唐宫少女居然霸屏了各大头条,引起千万人围观。三星堆出土新文物的消息,也让年轻人开始考虑周边雪糕该买“出土味”还...

2022-01-04 08:11:45 683

转载 检索、问答、情感分析产业范例分享,代码模型全开源太香了!

自然语言处理技术在各行业有着广泛的应用,然而长久以来,其落地并不是一帆风顺的。针对这些棘手的问题,百度飞桨深耕产业界,选取NLP领域三大高频场景——检索、问答、情感分析,推出面向真实应用场...

2021-12-30 08:14:54 179

转载 考研最卷的专业,我提名新传

不少专业的研究生统招考试都是一场“千军万马过独木桥”的残酷竞争,只是有的专业卷得明明白白,而有的专业多少让人意想不到 ——“钱途”一般,却也能卷上天,比如新传。新传,指的是新闻传播类学科,...

2021-12-30 08:14:54 467

转载 如何打造业务系统的数据生产力

我们要的不是数据记录,而是能够产生业务价值的数据记录;我们要的不是数据看板,而是能够产生业务价值的数据看板;我们要的不是数据中台,而是能够产生业务价值的数据中台;我们要的不是数据闭环,而是...

2021-12-27 15:15:43 383

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除