数据分析v
码龄5年
  • 1,272,664
    被访问
  • 9
    原创
  • 5,101
    排名
  • 1,129
    粉丝
关注
提问 私信
  • 加入CSDN时间: 2017-08-07
博客简介:

数据分析

博客描述:
专注大数据、人工智能、移动/互联网、IT科技、电商/金融、数据分析/挖掘等领域的综合信息服务与分享平台。
查看详细资料
个人成就
  • 获得618次点赞
  • 内容获得128次评论
  • 获得3,869次收藏
创作历程
  • 36篇
    2022年
  • 156篇
    2021年
  • 176篇
    2020年
  • 177篇
    2019年
  • 328篇
    2018年
  • 16篇
    2017年
成就勋章
  • 最近
  • 文章
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

分享 :理解和管理社交媒体算法的4个想法

作者:Veronica Combs翻译:赵茹萱 校对:郑强本文约3700字,建议阅读10+分钟没有单一的解决方案能够让所有社交媒体算法都更加易于分析和理解。试想一下,如果科技公司必须公布有关算法如何工作的数据,而软件工程师在高等教育时期必须学习社会科学课程,那将会发生什么?麻省理工学院斯隆管理学院(MIT Sloan School of Management)教...
转载
发布博客 昨天 07:53 ·
0 阅读 ·
0 点赞 ·
0 评论

特征选择:11 种特征选择策略总结

来源:DeepHub IMBA本文约4800字,建议阅读10+分钟本文与你分享可应用于特征选择的各种技术的有用指南。太多的特征会增加模型的复杂性和过拟合,而太少的特征会导致模型的拟合不足。将模型优化为足够复杂以使其性能可推广,但又足够简单易于训练、维护和解释是特征选择的主要工作。“特征选择”意味着可以保留一些特征并放弃其他一些特征。本文的目的是概述一些特征选择策略:删除...
转载
发布博客 2022.05.18 ·
15 阅读 ·
0 点赞 ·
0 评论

干货 :10 种聚类算法的完整 Python 操作示例

来源:海豚数据科学实验室本文约7000字,建议阅读14分钟本文将介绍一篇关于聚类的文章,10种聚类介绍和Python代码。聚类或聚类分析是无监督学习问题。它通常被用作数据分析技术,用于发现数据中的有趣模式,例如基于其行为的客户群。有许多聚类算法可供选择,对于所有情况,没有单一的最佳聚类算法。相反,最好探索一系列聚类算法以及每种算法的不同配置。在本教程中,你将发现如何在 ...
转载
发布博客 2022.05.13 ·
47 阅读 ·
0 点赞 ·
0 评论

干货 :浅谈云音乐活动数据分析体系

据不完全统计,云音乐仅2021年Q4就有近1000个活动在线,那么问题来了:怎样描述活动表现?如何评价活动好坏?怎么计算活动ROI?1背景云音乐平台上每天都有大大小小许多的活动,有些是服务于具体业务的垂直类活动:内容向:歌曲批量推广(恋恋记事簿);营收向:会员折扣促销;社区向:话题推广;用户运营向:深夜营地。还有一些活动看似与平台关系不大,放之四海皆可用,却广受拥趸,成就...
转载
发布博客 2022.05.11 ·
15 阅读 ·
0 点赞 ·
0 评论

干货 :假设检验中的第一类错误和第二类错误

来源:Deephub Imba本文约3500字,建议阅读9分钟本文对统计假设检验期间发生的 Type-I和 Type-II 错误的直观而详细的解释。我们每天都在为选择进行自己的假设,并且按照自己认为最好的方向做出选择,所以假设在我们的生活中是无处不在的,例如:A 路是否会比 B 路花费更少的时间,X 的平均投资回报率是否高于 Y 的投资,以及电影 ABC 是否比电影 X...
转载
发布博客 2022.05.06 ·
210 阅读 ·
0 点赞 ·
0 评论

怎样考察报表工具的开发效率?

工具,本身就是为了解决各种重复性工作效率低下的问题而诞生的产物,报表工具也是工具,所以它的诞生,它的使命,也是为了提效!是为了提升数据信息化项目中报表的开发效率而诞生的但不同的工具,开发方式不同,效率自然也分高下。效率高的,不仅做起来简单方便,还能给项目上节省很多成本;效率低的,开发起来费事费力,不仅工程师受不了,常年累月无形中浪费掉的人工成本,企业也受不了那怎么才能选一...
转载
发布博客 2022.04.29 ·
13 阅读 ·
0 点赞 ·
0 评论

干货 :时间信息编码为机器学习模型特征的三种方法(附链接)

作者:Eryk Lewinson 翻译:张睿毅 校对:张睿毅本文约4200字,建议阅读10分钟本文我们主要使用非常知名的Python包,以及依赖于一个相对不为人知的scikit-lego包。设置和数据在本文中,我们主要使用非常知名的Python包,以及依赖于一个相对不为人知的scikit-lego包,这是一个包含许多有用功能的库,这些功能正在扩展scikit-le...
转载
发布博客 2022.04.27 ·
48 阅读 ·
0 点赞 ·
0 评论

7种不同的数据标准化(归一化)方法总结

来源:DeepHub IMBA本文约1500字,建议阅读5分钟本文总结了 7 种常见的数据标准化(归一化)的方法。数据的归一化是数据预处理中重要的的一步,很多种方法都可以被称作数据的归一化,例如简单的去除小数位,而更高级归一化技术才能对我们训练有所帮助,例如 z-score 归一化。所以本文总结了 7 种常见的数据标准化(归一化)的方法。Decimal place no...
转载
发布博客 2022.04.22 ·
815 阅读 ·
0 点赞 ·
0 评论

年薪四十万起,这个证书厉害了!

真诚的向大家推荐,《腾讯课堂数据分析师认证课程》,该课程也是腾讯课堂指定认证课程。专为在校学生、0~3年职场新人量身定制,真正体系化、专业化帮大家提升数据分析能力,成为大厂抢手的数据分析人才。10种商业模型面对不同的场景,应用不同分析模型解决问题5W2H分析模型、AARRR分析模型、RFM客户价值模型、A/B 测试模型、用户分成模型、SWOT分析模型、购物篮分析模型、波士...
转载
发布博客 2022.04.18 ·
18 阅读 ·
0 点赞 ·
0 评论

知识 :卷积神经网络性能优化

转自:AI蜗牛车、极市平台作者丨黎明灰烬来源|https://zhuanlan.zhihu.com/p/80361782引言卷积(Convolution)是神经网络的核心计算之一,它在计算机视觉方面的突破性进展引领了深度学习的热潮。卷积的变种丰富,计算复杂,神经网络运行时大部分时间都耗费在计算卷积,网络模型的发展在不断增加网络的深度,因此优化卷积计算就显得尤为重要。随着技...
转载
发布博客 2022.04.15 ·
149 阅读 ·
0 点赞 ·
0 评论

这个小清新统计可视化工具太赞了~~

最近小编在查阅资料的时候发现一个超喜欢的可视化绘制工具-R-smplot,本来想着忙完这段时间给大家直播的时候再系统介绍,但随着对这个工具的学习,还是决定现在就推荐给大家。好了,话不多说,我们直接开始,今天推文的主要内容如下:R-smplot包简单介绍R-smplot包案例介绍R-smplot包简单介绍R-smplot包,sm为simple(简单)的简称,意为使R进行可...
转载
发布博客 2022.04.13 ·
32 阅读 ·
0 点赞 ·
0 评论

统计、可视化两不误,这个多达19种可视化技能一定要掌握~~

小伙伴们非要私信要R语言的统计可视化工具,推给你~~今日小编继续给大家推荐优质绘图工具,帮助小伙伴们更好的是实现不同领域中可视化作品的快速绘制。今天的主角为R-grafify包,其包含5大类共19种可视化图表,舒适和符合出版要求的配色更是为这个可视化包填色,下面就通过以下两个方面介绍下整个优质可视化工具。R-grafify介绍R-grafify样例介绍R-grafify介...
转载
发布博客 2022.04.07 ·
23 阅读 ·
0 点赞 ·
0 评论

超赞的6个免费在线可视化资源,推荐收藏~~

这一期,小编就给大家推荐如何去实现那么多种图表的在线可视化技巧(由于小编使用R进行可视化绘制较多,这里主要介绍关于R语言的)。主要内容如下:优质在线可视化书籍介绍优质在线可视化技巧介绍优质在线可视化书籍介绍这一部分小编主要介绍一下关于使用R或R-ggplot2包进行可视化绘制的优质在线可视化书籍,介绍的每一本在线书籍都有非常多的示例和基础的绘制代码,详细内容如下:Fund...
转载
发布博客 2022.04.05 ·
57 阅读 ·
0 点赞 ·
0 评论

考研最卷的专业,我们替你查到了!

作为高考之后第二次改变人生的重要机会,考研一直都是一个热门话题,一届届毕业生前仆后继而来,有欣喜上岸的,也有越挫越勇的,一战、二战、三战…不管是为了曾经的理想,还是不可知的未来,考研,似乎成了进入社会的保命符,无数人拼命想拿到这张通行证。在清博舆情系统中,而我们也可以看出大家对考研真的是又爱又恨。而随着考研大军的日益壮大,各个专业的内卷情况也越来越严重。今年的国家线一出,...
转载
发布博客 2022.03.31 ·
81 阅读 ·
0 点赞 ·
0 评论

超简单的统计结果可视化工具,推荐~~

小编在查阅资料时发现一个宝藏可视化包-R-see,该包可以将数据的统计计算结果、模型参数、预测结果以及性能估算等使用合理的可视化方式展现,帮助使用者利用可视化来获得更多信息、可交流和全面的科学报告。话不多说,接下来就让小编带大家感受下这个包的魅力(其中可能涉及统计分析知识,后期和Python一起讲解,本期只关注其可视化部分)R-see包工作原理得益于easystats项目...
转载
发布博客 2022.03.30 ·
76 阅读 ·
0 点赞 ·
0 评论

2022帆软BI数据分析大赛重磅来袭!瓜分20W奖金!

近期看到2022 帆软 BI 数据分析大赛,感觉非常不错,我建议所有喜欢数据分析,想学数据分析的朋友都报名参加,理由非常直接:免费报名,报表实战锻炼能力主办方贴心提供工具、数据源结识到各行业的数据精英同行专属导师答疑 + 4 场直播贯穿全程赢取求职内推权益,助力你的职业发展40W 助学基金 + 奖项权益等你来拿越早报名,你就越多时间准备,更多详情请查看下方的介绍。点击下...
转载
发布博客 2022.03.29 ·
138 阅读 ·
0 点赞 ·
0 评论

太强了!60 种可视化图表制作工具和使用场景(推荐收藏)

可视化图表种类如此之多,什么场景下应该用什么图表展示,是一个让人头秃的难题。数据可视化的爱好者Severino Ribecca,他在自己的网站上收录了 60 种可视化图表样式以及它们分别适用于什么样的场景,并且推荐了相应的制作工具。值得一看。点阵图点阵图表 (Dot Matrix Chart) 以点为单位显示离散数据,每种颜色的点表示一个特定类别,并以矩阵形式组合在一起。...
转载
发布博客 2022.03.29 ·
251 阅读 ·
0 点赞 ·
0 评论

干货 :数据科学家指南:梯度下降与反向传播算法

作者:Richmond Alake翻译:陈之炎校对:zrx本文约3300字,建议阅读5分钟本文旨在为数据科学家提供一些基础知识,以理解在训练神经网络时所需调用的底层函数和方法。人工神经网络[ANN)是人工智能技术的基础,同时也是机器学习模型的基础。它们模拟人类大脑的学习过程,赋予机器完成特定类人任务的能力。数据科学家的目标是利用公开数据来解决商业问题。通常,利用...
转载
发布博客 2022.03.24 ·
53 阅读 ·
0 点赞 ·
0 评论

数据哪里找?200个源数据网站全给你!

作者:王术,发表于知乎来源:https://www.zhihu.com/question/22698541/answer/22367802;部分内容来自网络01 搜索引擎搜索引擎是我们信息资料搜集的最重要的渠道之一,用搜索引擎查找信息资料需要使用恰当的关键词和一些搜索技巧。目前国内主要的搜集引擎有如下10个,近期还有较多行业型搜索冒出来,需找专业型行业资料可以使用行业型搜...
转载
发布博客 2022.03.22 ·
687 阅读 ·
0 点赞 ·
0 评论

推荐 :主成分分析用于可视化(附链接)

作者:Adrian Tam, Ray Hong, Jinghan Yu, Brendan Artley;翻译:汪桉旭;校对:吴振东本文约3300字,建议阅读5分钟本文教你了解了如何使用主...
转载
发布博客 2022.03.15 ·
94 阅读 ·
0 点赞 ·
0 评论
加载更多