自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(643)
  • 收藏
  • 关注

转载 时隔500天后,对比Excel系列又一新书发布

时隔500天后,对比Excel系列的又一本新书发布,本来这本书应该早出现在大家面前了,因为最近一年工作有些忙,所以一直拖到了现在。新书就是下面这本《对比Excel,轻松学习Python报表...

2021-10-12 09:00:00 354 1

转载 新书发布:时隔一年,我的第二本书终于来了

在大家的日夜催更下,我的第二本书终于上市了。我是怎么都没想到我能写书,更是没想到我写了一本以后还能再写一本,而且第一本竟然卖成了畅销书。是多么一次有趣的经历哈。下面这本书就是今天的主角:...

2020-05-29 09:00:00 564

转载 『对比Excel,轻松学习Python数据分析』新书发布

之前在公众号提过,我写了一本书,现在这本书终于面世了,这本书就是『对比Excel,轻松学习Python数据分析』,这本书是写什么的,以及这本书怎么写的,相信大家通过书名就能了解一二,但还...

2019-02-20 20:15:45 979

转载 人人都需要懂点商业分析,一本书洞察真实商业世界的逻辑与策略

优衣库的商品为什么总是定期降价?星巴克的咖啡为什么有中杯,大杯,超大杯三个价格?奢侈品店为什么经常推出空气马甲,钢丝球?提高商品的毛利率和商品摆放位置有什么关系?库存积压,商品滞销背后的第一责任人是谁?新产品进入市场第一步应该做什么?为什么要打价格战?具体又该怎么操作?如果你也对这些问题感兴趣,那么推荐阅读一下《商业分析:洞察真实商业世界的逻辑与策略》这本新书!为什么要写这本书?1946 年,现代...

2024-05-22 09:03:02 3

转载 再版到第14版,连续25年美国统计类教材首选,这本统计学神书中文版来啦!

你见过不断更新再版到第14版的统计学书吗?我们说,评价一本书好坏可以参照的一个标准就是其再版次数,一本书可以出版到第14版,可见其畅销经典程度!而且这本书连续25年在美国统计类教材排名第一,已被翻译成多国文字,堪称国际版统计教材!这本神书就是《基础统计学(第14版)(双色)》!对每一位学习统计学的小伙伴来说,它就是案头宝典级的存在!为什么学习统计学统计学是我们认识外部世界的基本工具,无论是自然科学...

2024-05-15 09:00:28 28

转载 第一批用AI做数据分析的人,工资已经碾压同事了!

「AI大模型人才培养计划」适用所有程序员2024年,AI在国内市场全面大爆发,不断涌现出新的算法、模型和应用场景,各行各业的垂类大模型应用也迎来井喷期。无论是Google、百度、阿里等互联网巨头,还是中小型的科技公司都在高薪挖AI大模型人才。接下来,AI产品的市场需求势必飙升,大模型人才将更炙手可热,大家现在开始入局AI,迟早年薪100W!为帮助普通程序员了解人工智能前沿趋势,学习AI大模型技术,...

2024-05-12 09:01:04 13

转载 太全了!14 种数据异常检测方法总结!

本文收集整理了公开网络上一些常见的异常检测方法(附资料来源和代码)。不足之处,还望批评指正。一、基于分布的方法1. 3sigma基于正态分布,3sigma准则认为超过3sigma的数据为异常点。图1: 3sigmadefthree_sigma(s):mu,std=np.mean(s),np.std(s)lower,upper=mu-3*std,mu+3*std...

2024-05-08 09:00:49 14

转载 我常遇到的8个数据可视化的错误,值得借鉴

来源:DeepHub IMBA我做了将近8年的数据分析工作,绘制过不计其数的可视化图表,但仍会犯一些低级错误,比如色彩、图表、标签使用不当等,这会导致信息传递的低效和错误。对于很多新手而言,可视化更是需要多注意,避免传递无效乃至错误的信息,这非常非常的重要。在当今以数据驱动为主导的世界里,清晰且具有洞察力的数据可视化至关重要。然而,在创建数据可视化时很容易犯错误,这可能导致对数据的错误解读。本文将...

2024-05-06 09:00:57 15

转载 Python也可以合并和拆分PDF,批量高效!

PDF是最方便的文档格式,可以在任何设备原样且无损的打开,但因为PDF不可编辑,所以很难去拆分合并。知乎上也有人问,如何对PDF进行合并和拆分?看很多回答推荐了各种PDF编辑器或者网站,确实方法比较多。但这种软件的弊端在于很难去批量操作,比如你有几百个PDF要合并,使用软件会非常麻烦。而且很多软件是收费的,本来PDF合并拆分也不是什么难事,赚的是信息差的钱。我一般会用Python的PyPDF2库来...

2024-04-22 09:00:46 26

转载 在编程中使用中文到底该不该??

看到知乎上有个热门问题,为什么很多人反对中文在编程中的使用?这个问题有几百万的浏览热度,其中排名第一的回答非常简洁,我深以为然:在国内做开发,用中文写注释、写文档,是非常好的习惯,因为太缺优秀的中文文档了,目之所及很多框架都没有完整的中文文档。除此之外,其他形式用中文硬替代英文的编程行为,都有点化简为繁、舍易求难的味道。包括但不限于,用中文变量名、用中文解释关键字、用中文字段名、用中文文件名和路径...

2024-04-18 09:00:25 21

原创 盘点下哪些大模型可以直接上传分析Excel文件?

现在各家大模型基本陆续都支持文档解读功能了,这篇我们就对头部各家模型对Excel表的上传解读能力做个测试。下表为SuperCLUE 2024年2月出品的大模型总排行榜,我们主要对头部的做一些测试。1. 文心一言文心一言目前支持PDF文档上传,但是不支持Excel文件的上传。2. 智谱清言智谱清言支持各种格式的文件上传,当然也包括Excel文件的上传。智谱清言不仅支持Excel文件的上传,还支持对文...

2024-04-15 09:02:16 547 1

转载 Pandas + ChatGPT:交互式数据分析

来源:数据STUDIOPython Pandas是一个为Python编程提供数据操作和分析功能的开源工具包。这个库已经成为数据科学家和分析师的必备工具。它提供了一种有效的法来管理结构化数据(Series和DataFrame)。在人工智能领域,Pandas经常用于机器学习和深度学习过程的预处理步骤。Pandas通过提供数据清理、重塑、合并和聚合,可以将原始数据集转换为结构化的、随时可用的2维表格,并...

2024-04-09 09:02:37 29

原创 年薪百万35岁退休可以领多少养老金?

1.前言上一篇年薪百万需要交多少税?发出以后,有读者问到年薪百万到退休时可以领多少养老金。在开始具体测算前,我们需要考虑个实际情况,那就是互联网人比较容易做到年薪百万,同时也容易到35岁「被动退休」。所以这篇我们就来测算下年薪百万到35岁「被动退休」可以领多少养老金?2.养老金整体计算逻辑总的养老金由两部分组成:总养老金 = 个人账户养老金 + 统筹账户养老金2.1个人账户养老金个人账户养老金就是...

2024-04-07 09:01:10 566

原创 迄今为止用过最实用的AI应用

前言今天给大家推荐一款AI应用「360AI搜索」,这是我个人迄今为止用过最实用的AI应用。大模型出来以后,有很多基于大模型的应用,我也尝试过很多。但基本都是图新鲜,尝试过后,基本就很少使用了。而我尝试了「360AI搜索」以后,我把它加入了我的浏览器书签。接下来给大家介绍下,我推荐的几个理由。推荐理由基于搜索结果的智能总结搜索应该是我们日常工作中使用频率比较高的一个功能。当我们使用常规的搜索要找到我...

2024-04-01 09:00:28 265

转载 87页资料下载 | 四大行业12家数字化案例

随着全球经济走向新的宏观周期,企业面临的挑战也随之发生了变化。在这个快速变化的环境中,“不确定性”已经取代了“稳定性”成为了企业的首要关注点。为了帮助企业更好地应对这一挑战,《2024企业敏捷经营实践合集》可以提供有价值的参考实践。该合集汇集了来自金融、零售消费、互联网及高端制造四大行业、12家先进企业的BI数字化实践,包括数禾科技、某券商、舍得酒业、维他奶、张亮集团、水滴公司、上汽飞凡、零跑汽车...

2024-03-26 09:01:30 25

转载 使用Pandas 玩转透视表(pivot_table)

来源:pbpython 编译:伯乐在线-PyPer介绍也许大多数人都有在Excel中使用数据透视表的经历,其实Pandas也提供了一个类似的功能,名为 pivot_table。虽然pivot_table非常有用,但是我发现为了格式化输出我所需要的内容,经常需要记住它的使用语法。所以,本文将重点解释pandas中的函数 pivot_table,并教大家如何使用它来进行数据分析。如果你对这...

2024-03-25 09:00:14 70

转载 Pandas表格样式设置,超好看!

今天给大家介绍如何给Pandas DataFrame添加颜色和样式。通过这一方法,增强数据的呈现,使信息的探索和理解不仅内容丰富,而且具有视觉吸引力。Pandas Styler是Pandas库中的一个模块,它提供了创建DataFrame的HTML样式表示的方法。此功能允许在可视化期间自定义DataFrame的视觉外观。Pandas Styler的核心功能在于能够根据特定条件对单元格进行突出显示、着...

2024-03-18 09:01:10 31

转载 总结了90条简单实用的Python编程技巧!

来源丨网络编码原则建议1:理解 Pythonic 概念—-详见 Python 中的《Python之禅》建议2:编写 Pythonic 代码(1)避免不规范代码,比如只用大小写区分变量、使用容易混淆的变量名、害怕过长变量名等。有时候长的变量名会使代码更加具有可读性。(2)深入学习 Python 相关知识,比如语言特性、库特性等,比如Python演变过程等。深入学习一两个业内公认的 Pythonic ...

2024-03-11 09:00:27 24

转载 真心建议数据人冲一冲新兴领域,工资高前景好

随着AI大热“AI大模型”无疑是相当火爆的话题!Google、百度、腾讯等等巨头互联网公司,无不在布局人工智能技术和市场,都在开出高薪,挖掘会使用 AI 的数据人才!作为数据人,如何不被时代抛弃,享受AI技术带来的红利?!????知乎知学堂特发起:行业前沿资源——AI大模型公开课已为本号粉丝开通免费领取权限预计24小时后关闭通道!速进!AI大模型-重塑数据人核心竞争力(不限年龄!不限岗位!产品相关人...

2024-03-09 11:28:29 29

转载 2000字精华总结,安利一个超好用的Pandas数据挖掘分析神器

今天给大家介绍一款用于做EDA(探索性数据分析)的利器,并且可以自动生成代码,帮助大家极大节省工作时间与提升工作效率的利器,叫做Bamboolib。大家可以将其理解为是Pandas的GUI扩展工具,所具备的功能有查看DataFrame数据集与Series数据集过滤数据数据的统计分析绘制交互式图表文本数据的操作数据清洗与类型转换合并数据集安装模块在使用之前,我们先需要通过pip install进行该...

2024-03-06 09:00:55 26

原创 年薪百万需要交多少税?

1.前言最近又开始一年一度的个税申报了,每次看着个税APP上那么多指标都会比较疑惑,这些指标之间的关系是什么?个人所得税是怎么算出来的?趁着周末的时间就专门了解了下个税的计算逻辑,也顺便来推测下,如果年薪百万的话,需要交多少税。2.个税整体计算逻辑下图为个税APP上关于个税计算的汇总结果,对于普通打工人来讲主要涉及到标记出来的8个指标(下图中1-8的数字是我手动标记上的,不是个税APP自带的):2...

2024-03-04 09:00:09 980

原创 文心一言你的Demo样例可以优化下吗?

百度的文心大模型3.5就可以使用插件功能,其中的「E言易图」是专门用于生成图表的插件,最近体验了下这个插件,真的是一言难尽。1.直接使用官方样例提示词选中这个插件以后,会有官方样例提示词,直接点击这个就好,这也是接下来最无语的地方了。2.官方样例返回了个啥?用了官方样例提示词以后,返回了个啥?创建的样例数据中录取率竟然不是数值,而是录取率1、录取率2这样的字符串?因为样例数据是字符串,所以图也没正...

2024-02-26 09:02:59 504

原创 我的2023年度总结

今天是腊月廿七,又到了写年度总结的时候了,这是写年度总结的第八个年头,希望可以一直坚持写下去。这篇记录下我的2023。家庭这一年看着闺女慢慢学会了很多本领,从最开始的爬到后来的走;从最开始的咿咿呀呀到可以清晰的喊爸爸妈妈;从最开始只认识猫猫到现在可以认出大部分常见的小动物。不仅在技能方面有了长进,而且在事物喜好上也逐渐开始有自己的想法。对于自己喜欢的会说「要」,自己不喜欢的会直接说「不要」。每当看...

2024-02-06 09:00:11 875

转载 最强 Pandas 平替 -- Polars

Polars是一个用于操作结构化数据的高性能DataFrame库,可以说是平替pandas最有潜质的包。Polars其核心部分是用Rust编写的,但该库也提供了Python接口。它的主要特点包括:快速: Polars是从零开始编写的,紧密与机器结合,没有外部依赖。I/O: 对所有常见数据存储层提供一流支持:本地、云存储和数据库。易于使用: 以原始意图编写查询。Polars 在内部会使用其查询优化器...

2024-01-31 09:01:22 70

转载 2024年!如何用GPT来帮你找工作

在当今竞争激烈的职场环境中,掌握有效的求职技巧变得尤为重要。本文将深入探讨从撰写吸引人的求职信和简历,到精心准备面试的各个环节,提供一系列实用的建议和技巧。一、撰写求职信当撰写求职信时,重点在于展示你的经验和技能如何与你申请的职位相契合。一份有效的求职信应包含以下元素:简介:开头介绍你为何对这个职位感兴趣。专业背景:详细描述你的专业经历,特别是与职位相关的经验。技能与成就:突出你的关键技能和在前一...

2024-01-29 09:00:55 98

转载 谈谈用户分层分析!

用户分层是几乎所有品牌都会思考的一个重要命题。合理的分层能够帮助品牌有效提升用户的忠诚度。这篇文章,我会带大家熟悉用户分层的基本概念、价值以及分层分析的思路。内容略干,在看的时候可以喝两口水。一、无处不在的用户分层用户分层,顾名思义,是把用户按照一定的规则划分成不同的层级:想玩游戏了,打开王者荣耀,看到新出的英雄皮肤效果酷炫,忍不住充值购买,系统提示我的VIP等级提升了,从V6升级到尊贵的V7。...

2024-01-24 09:00:54 68

转载 优衣库畅销款数据分析案例

内容来源授权转载:知乎@李启方从人、货、场三个维度,即客户维度、产品维度、区域维度对优衣库畅销款商品的销售情况进行数据分析和可视化报告展示。(数据来源:2023年某时段取样)分析维度:人(顾客)维度、货(产品)维度、场(区域维度)、时间维度数据指标:销售额、订单数、销量、客户数、利润、客单价及其派生指标等。1、销售分析A类产品包括T恤、当季新品、配件和毛衣;B类产品包括牛仔裤、裙子;C类产品包括袜...

2024-01-22 09:02:18 293

转载 为什么转化率又降了?

“为什么这个月销售额提升了30%?”“为什么转化率又降了,同比竟然降低了42%,什么原因导致的呢?”这些都是数据分析师在工作中经常会遇到的问题,甚至有些基础岗的数据分析师要花80%以上的精力处理这类问题:指标降低或者提升了多少,以及波动的原因是什么。这类问题可以概括为指标波动归因分析,很多时候用的是根据经验探索拆分的办法,非常占用数据分析师的时间,而且数据分析师获得的价值感也不高。如果能够找到一些...

2024-01-17 09:00:33 48

转载 自动生成图文并茂的数据分析报告

来源:网络|转自:法纳斯特reportlab是Python的一个标准库,可以画图、画表格、编辑文字,最后可以输出PDF格式。它的逻辑和编辑一个word文档或者PPT很像。有两种方法:1)建立一个空白文档,然后在上面写文字、画图等;2)建立一个空白list,以填充表格的形式插入各种文本框、图片等,最后生成PDF文档。因为需要产生一份给用户看的报告,里面需要插入图片、表格等,所以采用的是第二种方法...

2024-01-15 09:00:55 173

转载 《对比Excel系列图书》随书资源

本篇为对比Excel系列图书的随书资源合集,大家可以根据自己的需要点击下方的链接获取不同图书的随书资源。『对比Excel,轻松学习Python数据分析』随书资源『对比Excel,轻松学习SQL数据分析』随书资源『对比Excel,轻松学习 Python 报表自动化』随书资源『对比Excel,轻松学习Python统计分析』随书资源已经买书的同学,可以加我微信,请备注“已购买书”,我会邀请你到专属的读者...

2024-01-14 13:42:42 34

转载 优惠买书渠道

经常有读者会问我哪里买书比较便宜,如果单纯要买最便宜的,还是比较容易,直接在电商平台搜索书名,然后按照价格升序排列即可。但是这样买到的大概率是盗版。可以看看这个盗版的盗版你别太离谱!。大家想要的是便宜且正版的。因为我自己平常也会在网上买很多自己的书(是的,其实我和大家是一样的,也需要自己在网上买自己的书),我自己在买的时候也会进行比价的。下面是我找到的,五折且能够保证是正版的购买渠道,大家可以放心...

2024-01-14 13:35:18 42

转载 如何写好年终总结?V4.0

每到年底,就有很多人为怎么写好年终总结而发愁,耗费了很多脑细胞,也花了很多时间和精力,但可能还是不知道该写点什么好。看似枯燥乏味的年终总结,其实是每个人都应该重视的「必修课」。假如你辛辛苦苦、加班加点写的年终总结,却被领导说看不到重点,你会不会觉得很委屈?比委屈更严重的是,你失去了一次真正展示自己才华的机会。写好年终总结,核心就是要讲清楚两件事情:① 今年的工作做得怎么样?② 明年打算怎么做得更好...

2024-01-12 09:00:56 46

转载 北京程序员年薪中位数超 60 万元,2023 全球程序员收入报告出炉

【CSDN 编者按】在数字时代的浪潮中,程序员们被誉为现代世界的建筑师,他们的代码构建着无数创新和变革的基石。然而,在这个技术飞速发展的时代,程序员们的付出和成就又将如何体现在他们的薪酬水平上呢?整理 | 郑丽媛出品 | CSDN(ID:CSDNnews)刚刚过去的 2023 年,被许多人称作“AI 元年”,而实际上不仅是 AI,区块链、大数据、云计算等技术领域也在不断推进创新,其背后程序员的技能...

2024-01-09 09:00:56 28

原创 ChatGPT可以直接生成图表结果了

ChatGPT的插件市场还是有不少好用的东西的,今天给大家分享的就是「Visualize Your Data」这个插件。先看下用这个插件生成的结果图效果:接下来给大家演示下这个图表具体是怎么生成的。1.生成一份模拟数据集,待使用有了GPT以后,我们都不需要自己去造样例数据了,直接让GPT帮我们生成一份,只需要把指令发给他即可:2.利用上述生成的模拟数据,进行可视化生成数据集以后,我们可以给他发送具...

2024-01-08 09:01:25 702 1

转载 Python制作进度条,原来有这么多方法!

‍来源丨机器之心链接丨https://towardsdatascience.com/learning-to-use-progress-bars-in-python-2dc436de81e5如果你之前没用过进度条,八成是觉得它会增加不必要的复杂性或者很难维护,其实不然。要加一个进度条其实只需要几行代码。在这几行代码中,我们可以看看如何在命令行脚本以及 PySimpleGUI UI 中添加进度条。下文...

2024-01-04 09:00:39 47

转载 SQL出错高发期!

不知道做分析的各位朋友有没有发现最近这两天写SQL出错的频率突然增加了。如果没有注意到,那么从现在开始注意下,这一个月的出错率应该都要比平常高。之前我也没意识到这个问题,最近老听隔壁工位的同事说代码又写错了。然后也刻意观察了下自己,好像还真是,也想了下往年的这个时候,好像还真是每逢这个时候错误会突增。说到这里,你肯定就会好奇了,为啥偏偏这个时候错误会突增呢?难道bug率还和时间有关?我想懂的人应该...

2024-01-03 09:00:18 37

转载 5个Python自动化EDA库

来源:Deephub ImbaEDA或探索性数据分析是一项耗时的工作,但是由于EDA是不可避免的,所以Python出现了很多自动化库来减少执行分析所需的时间。EDA的主要目标不是制作花哨的图形或创建彩色的图形,而是获得对数据集的理解,并获得对变量之间的分布和相关性的初步见解。我们在以前也介绍过EDA自动化的库,但是现在已经过了1年的时间了,我们看看现在有什么新的变化。为了测试这些库的功能,本文使用...

2024-01-02 09:00:36 101

转载 智能分析:ChatGPT+Excel+Python超强组合玩转数据分析

Python+Copilot/ChatGPTExcel未来已来话说天下大势,合久必分,分久必合。于数据分析而言,近几年是实实在在的多事之秋。首先是顶流Python高举卷王之王的大旗向传统王者VBA抢班夺权,pandas, xlwings、OpenPyXL和Matplotlib等第三方包已经具备VBA和Power Query的几乎所有功能。然后是2023年初ChatGPT席卷而来,语言大模型开始接管...

2023-12-29 09:01:23 60

转载 patchworklib,一款极其强大的 Python 库!

来源丨网络一、问题如果想把多个图合并放在一个图里,如图,该如何实现好在R语言 和 Python 都有对应的解决方案, 分别是patchwork包和patchworklib库。二、R语言安装#install.packages("devtools")devtools::install_github("thomasp85/patchwork")两个图并排在一行,只需要导入patchwork, 然后相...

2023-12-28 09:01:11 47

转载 欲懂误差,必先懂抽样

抽样调查是社会研究中常用到的方法,但是怎么样做抽样调查?抽样调查需要注意什么?本文将提纲挈领的把抽样调查的全貌展示给大家,让大家对抽样调查有一个总体的一个宏观性的认识。抽样调查中的两次推论抽样调查中涉及到两次推论,第一次推论是从受访者的回答来推论受访者的特征。我们的核心的目标是要了解受访者的特征,比如受访者在一些基本的社会态度上的观点,但是受访者的特征不会赤裸裸地展现在我们面前,我们需要通过一定的...

2023-12-27 09:00:43 70

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除