自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

微信号:RunsenLiu

不喜欢搞学术和技术,喜欢money更多点

  • 博客(18)
  • 资源 (171)
  • 问答 (12)
  • 收藏
  • 关注

原创 一场编程语言之战

一场编程语言之战@Author:Runsen本人懂一点Python,Java,根据自己想法而来,纯属虚构。现状进入2020年3月,新的编程语言排行榜新鲜出炉,TIOBE 最新发布了 3 月编程语言排行榜。从榜单中我们可以看到,前三名分别为Java、C、Python。相较于上个月,Python继续以1.85% 上升至 10.11%,以10.11% 的份额稳居第三。我们先了解下比较常见...

2020-03-31 14:27:12 2259 3

原创 机器学习这四个东西,你知道吗?

'''1.分类变量特征提取分类数据的独热编码方法,分类变量特征提取(One-of-K or One-Hot Encoding):通过二进制数来表示每个解释变量的特征'''# from sklearn.feature_extraction import DictVectorizer# onhot_encoder = DictVectorizer()# instances=[{'ci...

2020-03-30 18:33:52 1017

原创 Stanford NLP

http://nlp.stanford.edu:8080/corenlp/Stanford NLP提供了一系列自然语言分析工具。它能够给出基本的 词形,词性,不管是公司名还是人名等,格式化的日期,时间,量词, 并且能够标记句子的结构,语法形式和字词依赖,指明那些名字指向同 样的实体,指明情绪,提取发言中的开放关系等。 1.一个集成的语言分析工具集; 2.进行快速,可靠的任意文本分析; 3.整体的...

2020-03-30 14:21:34 1116

原创 十四、爬取天气气温,制作最低气温排行榜

http://www.weather.com.cn/textFC/hn.shtmlimport re, requestsfrom pyecharts import BarDATAS = []# 将总数据设置为全局变量def parse_page(url): headers = { 'User-Agent': "Mozilla/5.0 (Windows NT 1...

2020-03-30 13:44:37 1090

原创 三十八、练习、Python判断一个信用卡号是否合理

一个信用卡号必须是13到16位的整数1954年,IBM的Hans Luhn提出一种算法,用于验证信用卡号的有效性。这个算法在确定输入的卡号是否正确,或者这张信用卡是否被扫描仪正确扫描方面是非常有用的。4,指Visa信用卡5,指Master万事达卡37,指American Express 国际信用卡6,指Discover 信用卡遵循这个合法性检测可以生成所有的信用卡号,通常称之为L...

2020-03-30 10:13:28 4407

原创 39 | 八皇后

通过回溯法,我们成功地解决了八皇后问题。回溯法是一种强大的算法解决方法,在许多组合优化问题中都有广泛的应用。实际上,八皇后问题只是回溯法应用中的一个例子,回溯法还可以用于解决其他很多问题,比如0-1背包问题、全排列问题等。希望本文对理解回溯法的原理和应用提供了一些帮助。在实际应用中,我们可以根据具体问题的特点来调整回溯算法的实现。

2020-03-30 09:56:29 1183

原创 31 | 排序算法

综合对比不同排序算法的性能,我们可以得出以下结论:如果排序规模较小,可以考虑使用冒泡排序、选择排序或插入排序,它们简单且容易实现。如果排序规模较大且对排序稳定性有要求,可以选择归并排序。如果排序规模较大且对排序稳定性没有特殊要求,可以选择快速排序,它的平均时间复杂度较低。最终选择合适的排序算法需要综合考虑数据规模、稳定性要求以及具体的应用场景。本文介绍了几种常见的Python排序算法,包括冒泡排序、选择排序、插入排序、归并排序和快速排序,并对它们的性能进行了对比分析。

2020-03-26 15:09:22 1205

原创 八十三、Eureka实现相互注册

Eureka是Netflix开发的服务发现框架,本身是一个基于REST的服务,主要用于定位运行在AWS域中的中间层服务,以达到负载均衡和中间层服务故障转移的目的。SpringCloud将它集成在其子项目spring-cloud-netflix中,以实现SpringCloud的服务发现功能。

2020-03-21 23:00:35 1598 1

原创 八十二、什么是SpringCloud项目,我把它讲清楚了

最近几年微服务很火,大家都在建设微服务,仿佛不谈点微服务相关的技术,都显得不是那么主流了。

2020-03-21 15:42:58 2030

原创 3 | IntellijIDEA开发工具

问题反馈:有部分小伙伴反馈说IDEA无法找到svn.exe,解决方法:重装SVN,配置项重新选择command line client tools 即可。不管是创建 class,还是 interface,还是 annotation,都是选择 new – java class,下面,我写hello world程序,在IDEA中有快捷键,一个main和psvm。因为我比较熟悉Pycharm,用IDEA非常上手,Eclipse真的不怎么会用。很多的时候,我们选敲代码有自己的作者和敲代码的时间。

2020-03-20 17:10:57 1036

原创 化工设备与反应器 第三章 直梁的弯曲

‘作业题

2020-03-19 11:01:18 948

原创 化学反应工程 第一章 均相单一反应动力学和理想反应器

2020-03-18 12:38:34 1286 2

原创 化工设备与反应器 第二章 直杆的拉伸与压缩

第 2 章 直杆的拉伸与压缩(1)研究小变形原因:构件在外力作用下都将发生变形,称为变形体,但其变形一般很小。实例:分析构件上力的平衡关系时,忽略变形的影响,仍按原尺寸计算。(2)材料力学对变形体作如下假设① 连续性假设 物体在其整个体积内充满物质,是密实的和连续的。② 均匀性假设 在材料内各处有相同的力学性能。③ 各向同性假设 材料沿各个方向的力学性能都是相同的轴向拉伸或...

2020-03-14 11:22:16 1016

原创 北极约200万个甲烷点被发现,人类的反思该提上日程了,因为只有一个地球

这两天,全球都在被新冠肺炎,搞得焦头烂额的时候,几乎束手无策,但是地球最冷的“北极“,”南极“,所发生的灾难,却被迅速的淹没在了新冠肺炎的信息流中。大家都知道澳大利亚的大火排放了4亿吨,这一数字已超过全球116个二氧化碳排放量最低国家的年排放量之和,这让全球这几年的减排毁于一旦,大家知道吗?甲烷比二氧化氮更加严重,其温室效应是二氧化碳的28-36倍。北极发现约200万个甲烷点根据NAS...

2020-03-14 10:13:23 1599

原创 ERROR Shell: Failed to locate the winutils binary in the hadoop binary path java.io.IOException

window在启动Pyspark时,会报下面错误ERROR Shell: Failed to locate the winutils binary in the hadoop binary pathjava.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.原因...

2020-03-13 17:07:49 1645

原创 四十八、使用Python和Stata完成广西碳酸钙企业的主成分分析和因子分析

我们选取2018年的广西碳酸钙企业的数据,来判断那间企业在20189年更具有竞争力。我们来做主成分分析和因子分析。下面是数据来源:企业净利润(万元)营业总收入(万元)期间费用(万元)总资产周转率(次)成本总额(万元)流动资产(万元)每股收益(元)应收账款周转天数(天)存货周转天数(天)资产负债率(%)八菱科技7217100073030.29725...

2020-03-11 00:03:43 1877

原创 centos7安装Python3

[root@node01 ~]# yum install yum-utils[root@node01 ~]# yum install openssl-devel -y [root@node01 ~]# mkdir -p /usr/local/python3[root@node01 ~]# cd /usr/local/python3/[root@node01 python3]# wget ...

2020-03-05 14:54:28 1343

原创 杠件受力分析 第一章 杠件受力分析

力学中的定义和数学中的定义是一样的,都是形式化的。在外力作用下不变形的物体称为刚体力和力系的基本知识力的大小、方向和作用点(线),如图所示。力的表示力是一个矢量,矢量用黑体字或在白体字上方加一箭头来表示,即 F 或 F 。图形表示时,用一个带箭头的有向线段表示,如图所示。线段的长度按一定比例画出,表示力的大小;线段的方位和箭头表示力的方向;线段的起点A或终点B表示力的作用点。...

2020-03-04 22:56:13 2215

基于YOLO5细胞检测实战.zip

在进行基于YOLOv5的细胞检测实战时,完成以下的事情: 1. **数据采集与标注**:详细描述如何采集细胞图像数据,并进行标注。说明采集设备、图像分辨率、标注工具以及标注过程中的质量控制措施。 2. **数据预处理**:解释在输入模型之前对数据进行的预处理步骤,例如图像尺寸的调整、归一化和数据增强方法的选择。强调预处理的重要性以及如何影响模型的性能。 3. **模型选择与调优**:描述为什么选择YOLOv5作为细胞检测的模型,并说明如何调整模型的超参数以适应特定的细胞检测任务。可以讨论模型的架构、损失函数选择以及训练策略。 4. **训练过程**:详细说明模型的训练过程,包括数据集的划分、训练参数的设置、学习率调度方法以及监控训练过程中的性能指标。可以提供训练代码片段或脚本。

2024-02-19

天池-新闻推荐 推荐系统

零基础入门推荐系统 - 新闻推荐 赛题以新闻APP中的新闻推荐为背景,要求选手根据用户历史浏览点击新闻文章的数据信息预测用户未来点击行为,即用户的最后一次点击的新闻文章,测试集对最后一次点击行为进行了剔除。通过这道赛题来引导大家了解推荐系统中的一些业务背景,解决实际问题,帮助竞赛新人进行自我练习、自我提高。

2024-02-19

27 - Titanic 乘客生存决策树预测

Titanic 乘客生存预测流程 数据获取 --> 数据探索 --> 数据清理 --> 特征选择 --> 决策树模型 --> 模型预测和评估 --> 决策树可视化

2024-02-19

SVM对文档进行分类:

## SVM对文档进行分类: `流程:` 文档输入 --> 对文档进行分词 --> 加载停用词 --> 计算单词权重 (准备阶段) --> 生成分类器 --> 分类器做预测 --> 计算正确率 (分类阶段)

2024-02-19

16 - Pytorch​​构建Logistic二分类模型

在逻辑回归中预测的目标变量不是连续的,而是离散的。可以应用逻辑回归的一个示例是电子邮件分类:标识为垃圾邮件或非垃圾邮件。图片分类、文字分类都属于这一类。

2024-02-03

11 - Tensorflow实现卷积神经网络

11 | Tensorflow实现卷积神经网络

2024-02-03

13 - 使用代理ip爬取安居客房源信息

这段Python爬虫代码旨在从安居客网站爬取房地产信息。其中使用了代理IP的技术,主要目的是应对反爬虫机制、提高隐私保护、伪装地理位置、避免频率限制和提升稳定性。

2024-01-14

手动爬取天天基金网基民评论与东方财富网股市行情的资讯,从基民评论、重仓股票、市场行情三个方面LDA模型进行分析

这是一个基金评论与股票市场的情感分析项目,目的是手动爬取天天基金网基民评论与东方财富网股市行情的资讯,从基民评论、重仓股票、市场行情三个方面出发,使用情感词典与LDA模型进行分析,从而做出是否值的购买基金的决策。带有标签clean的是清洗后的爬虫数据,没有带标签的是原始数据或者某个分析后的结果。具体的工作代码放在了“基于情感词典与LDA模型的基金文本研究.ipynb”中,使用的是python 的jupyter notebook。

2023-11-03

03.04 Requests豆瓣.ipynb

对豆瓣单个电影页面元数据进行获取 元数据结构:<br> 1. 导演 2. 编剧 3. 主演 4. 类型 5. 制片国家/地区 6. 语言 7. 上映日期 8. 片长 9. 又名 10. IMDb 11. 豆瓣评分 - 评分 - 评价人数 - 5星评价占比 - 4星评价占比 - 3星评价占比 - 2星评价占比 - 1星评价占比 12. 好于 13. 好于 ## Step 1 找到250部电影的页面 依次解析 具体的页面 爬取1292052...;爬取1292052成功 爬取1291546...;爬取1291546成功 爬取1292720...;爬取1292720成功 爬取1292722...;爬取1292722成功 爬取1295644...;爬取1295644成功 爬取1291561...;爬取1291561成功 爬取1292063...;爬取1292063成功 爬

2023-11-01

SpringBoot+Mybatius图书管理系统 语言:Java 开发工具:IntelliJIDEA-2019.3 JDK版

SpringBoot+Mybatis图书管理系统是一个用于管理图书信息的Web应用程序。它使用Java作为编程语言,IntelliJ IDEA作为开发工具,JDK 8作为Java开发环境,Maven用于项目管理,MySQL数据库用于存储数据,前端使用HTML、CSS、jQuery、Layui和Vue,后端采用Spring Boot、Mybatis以及TkMapper框架。 下面将描述一些主要功能和组件以帮助你更好地理解这个系统: **主要功能:** 1. **图书管理**:用户可以添加、编辑、删除图书信息,包括书名、作者、出版日期等。 2. **借阅管理**:用户可以借阅图书并设置还书日期,系统会自动跟踪图书的借阅状态。 3. **用户管理**:管理系统用户,包括添加、编辑、删除用户信息,以及分配权限等。 4. **搜索和过滤**:提供搜索功能,可以根据关键字搜索图书信息,并可以根据不同条件进行过滤。 5. **权限管理**:不同用户具有不同的权限,例如管理员和普通用户,管理员可以管理图书和用户,而普通用户只能借阅图书。

2023-10-30

通用的Java工具类,主要包括基础工具类(时间、正则表达式、字符串、随机数等等),excel解析生成、word解析生成、文件操作

通用的Java工具类,主要包括基础工具类(时间、正则表达式、字符串、随机数等等),excel解析生成、word解析 生成、文件操作

2023-10-22

基于Java的学生管理系统,旨在提供学生信息的管理和查询功能

这项目是一个基于Java的学生管理系统,旨在提供学生信息的管理和查询功能。 **1. 数据库连接和初始化:** - 项目使用Java数据库连接(JDBC)来建立与数据库的连接。 - 在系统初始化时,通过`DatabaseConnector`类创建了一个数据库连接,以便执行数据库操作。 **2. 添加学生信息:** - 系统提供了添加学生信息的功能。 - 用户可以输入学生的ID、姓名和年龄,然后系统将这些信息插入到数据库的`student`表中。 - 成功插入后,系统会显示学生已被添加的消息。 **3. 查找学生信息:** - 学生管理系统允许用户根据学生的ID来查找学生信息。 - 用户输入要查找的学生ID,系统执行SQL查询操作,如果找到匹配的学生,将显示学生的ID、姓名和年龄。 - 如果未找到匹配的学生,系统会显示未找到的消息。 **4. 更新学生信息:** - 系统允许用户根据学生ID更新学生信息。 - 用户输入学生ID,然后输入新的姓名和年龄,系统执行SQL更新操作,将学生信息更新为新提

2023-10-22

基于Python编程的RFM细分聚类案例

本文将深入探讨一个基于Python编程的RFM细分聚类案例。通过代码实现,我们将学习如何加载和预处理电商历史订单数据,计算RFM指标,使用KMeans算法进行聚类分析,以及如何将用户分为不同的价值层级。最终,我们将通过可视化展示来解释不同价值层级用户的分布情况,帮助企业更好地理解其客户群体,为未来的决策提供更多见解。

2023-08-21

65 - python增长模型案例

在一个具体的案例中,我们使用了一个关于用户行为的数据集,探讨了如何利用增长模型来优化业务决策。通过数据分析、可视化和机器学习建模,我们深入挖掘了用户的操作历史、设备类型、城市类型以及其他特征。我们通过构建预测模型,预测了用户是否会对不同类型的促销方式做出响应,从而实现了精准的目标用户选择。 在实际操作中,我们不仅关注转化率的提升,还需要考虑成本与效益的平衡。我们将重点放在那些有潜力的用户身上,通过合理的营销策略来提升他们的转化率,从而在有限的资源下实现业务增长。

2023-08-21

A/B测试 展示如何运用Python进行数据分析、可视化和统计显著性检验

探讨A/B测试的概念、原理以及其在实际业务中的应用。 通过一个案例,详细展示如何运用Python进行数据分析、可视化和统计显著性检验,以揭示不同页面版本在用户购买转化率方面的差异。通过对比新旧页面的转化率,我们将探讨如何从统计学的角度评估这些差异是否具有显著性。从而,读者将深入了解如何通过A/B测试来为业务决策提供有力的数据支持,进而优化用户体验和提升业务成果。

2023-08-21

63 - 留存分析在现代商业中的关键作用 python 案例

我们以一个案例为例,展示了如何通过数据驱动的方法识别影响留存率的因素。首先,我们载入了一个会员数据集,对数据进行了预处理,包括转换字段、处理缺失值等。然后,我们使用Kaplan-Meier生存分析方法绘制了整体的留存曲线,从中可以看出会员的留存率随着入会月数的增加逐渐下降,这提醒我们需要关注新会员的留存情况。 接着,我们对不同因素进行了分析,比如会费支付方式、会员卡类型以及性别对留存率的影响。通过绘制不同分类的Kaplan-Meier曲线,我们可以看到这些因素对留存率的影响情况。例如,不同的会费支付方式和会员卡类型对留存率产生了不同的影响,这提示我们可以针对不同的客户群体制定不同的留存策略。 接着,我们采用Cox比例风险模型来进行生存分析,这种方法可以同时考虑多个因素对留存的影响。通过打印模型的摘要信息,我们可以得到不同因素的系数,从而了解每个因素对留存的影响程度。此外,我们还绘制了系数和置信区间的图表,更直观地展示了各因素的影响情况。 最后,我们展示了如何使用逻辑回归模型对留存进行预测。通过构建特征集和标签集,我们将数据集拆分为训练集和测试集,然后使用逻辑回归模型进行拟合和预测

2023-08-21

62 - Python 漏斗分析案例

漏斗分析是一种重要的数据分析方法,用于跟踪和优化用户在某个过程中的转化率。无论是在线购物、注册流程还是应用下载,漏斗分析都能帮助您了解用户在不同阶段的行为,找出瓶颈,优化用户体验。

2023-08-20

61 - 归因渠道分析案例 python

归因分析(Attribution Analysis)是一种用于评估不同营销渠道推广效果的方法,它的主要目标是合理地将转化路径中的功劳分配给各个接触点,也就是不同的营销渠道。这帮助营销人员更准确地了解各个渠道对最终转化所产生的影响,从而更有效地分配资源和优化营销策略。

2023-08-20

60 - python 用户画像案例

python 用户画像案例. 用户画像是一种分析和描述目标受众特征的方法,可以帮助您更深入地了解您的受众群体,揭示他们的兴趣、需求和行为。通过用户画像,您可以更好地定制营销策略、产品设计以及提供更个性化的用户体验。

2023-08-19

59 - RFM模型实战案例 python

从上面结果,我们可以快速得到一些推断: 客户流失情况严峻,高消费唤回客户、流失客户占比超过50%,怎么样制定针对性唤回策略迫在眉睫。 重要价值客户占比仅2.97%,还有三个客户占比甚至不足2%,我们模型打分可能不够科学,可以进一步调整打分区间进行优化。 再结合金额进行分析: 高消费唤回客户人数占比28.87%,金额占比上升到了38.11%,这部分客户是消费的中流砥柱,他们为什么流失,应结合订单和购买行为数据进一步展开挖掘。 频次深耕客户金额占比紧随其后,这部分客户的特征是近期有消费、消费频次低、消费金额高,和高消费唤回客户仅有购买时间上的不同,如何避免这部分客户向高消费唤回客户的流转是我们要思考的主要命题。 流失客户人数占比26.28%,金额占比仅12.66%,这部分客户中有多少是褥羊毛用户,有多少是目标用户,对我们引流策略能够进行怎么样的指导和调整?

2023-08-19

代码实操:Python聚类分析

代码实操:Python聚类分析 SKLean中有专门的聚类库:cluster,其包含了很多的聚类算法。 本例将使用一份无标签的数据集做聚类分析,以得到不同类别的特征和分布状态等。 对于聚类模型结果的评估,主要考虑如下三个方面: 1. 对于没有任何聚类真实结果指标的,由于无法使用真实数据做对比,智能使用聚类距离指标做评估; 2. 对于有分类真实结果做对照的,则可以使用真实标签与预测标签的相似、重复、完整性等度量计算,但是需要注意的是,聚类结果的标签值与其真实类别的标签值没有关系,结果只关注数据点是否属于同一类; 3. 业务类的评估,包括不同类别间的特征是否有显著差异,类内部是否具有能代表类别的显著性特征。

2023-08-19

58 - 小红书产品体验报告

58 | 小红书产品体验报告

2023-08-19

57 - TAPTAP客户端分析

TAPTAP客户端分析

2023-08-19

56 - 国内游戏直播竞品分析

国内游戏直播竞品分析 PPT 加文档

2023-08-19

50 - 国产商业漫画分析

本文是关于当前国产商业漫画市场的小研究,分析所用数据都是从漫画网站上直接爬取的。这里我选择的数据来源有两个,一个是当前收录商业化国漫最多的快看漫画,另一个是使用用户最多、以日漫为主的动漫之家。 在这篇分析里,我想从作品和作者两个角度,看国漫当前的流行趋势以及读者偏好。分析大纲大致如下: 1. 从作品看 * 题材:当前流行的题材有哪些,这些题材里真正能获得大人气的作品比例有多少? * 趋势:从快看App 2014年上架至今,国漫作品数量还保持着高增长吗?抑或已经趋于平缓? * 对比日漫:国内读者对日漫的口味与国漫相比有何不同?国漫在哪些题材上还有发展潜力? 2. 从作者看 * 个人作者 vs 工作室:当前国漫创作哪种模式用得更多?比起早几年漫画工作室井喷式的发展,现在是否已经开始收敛?

2023-08-16

49 - python公司销售数据分析

公司销售数据分析报告 本数据是2012~2014年间一家生产体育类产品的全球销售订单数据,分别按时间、产品类别、销售国家统计产品销售情况,分析销售额和利润额统计各产品市场占有份额,为下一步生产计划提供有价值的建议。 数据大小:88475 行, 11 列 Retailer country 销售国家 Order method type 订单方式 Retailer type 销售方式 Product line 产品线 Product type 产品名称 Year 年 Quarter 季度 Revenue 销售额 Quantity 销售量 Gross margin 毛利润

2023-08-14

48 - python电子产品销售分析

python电子产品销售分析 # 一、数据信息 数据来源:电子产品销售分析.csv **该文件包含2020年4月至2020年11月从大型家用电器和电子产品在线商店购买的数据** 说明:数据量:564169 原始字段:12 ## 字段介绍: Unnamed: 行号 event_time:下单时间 order_id:订单编号 product_id:产品标号 category_id :类别编号 category_code :类别 brand :品牌 price :价格 user_id :用户编号 age :年龄 sex :性别 local:省份

2023-08-14

44 - 酒店预订及取消的数据分析

酒店预订及取消的数据分析 python

2023-08-14

抖音大V数据进行绘图与分析

抖音大V数据进行绘图与分析

2023-08-14

42 - python 航空公司客户价值分析

python 航空公司客户价值分析

2023-08-13

41 - 京东商家书籍评论数据分析

京东作为中国领先的电子商务平台,积累了大量商品评论数据,这些数据蕴含了丰富的信息。通过文本数据分析,我们可以了解用户对产品的态度、评价的关键词、消费者的需求等,从而有助于商家优化产品和服务,以及消费者作出更明智的购买决策。 本文将详细阐述如何获取京东商家评论数据,使用自然语言处理技术对评论文本进行分词、情感分析等处理,以及如何通过数据可视化工具呈现分析结果。我们将从数据的收集、预处理,到情感分析和关键词提取,逐步展示如何利用现代数据分析方法,从大规模的文本数据中提取有价值的信息。 在本文的后续内容中,我们将通过实际的案例,深入探讨如何利用Python编程语言和相应的数据分析库,对京东商家评论数据进行处理和分析。通过这个案例,读者将能够更好地了解如何利用文本数据分析方法,从而在商业决策、市场调研等方面做出更加准确和有力的决策。

2023-08-13

40 - NBA球员信息数据分析

本文将以NBA球员薪资数据并进行数据分析为例,展示如何获取网络上的数据资源,并通过数据处理和可视化方法揭示有关NBA球员薪资的信息。我们将使用提供的URL(www.espn.com/nba/salaries)来抓取NBA球员薪资数据,然后运用数据分析工具,对数据进行清洗、整理和计算,最终通过条形图的形式呈现薪资水平的分布和差异。

2023-08-13

38 - 浦发银行股票分析案例

本文将通过一个浦发银行股票分析案例,探讨如何从多个维度对股票进行分析,包括基本面、技术面和市场环境等因素。我们将深入挖掘浦发银行的财务数据、业务模式以及市场定位,以了解其内在价值和潜在风险。同时,我们还将考察技术面的指标,如价格走势、均线形态等,以揭示市场情绪和趋势。

2023-08-13

37 - 电影数据分析案例

电影的创作、制作、发行和市场表现受到诸多因素的影响,如电影类型、发行年份、制作成本、票房收入、观众评分等。为了更好地理解电影产业的动态变化和相关影响因素,数据分析在这一领域发挥了重要作用。通过对大量电影数据的挖掘和分析,我们可以揭示出电影市场的趋势、受众偏好以及不同因素之间的关联关系。

2023-08-13

36 - 银行贷款数据分析

本文将以银行贷款数据分析为主题,深入探讨如何运用数据科学的方法,揭示银行贷款领域的内在规律和趋势。通过对贷款数据的分析,我们能够洞察不同类型贷款的分布情况、贷款金额的变化趋势,以及借款人的特征和还款情况等关键信息。 通过运用Python编程语言及相关的数据分析工具和库,本文将指导读者完成数据预处理、探索性分析、可视化等环节。我们将从数据集的收集和清洗开始,逐步分析银行贷款数据的特点和变化,为读者提供深入了解银行贷款市场的机会。

2023-08-13

【数据分析实例】 2021年十万条厦门招聘数据分析

在这个数据分析实例中,我们将运用数据科学的方法,使用Python编程语言和相关库进行数据处理、分析和可视化。通过对大量的招聘数据进行挖掘,我们将揭示厦门市招聘市场的动态,探索不同行业的就业趋势,以及人才的薪资待遇等关键信息。通过这一深入的分析,我们可以为求职者提供就业市场的实际情况,为企业提供人才招聘的指导,同时也为决策者提供更准确的市场洞察力。

2023-08-13

34 - 某欧洲电商公司行为分析

收购完之后,公司第一步需要对这家公司的销售情况进行摸底,这个重任自然就落在了在数据分析部门任职的你身上。你需要从这家电商公司的原始订单数据中分析出公司的业务是在变好还是变差,公司哪些产品最受欢迎,以及主要的销售区域和有哪些优质的用户等信息,以提供给公司的战投部门做进一步的经营策略制定。

2023-08-13

33 - 美国总统数据分析 python

在这个数据分析项目中,作者利用Pandas等Python库对美国2020年7月22日至2020年8月20日期间的超过75万条捐赠数据进行了深入的探索和分析。通过这一分析,他们揭示了这段时间内美国选民对总统候选人的偏好和捐款情况。以下是对文章中的主要步骤和内容的进一步描述: 1. **数据集处理:** 作者首先加载候选人信息、候选人和委员会关系、个人捐赠数据等多个数据集。他们使用Pandas库创建DataFrame对象,并对数据集的列名进行了指定,以确保数据按照预期的格式加载。 2. **关联数据表:** 作者通过候选人和委员会关系表,将候选人信息与个人捐赠数据进行关联。通过候选人和委员会的标识(CMTE_ID和CAND_ID),他们将捐赠数据与候选人的相关信息连接起来,以便后续分析。 3. **数据探索和清洗:** 在关联后的数据中,作者进行了一系列的探索性数据分析。他们统计了各州的捐款总额,并使用Matplotlib创建了美国地图的热度图,将各州的捐款情况以不同颜色展示在地图上,使读者能够直观地了解捐款分布情况。 4. **候选人捐赠趋势分析:** 为了深入了解获得捐赠额最多

2023-08-13

32 - 全球新冠肺炎确诊病例趋势分析

python全球新冠肺炎确诊病例趋势分析

2023-08-13

31 - 独角兽企业数据分析

31 | 独角兽企业数据分析

2023-08-11

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除