数据可视化
文章平均质量分 91
卡林神不是猫
一枚大数据小学徒,正在大数据学习之路上摸索前行……
展开
-
数据可视化(十二):Pandas太阳黑子数据、图像处理——离散极值、核密度、拟合曲线、奇异值分解等高级操作
1. 给定一组离散数据点,使用 scipy.interpolate 中的插值方法(如线性插值、样条插值等)对其进行插值,并绘制插值结果。2. 使用 scipy.optimize 中的优化算法,找到函数的最小值点,并在图中标出最小值点。3. 绘制正态分布数据的直方图和概率密度函数曲线4. 对一组实验数据进行曲线拟合,使用 scipy.optimize.curve_fit 函数拟合一个非线性函数,并绘制原始数据和拟合曲线。5. 对以下函数进行数值积分,并绘制函数曲线以及积分结果的区域。6. 使用 sc原创 2024-05-13 22:56:53 · 1219 阅读 · 1 评论 -
数据可视化(十一):Pandas餐饮信息表分析——交叉表、离群点分析,多维分析等高级操作
问题1:按类型聚合餐饮店数量并画出水平直方图问题2:按城市聚合餐饮店数量,画出垂直柱状图问题3:交叉表查看不同城市不同餐饮店的餐饮数量问题4:找出点评最多的10个餐饮店问题5:找出 人均 离群点(过大的数),并删除问题6:按 类型 分组, 计算 人均 最高 最低 均值,画成对比水平直方图问题7:以 服务 为横坐标,口味 为纵坐标,画出散点图问题8:以 人均 为横坐标,服务 口味 环境 为纵坐标,以不同颜色画出散点图问题9:一线城市北上广深,一个画幅小4个饼图,画出'川菜', '湘菜', '江原创 2024-05-13 17:51:48 · 551 阅读 · 0 评论 -
数据可视化(十):Pandas数据分析师职位信息表分析——箱线图、水平柱状图、学历城市双维分析等高级操作
问题1:将firstType列的 空值 填充为 "未知"问题2:处理positionId列重复值(按照positionId去重),保留第一次出现的重复行问题3:获取平均工资,形成新列 average_salary问题4:城市分布情况画出水平柱状图对比问题5:平均薪资概率图(将平均薪资分成50个柱子)问题6:按城市画出平均工资箱线图问题7:按学历画出平均工资箱线图问题8:按工作年限画出平均工资箱线图问题9:学历、城市双维度画出平均工资箱线图问题10:直方图显示各个城市薪资最小值 最大值 平均原创 2024-05-13 17:50:56 · 448 阅读 · 0 评论 -
数据可视化(九):Pandas北京租房数据分析——房源特征绘图、箱线图、动态可视化等高级操作
问题1:填充空值(如有,否则不处理);删除重复信息(如有,否则不处理)问题2: 更改列名:房屋类型厅室: 户型, 房屋类型精装修: 装修问题3: 删除 URL、房屋类型面积 列问题4: 区域 ‘列’ 分为三部分,请拆分成 ‘行政区域’、‘商圈’、‘小区’ 三个列问题5: 按要求格式化数据问题6:选择 '房源编号', '行政区', '商圈', '小区', '户型', '面积', '租金', '单价', '装修', '朝向', '楼层位置', '总楼层', '电梯', '车位', '用水', '用电'原创 2024-05-13 17:50:02 · 1099 阅读 · 1 评论 -
数据可视化(八):Pandas时间序列——动态绘图,重采样,自相关图,偏相关图等高级操作
数据可视化(八):Pandas时间序列——动态绘图,重采样,自相关图,偏相关图等高级操作1. 时间序列分析1问题1:将列 date 转化为日期时间类型,并设置为索引问题2:按年份 统计开盘价(open列) 均值,并绘制直方图问题3:重采样,按月分析 open 列均值,并绘制折线图2. 时间序列分析2问题1:将列 Period 转化为 日期时间(datetime) 类型,并按列 Period 排序。问题2:将列 Period 转化为 时期(Period)类型,并设置为索引问题3:删除还有缺失值原创 2024-04-22 22:22:58 · 1945 阅读 · 2 评论 -
数据可视化(七):Pandas香港酒店数据高级分析,涉及相关系数,协方差,数据离散化,透视表等精美可视化展示
一、基本数据处理:读取“香港酒店数据”,按要求解决以下问题。1. 按照数据的内容,重新设置数据的索引,重新设置列名称为'名字','类型','城市','地区','地点','评分','评分人数','价格'。2. 查看所有类型为“商务出行”的酒店。3. 查看所有类型为“浪漫情侣”,地区在湾仔的酒店。4. 查看所有地址在观塘或者油尖旺,评分大于4的酒店。5. 查看类型缺失的数据。6. 用“其他”填充类型和地区。7. 用评分均值填充缺失值。8. 删除价格和评分人数的缺失值。9. 保存到“酒店数据1.原创 2024-04-21 23:25:16 · 1230 阅读 · 10 评论 -
数据可视化(六):Pandas爬取NBA球队排名、爬取历年中国人口数据、爬取中国大学排名、爬取sina股票数据、绘制精美函数图像
数据可视化(六):Pandas爬取NBA球队排名、爬取历年中国人口数据、爬取中国大学排名、爬取sina股票数据、绘制精美函数图像目录数据可视化(六):Pandas爬取NBA球队排名、爬取历年中国人口数据、爬取中国大学排名、爬取sina股票数据、绘制精美函数图像1. 爬取NBA球队排名页面,并进行分析2. 爬取以下网址的历年中国人口数据进行并进行分析3. 获取大学排名数据并进行分析4. 获取sina股票数据并进行分析5. matplotlib模仿绘图6. matplotlib模仿绘图原创 2024-04-20 22:21:44 · 1149 阅读 · 1 评论 -
数据可视化(四):Pandas技术的高级操作案例,豆瓣电影数据也能轻松分析!
Tips:"分享是快乐的源泉💧,在我的博客里,不仅有知识的海洋🌊,还有满满的正能量加持💪,快来和我一起分享这份快乐吧😊!喜欢我的博客的话,记得点个红心❤️和小关小注哦!您的支持是我创作的动力!原创 2024-04-18 23:33:10 · 1184 阅读 · 2 评论 -
数据可视化(五):Pandas高级统计——函数映射、数据结构、分组聚合等问题解决,能否成为你的工作备用锦囊?
数据可视化(五):Pandas高级统计——函数映射、数据结构、分组聚合等问题解决,能否成为你的工作备用锦囊?1. pandas数据结构问题1:创建3个不同的Series,长度都是100。问题2:利用这3个Series作为3列创建一个DataFrame。问题3:将上面DataFrame的列名改为bedrs、bathrs和price_sqr_meter。问题4:利用上面3个Series作为1列创建一个DataFrame问题5:上面的DataFrame的index到99为止,请将其reindex为0~原创 2024-04-19 21:40:17 · 1290 阅读 · 1 评论 -
数据可视化(三):Pandas技术的基本操作案例,让你快速掌握数据处理技术
红色在RGB颜色模式中所对应的值就是255,0,0;绿色在RGB颜色模式中所对应的值就是0,255,0;蓝色在RGB颜色模式中所对应的值就是0,0,255。获取用户输入的信息,编写代码定义一个复杂的dtype结构,数组元素包含三部分,分别为R、G、B的颜色值。dtype结构元素名称分别为R、G、B类型的无符号8位整型,输出颜色值数组。原创 2024-04-17 23:42:47 · 1136 阅读 · 1 评论 -
数据可视化(二):凯撒密码 和 Vigenere 密码,让你轻松学会数据信息加密解密技术
Python 实现-加密解密技术>Tips:"分享是快乐的源泉💧,在我的博客里,不仅有知识的海洋🌊,还有满满的正能量加持💪,快来和我一起分享这份快乐吧😊!喜欢我的博客的话,记得点个红心❤️和小关小注哦!您的支持是我创作的动力!一、凯撒密码凯撒密码(Caesar cipher)是一种最简单且最广为人知的加密技术。它是一种替换式的密码,通过把字母移动固定数目的位置进行加密。凯撒密码通常又被称作恺撒移位密码或者凯撒加密法。凯撒密码的原理是:通过把字母表中的每一个字母原创 2024-04-16 13:37:19 · 516 阅读 · 2 评论 -
数据可视化(一):python技巧思路养成(快递柜单号,微软序列号生成技术,数据脱敏等)
编写一个 Python 程序,获取用户输入的字符串,使用 jieba 库进行分词后,统计给定字符串中各单词出现的次数,去除标点符号,如"," “.” " "。很多人喜欢玩扑克牌,现有一手好牌,牌及顺序为:[‘2’, ‘3’, ‘4’, ‘5’, ‘6’, ‘7’, ‘8’, ‘9’, ‘10’, ‘J’, ‘Q’, ‘K’, ‘A’],请输入一个整数 n做为随机数种子,使用shuffle(x) 函数将牌序打乱,输出一个新的牌序。取件码的字符包括:数字0-9和字母A、B、C、D、E、F、G、H、I、J。原创 2024-04-15 18:26:48 · 1999 阅读 · 2 评论