- 博客(15)
- 收藏
- 关注
原创 seaborn数据可视化
(1)绘制一行三列的三个子图在一张画布中,其中第一个子图绘制"AQI","PM2.5含量(ppm)","PM10含量(ppm)","NO2含量(ppm)","O3_8h含量(ppm)"五列数据的箱线图,第二个子图绘制"SO2含量(ppm)"的箱线图,第三个子图绘制"CO含量(ppm)"的箱线图。(3)探索car_crashes数据中各特征列之间的相关性,画出对应的热力图,要求热力图有数字标识,有标题,最后对主要几列比较明显特征关系的做出结论。(2)绘制空气质量等级与PM2.5含量(ppm)的分类散点图。
2023-05-22 19:58:50 800
原创 数据可视化基础
1、导入orders.sql文件到数据库中,该订单表示某公司2014年-2020年的销售订单表,数据字段有包含客户订单的基本信息,例如订单ID、订单日期、门店名称、支付方式、发货日期等25个字段,现需要对该订单表根据需求使用matplotlib库进行数据可视化,并做出分析。(1)以2018年为列,研究该电商企业的销售额和利润额的变化情况,时间以该年的周次为单位,2、对文本文件tangshi.txt,进行中文分词处理并画出词云图。(2)以2018年为列,研究该公司的订单销售在全国各省份(地区)的数量对比,
2023-05-22 19:53:35 266
原创 数值分析基础-pandas(2)
(1)读取文件“淘宝某商品所搜结果的数据——原数据.csv”,使用dataframe对象进行数据封装,并打印该dataframe对象,以及整体的数据描述。(0)数据清洗,对city列中有空格的数据进行去除,对age中的异常值(年龄低于0)替换为当前列中的均值,对price列的数据转为小数格式。(6)将地址列的数据分别按省、市进行拆分(原数据的省市是字符串类型并用空格隔开)并在后面单独生成新的一列。(5)对(4)题中排序的结果中的第一行行数据进行删除,并对最终结果的索引重置为0,1,2。
2022-11-20 13:52:01 482
原创 数值分析基础-pandas(1)
其次对三行三列的数据值进行格式化打印,并对分数大于60分的所有行进行打印,再对c行的性别列改为“M”并打印性别为M的行,最后求出三条数据分数列的平均分。6、使用以下字典数据创建一个DataFrame对象,其索引值为'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j'。请完成以下要去的操作。1、 创建一个值为1,3,5,7,9的整型数据类型的Series对象,其索引下标为0,1,2,3,4,请输出该Series对象的数据类型、维度形状大小、以及值的总和。
2022-11-20 13:32:56 362
原创 数值分析基础-numpy
2、创建一个(0,2,4,6,8)的类型为float的一维数组,然后再最后个位置追加10的元素,然后让第3个、第4个元素等于1,然后再将其形状改变为2行*列的数组,打印该数组及该数组的维度和各个维度的形状。12、正则化一个5*5随机矩阵,先创建一个1-100范围内的随机矩阵,求出该矩阵中的最大值和最小值,最后对矩阵的每一个元素进行正则化(压缩到0-1范围的映射)将源代码和运行结果截图展示。9、创建一个5*5的全为整数0的ndarray对象,然后将该数组的边界全置为1,里面保持不变全为0,最后打印该数组。
2022-11-20 13:21:59 954
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人