蚂蚁上树GF-CSDN博客

原创 seaborn数据可视化

（1）绘制一行三列的三个子图在一张画布中，其中第一个子图绘制"AQI","PM2.5含量（ppm）","PM10含量（ppm）","NO2含量（ppm）","O3_8h含量（ppm）"五列数据的箱线图，第二个子图绘制"SO2含量（ppm）"的箱线图，第三个子图绘制"CO含量（ppm）"的箱线图。（3）探索car_crashes数据中各特征列之间的相关性，画出对应的热力图，要求热力图有数字标识，有标题，最后对主要几列比较明显特征关系的做出结论。（2）绘制空气质量等级与PM2.5含量（ppm）的分类散点图。

2023-05-22 19:58:50 800

原创数据可视化基础

1、导入orders.sql文件到数据库中，该订单表示某公司2014年-2020年的销售订单表，数据字段有包含客户订单的基本信息，例如订单ID、订单日期、门店名称、支付方式、发货日期等25个字段，现需要对该订单表根据需求使用matplotlib库进行数据可视化，并做出分析。（1）以2018年为列，研究该电商企业的销售额和利润额的变化情况，时间以该年的周次为单位，2、对文本文件tangshi.txt，进行中文分词处理并画出词云图。（2）以2018年为列，研究该公司的订单销售在全国各省份（地区）的数量对比，

2023-05-22 19:53:35 266

原创数值分析基础-pandas（2）

（1）读取文件“淘宝某商品所搜结果的数据——原数据.csv”，使用dataframe对象进行数据封装，并打印该dataframe对象，以及整体的数据描述。（0）数据清洗，对city列中有空格的数据进行去除，对age中的异常值（年龄低于0）替换为当前列中的均值，对price列的数据转为小数格式。（6）将地址列的数据分别按省、市进行拆分（原数据的省市是字符串类型并用空格隔开）并在后面单独生成新的一列。（5）对（4）题中排序的结果中的第一行行数据进行删除，并对最终结果的索引重置为0,1,2。

2022-11-20 13:52:01 482

原创数值分析基础-pandas（1）

其次对三行三列的数据值进行格式化打印,并对分数大于60分的所有行进行打印，再对c行的性别列改为“M”并打印性别为M的行，最后求出三条数据分数列的平均分。6、使用以下字典数据创建一个DataFrame对象，其索引值为'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j'。请完成以下要去的操作。1、创建一个值为1,3,5,7,9的整型数据类型的Series对象，其索引下标为0,1,2,3,4,请输出该Series对象的数据类型、维度形状大小、以及值的总和。

2022-11-20 13:32:56 362

原创数值分析基础-numpy

2、创建一个（0,2,4,6,8）的类型为float的一维数组，然后再最后个位置追加10的元素，然后让第3个、第4个元素等于1，然后再将其形状改变为2行*列的数组，打印该数组及该数组的维度和各个维度的形状。12、正则化一个5*5随机矩阵，先创建一个1-100范围内的随机矩阵，求出该矩阵中的最大值和最小值，最后对矩阵的每一个元素进行正则化（压缩到0-1范围的映射）将源代码和运行结果截图展示。9、创建一个5*5的全为整数0的ndarray对象，然后将该数组的边界全置为1，里面保持不变全为0，最后打印该数组。

2022-11-20 13:21:59 954