python数据

Punkduck0801

已于 2024-01-07 21:37:22 修改

阅读量408

点赞数 14

文章标签： python 前端

于 2024-01-07 21:25:02 首次发布

本文链接：https://blog.csdn.net/2301_80180826/article/details/135445198

版权

def findprime(minrange, maxrange):
    # 判断输入是否为数字
    if not isinstance(minrange, (int, float)) or not isinstance(maxrange, (int, float)):
        print("输入错误，请输入数字")
        return None
    # 将输入的值转为整数
    minrange = int(minrange)
    maxrange = int(maxrange)
    # 判断最大值是否小于最小值
    if maxrange < minrange:
        print("输入错误，最大值应大于等于最小值")
        return None
    # 初始化结果
    cnt = 0
    zhishu = []
    # 遍历区间最小值到最大值
    for i in range(minrange, maxrange+1):
        # 判断是否为质数
        flag = True
        for j in range(2, int(i**0.5)+1):
            if i % j == 0:
                flag = False
                break
        if flag and i != 1:
            cnt += 1
            zhishu.append(i)
    # 打印结果
    print(f"({minrange})到({maxrange})共有({cnt})质数，分布为：({zhishu})")
    # 返回结果
    return cnt, zhishu

# 测试findprime函数
findprime(20, 200)
findprime(200, 20)

import pandas as pd

# 读取Excel文件并保存为DataFrame对象
df = pd.read_excel("datas.xlsx", na_values=["N/A", "na", "无"])

# 查询数据情况
print("数据情况:")
print(df)

# 查询数据缺失情况并统计缺失量
print("数据缺失情况:")
print(df.isna().sum())

# 课时数按众数填充，成绩按均值填充，其他按前值填充
mode = df["课时数"].mode()[0]
mean = df["成绩"].mean()
df["课时数"].fillna(mode, inplace=True)
df["成绩"].fillna(mean, inplace=True)
df.fillna(method="ffill", inplace=True)

# 对处理后的数据先按年级排序，再按成绩进行从高到低排序
df.sort_values(["年级", "成绩"], ascending=[True, False], inplace=True)

# 对处理后的数据成绩求均值、总和、最大值和最小值
print("成绩的均值: ", df["成绩"].mean())
print("成绩的总和: ", df["成绩"].sum())
print("成绩的最大值: ", df["成绩"].max())
print("成绩的最小值: ", df["成绩"].min())

# 对处理后的数据按实验室求课时总和
print("按实验室求课时总和:")
print(df.groupby("实验室")["课时数"].sum())

# 对处理后的按班级求成绩的均值和总和
print("按班级求成绩的均值和总和:")
print(df.groupby("班级")["成绩"].agg(["mean", "sum"]))

import pandas as pd
import matplotlib.pyplot as plt

# 读取 High-speed rail.csv 文件到 hpdata 数据框中
hpdata = pd.read_csv("High-speed rail.csv")

# 绘制 (Operation) 字段在一个坐标系下的直方图和密度图
hpdata["Operation"].plot.hist(density=True, alpha=0.5)
hpdata["Operation"].plot.kde()

# 绘制 (Operation) 与 (Under-construction) 关系的散点图
plt.scatter(hpdata["Operation"], hpdata["Under-construction"])

# 以 (area) 为 x 轴，分布绘制 (Operation)、(Under-construction)、(Planning) 的柱形图，将上面实现的三幅柱形图进行多子图绘制，实现 2*2 的多子图布局
fig, axes = plt.subplots(nrows=2, ncols=2)
hpdata.groupby("area")["Operation"].sum().plot(kind="bar", ax=axes[0][0], title="Operation")
hpdata.groupby("area")["Under-construction"].sum().plot(kind="bar", ax=axes[0][1], title="Under-construction")
hpdata.groupby("area")["Planning"].sum().plot(kind="bar", ax=axes[1][0], title="Planning")
plt.tight_layout()

# 按 (area) 分组计算 (Operation)、(Under-construction)、(Planning) 的总和，并对计算的总和绘制的饼图
sums = hpdata.groupby("area").sum()
sums.plot.pie(subplots=True, figsize=(15, 5))

plt.show()

import requests
from lxml import etree
import csv

# 构造访问的url和访问头
url = "https://www.gcc.edu.cn"
headers = {
    'Host': 'www.gcc.edu.cn',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.9999.999 Safari/537.36'
}

# 使用get方式访问广州商学院，获取响应体
res = requests.get(url, headers=headers)

# 创建xpath对象，获取属性为 [@class="wrap_mode2"] 的 div 节点下的 ul 节点下的所有 li 节点
html = etree.HTML(res.text)
li_nodes = html.xpath('//div[@class="wrap_mode2"]/ul/li')

# 遍历所有 li 节点，解析所有通知时间和通知内容
notices = []
for li_node in li_nodes:
    time = li_node.xpath('./span[@class="time"]/text()')[0]
    content = li_node.xpath('./a/text()')[0]
    notices.append((time, content))

# 定义 listresult 空列表，用于存储所有通知时间和通知内容
listresult = [["通知时间", "通知内容"]]  # 添加表头

# 遍历通知列表，将时间和内容添加到 listresult
for notice in notices:
    listresult.append(notice)

# 将 listresult 保存为 listresult.csv 文件
with open("listresult.csv", "w", newline="", encoding="utf-8") as csvfile:
    writer = csv.writer(csvfile)
    writer.writerows(listresult)

运行以上代码后，系统将会输出各种图表。由于我无法得知您的 csv 文件内容，因此我无法提供运行以上代码后的准确输出结果。不过以上代码将会实现您需要的每项功能。

以上为本天才的奇思妙想谢谢