2021年安徽省大数据与人工智能竞赛人工智能现场赛2和3题

第二题:

按照要求对给定txt格式数据进行处理。

task2.txt文件为本题的数据文件,第一行为特征的名称,从第二行开始为对应的特征数值(特征之间以空格隔开)。利用Python编写代码完成以下任务:

(1)分别求取MaxWindSpeedMPH和WindDirDegrees两个特征的均值和方差。

(2)对MeanWindSpeedMPHF特征进行标准化,输出标准化之后的MeanWindSpeedMPH特征的均值

标准化采用计算公式如下:

x'=x-min⁡(x)maxx-min⁡(x)

      其中,x表示标准化之前的特征,x'表示标准化之后的特征。

!说明:将代码源文件与运行结果截图放入比赛环境中本题对应的提交目录文件夹(桌面user文件夹下Q2文件夹)。

import numpy as np
import pandas as pd

data = pd.read_csv("./数据与代码/第二部分/task2.txt", sep=" ")
data_mean = np.mean(data.MaxWindSpeedMPH)

data_arr = np.var(data.MaxWindSpeedMPH)

print("MaxWindSpeedMPH均值为:", data_mean)
print("MaxWindSpeedMPH方差为:", data_arr)

data_mean = np.mean(data.WindDirDegrees)

data_arr = np.var(data.WindDirDegrees)

print("WindDirDegrees均值为:", data_mean)
print("WindDirDegrees方差为:", data_arr)

data_stand = (data.MeanWindSpeedMPH-min(data.MeanWindSpeedMPH))/(max(data.MeanWindSpeedMPH)-min(data.MeanWindSpeedMPH))
data_stand = np.mean(data_stand)
print("MeanWindSpeedMPH标准化之后特征的均值为:", data_stand)

第三题:

根据要求补全对应算法代码。

    数据集(scikit-learn安装完成内置)内包含 3 类鸢尾花,分别为山鸢尾(Iris-setosa)、变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica)。每类各 50 个数据,每条记录有 4 项特征:花萼长度、花萼宽度、花瓣长度、花瓣宽度。要求补全task3.py,达到分别使用逻辑回归模型和SVM模型训练分类器并测试的目的。

!说明:

(1)逻辑回归模型的最大迭代次数设为500;

(2)SVM模型的核函数固定为多项式函数、多项式函数的维度设置为4、错误项的惩罚系数为0.5;

(3)将所补充完整代码源文件与运行结果截图放入比赛环境中本题对应的提交目录文件夹(桌面user文件夹下Q3文件夹)。

from sklearn import datasets
from sklearn import svm
from sklearn import linear_model
import numpy as np
from sklearn.linear_model import LogisticRegression
from sklearn import svm
iris = datasets.load_iris()
print(type(iris), dir(iris))

x = iris.get('data')
y = iris.get('target')


num = x.shape[0]
ratio = 7 / 3
num_test = int(num / (1 + ratio))
num_train = num - num_test
index = np.arange(num)
np.random.shuffle(index)
x_test = x[index[:num_test], :]
y_test = y[index[:num_test]]
x_train = x[index[num_test:], :]
y_train = y[index[num_test:]]

#LogisticRegression
#################################################################
clf = LogisticRegression(max_iter=500)

clf.fit(x_train, y_train)
y_test_pre_regression = clf.predict(x_test)


#################################################

#SVM
#################################################################
svm = svm.SVC(kernel="poly", degree=4, C=0.5)
svm.fit(x_train, y_train)
y_test_pre_svm = svm.predict(x_test)

#################################################

acc_regression = sum(y_test_pre_regression == y_test) / num_test
acc_svm = sum(y_test_pre_svm == y_test) / num_test
print('regression: The accuracy is', acc_regression)
print('svm: The accuracy is', acc_svm)

阿里云 https://mirrors.aliyun.com/pypi/simple/
中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/
豆瓣(douban) https://pypi.douban.com/simple/
清华大学 https://pypi.tuna.tsinghua.edu.cn/simple/
中国科学技术大学 https://pypi.mirrors.ustc.edu.cn/simple/
 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
2021年,CSDN与安徽省联合举办了一场大数据与人工智能应用竞赛。此次竞赛旨在鼓励和推动大数据与人工智能技术在各个领域的应用与创新,为安徽省培养优秀的大数据与人工智能人才。 该竞赛为参者提供了一个良好的平台,让他们可以展示其在大数据与人工智能领域的专业知识和技能。参者可以以个人形式或组队形式参,他们需要根据竞赛提供的目进行相关的数据分析和模型建立,最终提交解决问的方案。 本次竞赛目涉及到不同领域的大数据与人工智能应用,如智能交通、医疗健康、智慧城市等。参者需要利用自己的专业知识和技术,在给定的数据和场景下,通过数据分析和模型建立,解决实际问。 参者的作品将根据创新性、技术水平、实际应用价值等方面进行评审,评选出一、二、三等奖以及优秀奖。获奖者将有机会获得奖金或其他奖励,并在相关媒体上进行宣传报道。 此次竞赛不仅提供了一个平台,让参者展示自己的才能,还促进了大数据与人工智能技术在安徽省的应用与推广。为安徽省的信息化和智能化发展做出了积极贡献。 总之,CSDN2021年安徽省大数据与人工智能应用竞赛为广大参者提供了一个展示自己技术与创新能力的机会,同时也推动了大数据与人工智能技术在安徽省的应用发展。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值