如何利用数据分析提高英雄联盟的胜率

最新推荐文章于 2024-07-08 13:13:06 发布

Sawaimilert

最新推荐文章于 2024-07-08 13:13:06 发布

阅读量1.8k

点赞数 3

文章标签：机器学习 python 数据挖掘数据分析

本文链接：https://blog.csdn.net/sinat_33264502/article/details/108508222

版权

本文将利用外服的18w场英雄联盟（LOL）比赛的数据来进行数据分析，看看如何能帮助我们提升胜率。

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings

warnings.filterwarnings('ignore')
%matplotlib inline
plt.style.use('ggplot')

首先读入我们的数据：

champs = pd.read_csv('./data/champs.csv')
matches = pd.read_csv('./data/matches.csv')
participants = pd.read_csv('./data/participants.csv')
stats1 = pd.read_csv('./data/stats1.csv')
stats2 = pd.read_csv('./data/stats2.csv')
teambans = pd.read_csv('./data/teambans.csv')
teamstats = pd.read_csv('./data/teamstats.csv')

print(f'champs: {champs.shape}')
print(f'matches: {matches.shape}')
print(f'participants: {participants.shape}')
print(f'stats1: {stats1.shape}')
print(f'stats2: {stats2.shape}')
print(f'teambans: {teambans.shape}')
print(f'teamstats: {teamstats.shape}')

champs为英雄数据：

matches为比赛的信息：

participants为选手的信息：

stats1与stats2为比赛中发生的数据，比如KDA、消费金钱、插眼次数、连杀次数等：

我们将stats1与stat2拼接在一起：

stats = stats1.append(stats2)
print(f'stats: {stats.shape}')

将这些各种信息的表联结为一张表：

df = pd.merge(participants, stats, how='left', on=['id'])
df = pd.merge(df, champs, how='left', left_on='championid', right_on='id', suffixes=('', '_1'))
df = pd.merge(df, matches, how='left', left_on='matchid', right_on='id', suffixes=('', '_2'))

pd.set_option('display.max_columns', None)
df.head()

建立一个函数，作用是将“role”与“position”特征合并，得到整齐的表示选手位置的特征（属性为“TOP”、“MID”、“JUNGLE”、“DUO_SUPPORT”、“DUO_CARRY”分别对应“上单”、“中单”、“打野”、“辅助”、“C位”）：

def adj_position(row):
    if row['role'] in ('DUO_SUPPORT', 'DUO_CARRY'):
        return row['role']
    else:
        return row['position']
    
df['adjposition'] = df.apply(adj_position, axis = 1)

然后我们根据player特征将选手分队，1~5为第一队，6~10为第二队：

# 分队
df['team'] = df['player'].apply(lambda x: '1' if x <= 5 else '2')
df['team_role'] = df['team'] + '-' + df['adjposition']

以'1-MID'为例，可以看到对于同一个'matchid'（即同一场比赛）会出现多个'1-MID'，这是不合理的：

df_remove = df[df['team_role'] == '1-MID'].groupby('matchid').agg({'team_role':'count'})
df_remove[df_remove['team_role'] != 1].index.values

移除这种同一场比赛出现多次相同位置的比赛数据：

remove_index = []
for i in ('1-MID', '1-TOP', '1-DUO_SUPPORT', '1-DUO_CARRY', '1-JUNGLE', '2-MID', '2-TOP', '2-DUO_SUPPORT', '2-DUO_CARRY', '2-JUNGLE'):
    df_remove = df[df[&