机器学习--第八讲--项目：预测桌游评论

weixin_33756418

于 2016-10-28 11:34:00 发布

阅读量81

点赞数

文章标签：人工智能 python

原文链接：https://my.oschina.net/Bettyty/blog/777223

版权

2019独角兽企业重金招聘Python工程师标准>>>

1.桌游评论

最近，桌游又卷土重来，更深入的是，越来越多的战略桌游，比如Settlers of Catan，受到了巨大的欢迎。一个受欢迎的网站BoardGameGeek对这些类型的桌游进行了讨论和评述。

在这个项目中，你将会研究一个包含80000个桌游和他们相关的反馈分数。这组数据是 Sean Beck通过BoardGameGeek网站抓取的，并编译成CSV 形式。数据集被保存为board_games.csv，可以在这里here.下载。

如果你在任何地方遇到问题，可以到我们的解决问题板块here来咨询。

这里是数据集的前5行信息：

每一行代表了一种桌游，并且带有桌游的描述统计信息，连同反馈信息。这里有一些有趣的列名：

name--桌游的名字

playingtime-玩游戏时间（由制造商提供）

minplaytime--玩游戏的最少时间（由制造商提供）

maxplaytime--玩游戏的最多时间（有制造商提供）

minage---推荐的最小玩游戏年龄

users_rated----评价游戏的用户数

average_rating---用户给予游戏的平均评级（0-10）

total_weights---用户评判的“重量”数量，weight是BoardGameGeek创造的一种主观测量方式。他是涉及一个游戏有多有趣。 Here's 这里是它的所有解释。

average_weigh---所有主观权重的平均分（0-5）

机器学习一个有趣的任务也许就是使用其他列来预测average_rating。数据集包含相当多的错误值，并且很多行都没有评估，分数是0。为了让预测更加容易，你需要先把数据集合的这些错误都移除。

。通过Pandas库来读取board_games.csv数据框架，然后命名为board_games

。打印出board_games中的前几行，仔细观察数据

。使用数据框架的dropna方法以及把axis设置为0，来移除任何包含错误值的行。

。移除board_games里任何users_rated等于0的行。每个没有反馈的行也都删掉。

import pandas as pd
board_games=pd.read_csv("board_games.csv")
board_games=board_games.dropna(axis=0)
board_games=board_games[board_games["users_rated"]>0]
board_games.head()

转载于:https://my.oschina.net/Bettyty/blog/777223

weixin_33756418

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。