机器学习入门例子--预测浏览量

本文介绍了一种使用Python的Scipy和Matplotlib库进行机器学习的方法,特别是针对预测网页浏览量的问题。首先,数据从tsv文件加载并处理缺失值,然后通过绘制图表对数据进行可视化。接着,使用Scipy的polyfit()函数进行一次线性拟合,但发现一阶直线模型对数据的拟合效果不佳。文章结尾指出,对于更复杂的机器学习任务,可以使用scikit-learn库。
摘要由CSDN通过智能技术生成
下面介绍预测浏览量的例子,构建第一个机器学习的例子,其中需要的数据我放在这里了: http://pan.baidu.com/share/link?shareid=1399332518&uk=3510054274。我们的数据的格式是这样的:
总共有743条,用word的写字板打开我网盘里的文件:web_traffic.tsv。这里数据的第一列表示时间(小时),第二列表示在这个小时内网站点击量(比如说第一行1  2272,表示第1个小时的点击量为2272次)。而我们所要做的工作便是通过这些数据去预测未来的点击量,从而未我们的网站建设提供一些指导,比如说我们需要多少服务器来支撑这样的点击量,如果我们能够提前知道就可以节省很多钱,总比事先买很多服务器好哈。

首先,我们要做的是把这些数据读到我们的程序里去。方法是使用SciPy的genfromtxt(),首先打开开始菜单中的所有应用程序找到Python 2.7,选择第一个IDLE(Python GUI)或者打开cmd,然后再敲入python,也是可以的:

然后输入:

import scipy as sp

data=sp.genfromtxt(“web_traffic.tsv”,delimiter=”\t”)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值