我想写一个脚本来存储和分析我的互联网使用情况,但是除了一个简单的访问页面列表之外,我还想为每个页面包含一个“来自”和“去往”,这样我就可以将数据显示为一个加权有向图。但我不知道该用什么。在
因为这是我第一次尝试在浏览器之外使用互联网,所以我不知道该找什么关键字。我遇到的大多数东西都非常复杂,只对网络管理员有用,但我不关心那些低级数据,我只需要URL。此外,只监视传输的数据不会告诉我为了传输数据我做了什么(我想)。
这个问题听起来像是Firefox插件的工作,但显然他们不允许将数据写入磁盘,我宁愿避免在一个项目中接触JavaScript。在
理想情况下,它应该处理可点击的链接、书签和手动地址条目,以及多个选项卡或窗口。我给你举个例子:打开Firefox,开始页面是谷歌在
在另一个选项卡中打开Stackexchange
转到stackoverflow,搜索并浏览问题
切换到google标签,搜索lolcats,点击第一个结果(icanhas.cheezburger.com网站)读几页
转到facebook
去谷歌,关闭火狐
这将产生以下结果:添加节点('google')
添加节点('stackexchange')
add_node('stackoverflow');add_edge('stackexchange','stackoverlow')
add_node('cheezburger');add_edge('google','cheezburger')
add_node('facebook');add_edge('cheezeburger','facebook')
add_edge('facebook'、'google')
或者至少按照页面加载的顺序列出页面,然后我可以为每个唯一的条目添加一个节点,并通过对迭代来添加边缘,但是如果我使用多个选项卡,这个结果将是错误的
摘要:
使用Python或Java我想监视我的互联网流量(至少)或Webbrowser(最好?)这样,每当单击链接、手动输入地址或加载书签时,都会返回目标位置以及来源(当前活动选项卡的URL)。如果可能的话,把我推到正确的方向。在