自动爬取微博热门评论和点赞数并存为EXCEL文件(python2)

前言 上篇文章介绍了如何获取Cookie并爬取微博评论,但评论千千万,我们可能只对点赞数高的评论感兴趣,也就是热门评论。但要想获取热门评论,用之前的方法得把评论爬个遍,然后按点赞数排序。这种做法一来费时,二来爬的不完整(除非把微博数据库全爬下来)。但微博后台已经帮我们给所有评论排了序,所以我们直...

2018-12-01 16:24:44

阅读数:122

评论数:2

Ubuntu删除core中部分文件后没有声音

硬盘空间不足,给linux做了下瘦身,结果耳机没声音了很难受。安装pavucontrol也没用。aplay -l显示没有声卡aplay: device_list:221: no soundcard found...但用lspci | grep -i audio可以找到声卡信息ls -la /dev...

2018-05-30 16:36:19

阅读数:66

评论数:0

Ubuntu 16.04中Stardict词典安装和使用(可以屏幕取词)

1、安装stardict命令行:sudo apt-get install stardict2、下载词典下面这位仁兄的词典很全,大家可以按需下载。http://download.huzheng.org/3、导入词典假如下载在Downloads文件夹中。在~/目录下输入命令行:sudo tar jxf...

2018-04-09 14:35:44

阅读数:699

评论数:0

用fiddler获取微信评论

要获取微信上公众号文章的评论,直接在PC上打开相应网页会发现并没有评论内容,这点和微博移动端不同。所以我只能直接截获手机上的包。这里我使用了Fiddler软件。Fiddler的安装和运行并不复杂,有点麻烦的是配置Fiddler的客户端并让手机安装Fiddler的证书。 1、Fiddler客户端的...

2018-02-07 20:53:33

阅读数:286

评论数:0

爬取新浪微博评论及点赞数并存储为excel的.csv格式

1、获取cookie,先进入微博页面登陆微博,如进入https://m.weibo.cn/status/4173028302302955后登陆,再使用chrome的F12可方便地获取自己的cookie,获取Cookie所需的选择项如下图所示,往下拉会看到自己的Cookie。 2、写爬虫,代码...

2018-02-05 16:21:20

阅读数:3843

评论数:4

python之获取本地文件名称

os 模块下有两个函数: os.walk() os.listdir() # -*- coding: utf-8 -*- import os def file_name(file_dir): for root, dir...

2017-11-06 14:26:46

阅读数:1914

评论数:0

python3和python2共存于windows

做实验需要python2,干别的需要python3。但不是linux系统,需要在windows10下安装两个版本(先装好了python2): 1、安装python3。 2、修改环境变量(将python3的环境变量加入系统变量Path)。 3、因为windows是按顺序找的且python2和3都是p...

2017-11-02 19:34:06

阅读数:100

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭