知乎用户分布研究

泰戈尔

于 2017-05-22 15:36:45 发布

阅读量9.6k

点赞数 6

分类专栏： Python奇技淫巧待解决的问题集文章标签：爬虫知乎用户数据知乎数据获取

本文链接：https://blog.csdn.net/marksinoberg/article/details/72626541

版权

Python奇技淫巧同时被 3 个专栏收录

118 篇文章 28 订阅 ¥39.90 ¥99.00

订阅专栏

超级会员免费看

待解决的问题集

9 篇文章 0 订阅

订阅专栏

前端图表库

4 篇文章 0 订阅

订阅专栏

本文探讨了使用爬虫抓取并分析知乎用户分布的过程，包括请求头设置、频率控制、数据库存储（使用sqlite3）以及初步的web服务实现。虽然在echarts地图展示上遇到困难，但已实现部分用户数据的收集和展示。

摘要由CSDN通过智能技术生成

- 前言
- 框架搭建
- 模块化
  - 爬虫
  - 数据库
  - 调度器
  - web服务
- 总结

前言

虽然知乎早已不是最开始的样子了，但是其用户还是很广泛的。我原本打算做的写个爬虫，把用户的居住地，学历，专业等信息爬下来。然后持久化到数据库中，最后写个web服务，用图标的形式展示出来。

但是echarts地图这块，还需努力。尽管做了调试，效果还是不甚理想。汗颜(⊙﹏⊙)b

框架搭建

正如前言部分所述，这里用到的技术还是挺多的。
简要的来展示一下项目目录吧。

C:\Users\biao\Desktop\network\code\zhihu-range>tree . /f
文件夹 PATH 列表
卷序列号为 E0C6-0F15
C:\USERS\BIAO\DESKTOP\NETWORK\CODE\ZHIHU-RANGE
│  dbhelper.py
│  scheduler.py
│  spider.py

了解本专栏

超级会员免费看

泰戈尔

关注

6
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
6
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录