项目简介:
开发一款类似 similarweb 的竞品网站分析工具,1.0版本只需要参考他们免费版的功能。
抓取全网(整个互联网)公开可以获得的网页数据信息,除了通过网页爬取内容之外,还有如国内主流的搜索引擎,网站流量分析平台,或者其他第三方平台api接口的数据,另外是主流浏览器的数据。
similar web 官网:
https://www.similarweb.com
1、需要实现的核心功能:只要输入URL,就能分析任何国内网站的指定数据
2、前端效果参考similarweb免费版页面
3、后端需求待定
4、需要蜘蛛机器人
数据来源方式:
1、浏览器、应用程序
2、互联网服务商,进行数据合作
3、目标网站分析
4、网络爬虫,扫描整个网络
其他参考网站:
2、爱站:
www.aizhan.com
3、5118:
http://www.5118.com
4、Alexa中国:
http://www.alexa.cn
5、Alexa:
https://www.alexa.com
1.0版本需求:
以下功能哪些可以通过现有的技术手段实现?哪些需要第三方合作?哪些无法实现?
用什么技术实现?什么语言开发?哪些功能点投入成本比较高?
栏目 | 功能说明 | 备注 |
网站概述 |
1、抓取网站简介、所在地址、首页截图
2、国内排名、百度收录量、站长权重
3、网站总访问量预估
4、访问流量地区排名:省、市
5、流量来源占比分析:
| |
链接分析 |
1、访客来源链接排名
2、访客去向链接排名
| |
搜索分析 |
1、自然搜索关键词排名
2、付费搜索关键词排名
| |
媒体分析 |
1、微博、豆瓣、优酷、百度知道来源占比
2、百度新闻源数量统计
| |
网站内容 |
1、子域名流量占比
2、文件夹流量占比
3、最受欢迎的页面流量占比
| |
人群分析 | 1、访客兴趣分析;来源和去向链接综合分析 | |
竞争对手 |
1、相似网站
2、竞品关键词
|
1.0版本我希望是一个轻量级的,功能可以是比较简单的。
开发周期200天左右
联系方式:
欧文
QQ:306005350
电话、微信:18320098926