5分钟上手Google Indexing Script与数据可视化工具集成:Tableau、Power BI实操指南
【免费下载链接】google-indexing-script 项目地址: https://gitcode.com/gh_mirrors/go/google-indexing-script
你是否还在为网站页面未被Google及时收录而烦恼?是否希望通过数据可视化工具直观监控索引状态变化?本文将带你使用Google Indexing Script自动获取网站索引数据,并通过Tableau、Power BI创建专业分析仪表盘,实现从数据采集到决策支持的全流程自动化。读完本文你将掌握:索引数据批量导出方法、可视化模板制作、异常状态预警配置。
核心功能与数据流程
Google Indexing Script通过Google Search Console API获取网站索引状态数据,支持批量处理URL并生成标准化报告。项目核心模块src/shared/gsc.ts实现了与Google Search Console的交互,提供索引状态查询、URL提交等功能;src/shared/sitemap.ts负责从站点地图提取URL列表;src/index.ts则实现了完整的批处理逻辑与缓存机制。
数据流转路径如下:
环境准备与数据导出
1. 项目部署与依赖安装
通过以下命令克隆项目并安装依赖:
git clone https://gitcode.com/gh_mirrors/go/google-indexing-script
cd gh_mirrors/go/google-indexing-script
npm install
2. 索引数据采集与导出
配置Google服务账号凭证后,执行索引状态扫描:
npx ts-node src/bin.ts --client-email=your-email@project.iam.gserviceaccount.com --private-key=your-private-key --path=./credentials.json
扫描完成后,脚本会在.cache目录下生成JSON格式的索引状态缓存文件。通过修改src/index.ts第136行代码,添加CSV导出功能:
// 在writeFileSync行后添加CSV导出逻辑
import { createObjectCsvWriter } from 'csv-writer';
const csvWriter = createObjectCsvWriter({
path: 'index-status-report.csv',
header: [
{id: 'url', title: 'URL'},
{id: 'status', title: 'Index Status'},
{id: 'lastCheckedAt', title: 'Last Checked'}
]
});
await csvWriter.writeRecords(Object.entries(statusPerUrl).map(([url, data]) => ({
url,
status: data.status,
lastCheckedAt: data.lastCheckedAt
})));
Tableau集成实现
1. 数据导入与处理
- 打开Tableau Desktop,选择"文本文件"数据源,导入生成的
index-status-report.csv - 在数据模型中创建计算字段"状态分类":
IF [Index Status] = 'SubmittedAndIndexed' THEN '已收录'
ELSEIF [Index Status] = 'CrawledCurrentlyNotIndexed' THEN '已抓取未收录'
ELSEIF [Index Status] = 'DiscoveredCurrentlyNotIndexed' THEN '已发现未收录'
ELSE '异常状态'
END
2. 索引状态仪表盘制作
创建包含以下视图的仪表盘:
- 索引状态分布饼图(使用src/shared/gsc.ts中定义的状态分类)
- URL数量趋势折线图(按检查日期分组)
- 异常状态URL明细表(包含完整URL与检查时间)
Power BI集成实现
1. 数据加载与转换
- 导入CSV文件并使用Power Query编辑器处理:
- 拆分"Last Checked"列为日期/时间格式
- 添加条件列"状态优先级",为不同索引状态分配权重值
2. 交互式报表设计
使用以下DAX公式创建关键指标:
已收录比例 =
DIVIDE(
COUNTROWS(FILTER('index-status-report', 'index-status-report'[Index Status] = "SubmittedAndIndexed")),
COUNTROWS('index-status-report')
)
创建包含切片器的响应式报表,支持按日期范围、状态类型筛选数据。
高级应用:异常监控与预警
通过配置Tableau数据警报或Power BI数据流刷新,实现异常状态自动通知:
- 在Tableau中对"已发现未收录"状态设置阈值警报
- 在Power Automate中创建数据流,当异常URL数量超过阈值时发送邮件通知
核心实现可参考src/shared/gsc.ts第182-199行的状态 emoji 映射逻辑,建立可视化的状态标识系统。
总结与扩展方向
本文介绍的集成方案已覆盖基础索引状态可视化需求。进阶方向可考虑:
- 实现src/index.ts与BI工具的实时数据连接
- 开发自定义Power BI视觉对象展示URL索引趋势
- 结合Google Analytics数据创建索引-流量关联分析
完整项目文档可参考README.md,贡献代码可查阅CONTRIBUTING.md。收藏本文,关注项目更新获取更多可视化模板。
【免费下载链接】google-indexing-script 项目地址: https://gitcode.com/gh_mirrors/go/google-indexing-script
创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考




