一款更简单好用的Chrome爬虫插件 - Univer Clipsheet

Clipsheet是一款完全开源的Chrome爬虫插件, 通过易用的交互界面以所见即所得的方式, 快速的从页面中采集到你想要的表格,且可以通过简单配置将采集工作自动化。

[Github]: https://github.com/dream-num/univer-clipsheet

[官方网站]: Univer | ClipSheet

[Chrome商店]: Chrome插件商店-Clipsheet

如何安装 Clipsheet ?

可以直接访问上面的 Chrome商店链接安装,如果无法访问外网,可以通过该下载链接 Docs,下载插件的压缩包安装。

[插件压缩包安装教程]:Docs

快速开始

安装插件成功后,以CSDN的文章列表页https://blog.csdn.net/?spm=1001.2101.3001.4477作为展示, 可以看到Clipsheet插件已经在该网页中自动检测到 4 个表格,此时插件内 快速采集 的按钮也是高亮的, 直接点击按钮就可以通过插件采集到我们的第一个表格

高级功能教程:

仅通过所见即所得的方式从网页中采集表格可能是不够的,Clipsheet插件还提供各种高级功能以便我们将采集这一过程自动化,我们这里列出了插件高级功能的教程,如果使用上还有任何问题,欢迎及时联系我们反馈

采集器讲解-执行操作

操作步骤:

1、先打开要采集的网站,并点击右上角的小插件

2、通过滚动页面,可以获取更多元素哦,查看右上角的×行元素知道大概的采集行数

3、根据不同网页加载数据的方式在采集器内设置对应的操作

  • 数据量较大时建议将间隔时间设置的稍微长一些

               

4、想要采集标题对应的内容时可以设置下钻,选择想要的内容区域

5、可以通过查看预览页自定义调整列

6、运行采集器时会打开一个新的页面,可以通过该页面确定采集的进度

7、采集完成后通过侧边栏 - 数据查看文档并导出

工作流讲解:定时采集&定时更新采集

操作步骤:

1、新增工作流,会展示选择数据源选项

  • 选择数据源时,会往对应的表格内新增数据
  • 未选择数据源时,会自动采集生成一个文档

 2、在数据合并页面绑定要运行的采集器(教程见采集器讲解) ,自定义调整列后点击下一步

  • 可以绑定多个采集器,数据会统一汇总的到表格内

             

3、默认去重(比较所有的列),如不需要去重可以点击反选取消

4、在数据筛选页面可以设置过滤规则,采集想要的关键词数据等

                 

5、上面都设置完成后,我们就可以设置定时并保存运行啦

  • 到时间点后会自动采集数据,在侧边栏的数据内可查看数据并导出        

看完想要开发开发自己的爬虫插件?我教你!

开发插件的内容较多,单独开了新的文章去更新这部分内容,请通过以下文章阅读~

从零开始使用Univer Clipsheet构建自己的爬虫插件-CSDN博客

联系我们

Clipsheet插件使用中有任何问题或者优化建议,欢迎通过github来提交issue上报问题,或通过以下方式来联系我们

[微信用户群] 下滑到文档最下方扫码进入xakbyahbro.feishu.cn/docx/YU2BdT…

[Discord]  discord.gg/rbZcJPm4un

作者:用户779482129218
链接:https://juejin.cn/spost/7457364126970331162
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

<think>好的,用户的问题是关于如何导出Univer相关的文件或项目配置。首先,我需要回忆一下Univer项目的相关信息。根据提供的引用内容,特别是引用[3],Univer是一个基于TypeScript的开源工具套件,支持电子表格、文档和幻灯片的集成,并且具备导入导出功能。用户提到的导出可能涉及两个方面:项目配置的导出和通过Univer应用导出文件(如Excel)。 首先,关于导出项目配置。引用[2]提到Univer项目通过config.json配置文件或环境变量进行配置,用户可能需要知道如何导出这些配置设置。可能的步骤包括定位config.json文件,或者导出环境变量设置。这里需要确保路径正确,并且用户有权限访问这些文件。 其次,关于导出生成的文件,比如Excel。引用[1]和引用[3]都提到了导出功能,特别是引用[1]中的JavaScript封装代码,可能需要使用Blob对象来处理文件下载。用户可能需要调用Univer的API来获取数据,然后使用前端代码触发下载。例如,在JavaScript中,可以通过创建Blob和a标签来实现文件下载。 还需要考虑用户可能的错误,比如环境配置问题,这在引用[3]的新手注意事项中提到过。如果用户遇到问题,可能需要检查环境配置是否正确,比如TypeScript版本或依赖安装。 此外,用户的问题可能涉及到导出整个Univer项目,这时候可能需要使用版本控制工具如Git来导出项目代码,或者打包项目文件。同时,文档中提到的Apache-2.0许可证也需要遵守,确保合法使用。 最后,生成相关问题需要考虑用户可能的后续疑问,比如如何导入配置、处理导出错误或定制导出格式。这些问题有助于用户进一步了解Univer的功能和解决方案。</think>### 导出Univer文件或项目配置的方法 #### 1. **导出项目配置文件** Univer的项目配置主要通过 `config.json` 和环境变量管理。以下是具体步骤: - **定位配置文件** 项目根目录下的 `config.json` 存储了基础配置(如API地址、主题设置等)[^2]。 - **直接复制或备份** 将 `config.json` 文件复制到其他目录即可完成导出。例如: ```bash cp ./config.json ./backup/config_backup.json ``` - **环境变量导出** 若使用环境变量配置,可通过命令行导出当前环境变量: ```bash printenv > univer_env_variables.txt ``` #### 2. **通过Univer应用导出文件(如Excel)** Univer支持将电子表格导出为常见格式(如Excel),需调用其API并配合前端代码实现: ```javascript // 调用Univer API获取数据 const workbookData = univerAPI.exportAsExcel(); // 使用Blob处理文件下载 const blob = new Blob([workbookData], { type: 'application/vnd.openxmlformats-officedocument.spreadsheetml.sheet' }); const url = window.URL.createObjectURL(blob); const a = document.createElement('a'); a.href = url; a.download = 'univer_export.xlsx'; a.click(); window.URL.revokeObjectURL(url); // 清理内存 ``` 此代码会将数据转换为Excel文件并触发浏览器下载[^1][^3]。 #### 3. **导出整个Univer项目** 若需导出完整项目(包括代码和配置): - **使用Git打包** ```bash git clone https://github.com/univerjs/univer.git # 克隆仓库 tar -czvf univer_project.tar.gz ./univer # 打包为压缩文件 ``` - **依赖项管理** 确保 `package.json` 和 `node_modules/` 完整,便于在其他环境重建。 --- ### 注意事项 - **权限问题**:导出配置文件时需确保对目标目录有写入权限。 - **编码格式**:`config.json` 需保存为UTF-8格式,避免解析错误。 - **许可证合规**:导出项目代码需遵守Apache-2.0许可证要求。 ---
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

梦数技术团队

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值