简数导航:简数首页  简数控制台  数据导出发送  采集翻译

简数采集器系统使用流程简介

简数采集器系统使用流程如下图所示:

简数采集器使用流程及主要功能简介:

1. 采集规则配置

  • 采集网址输入或批量生成;
  • 智能识别生成采集规则;
  • 可视化点选生成采集规则;
  • 图片下载:云存储、暂存;

2. 数据采集

  • 采集启动、暂停、继续、停止;
  • 定时自动采集;
  • 按关键词泛采集;
  • 数据基础处理:截取、填充、过滤、删除等;
  • 特殊网页采集:Json格式、网站地图、TXT、Rss等;

3. 数据处理、分析与翻译等(可选)

  • 常用的数据批量处理;
  • 自定义规则处理数据;
  • 多种翻译接口:谷歌翻译、百度翻译等;
  • 第三方API接口(含AI):文心一言、通义千问、5118等;
  • 手动或全自动执行;

4. 数据发送导出

  • 定时定量自动发送;
  • 文件导出:Excel、Sql、CSV、TXT、Html等;
  • 发送到开源CMS系统:Wordpress、Zblog、Discuz、帝国CMS等;
  • 发送到自定义http接口;
  • 发送到数据库;

results matching ""

    No results matching ""