简数导航:简数首页  简数控制台  采集入门教程  数据导出发送  采集翻译

2.1 创建采集任务

 采集数据,需先创建采集任务,并定义采集规则(支持鼠标点选式可视化配置)。

  创建采集任务提供以下两种模式:

  • 智能向导模式(推荐):自动识别网页内容并生成采集规则,适用于列表网址 + 详情页采集场景;
  • 高级模式:支持各种特殊网页类型采集,如表格数据、JSON数据采集;

详细使用教程:

  1. 创建采集任务(智能向导模式,推荐)
  2. 创建采集任务(高级模式)
  3. 常用字段说明


1. 创建采集任务(智能向导模式,推荐)

  只需输入目标网址,智能向导模式会自动识别网页内容,并生成采集规则,包括:列表页、翻页和详情页(标题、正文、作者、时间、标签等常用字段

  完整操作步骤可查看【文章采集入门教程】


2. 创建采集任务(高级模式)

  高级模式一般用于采集各种特殊网页类型,如表格数据、JSON数据采集等。

  注意:高级模式任务需自行配置采集规则,系统不会智能生成。

  支持多种采集模式:


常用字段说明

  简数详情提取器默认提供以下常用字段,可自由增删改:

  title(标题)、content(内容)、category(分类)、pubDate(日期)、author(作者)、tag(标签)、description(描述)、keywords(关键字)。


简数导航:简数首页  简数控制台  采集入门教程  数据导出发送  采集翻译

results matching ""

    No results matching ""