简数导航:简数首页  简数控制台  采集入门教程  数据导出发送  AI写作生成

详情页数据采集

  根据提供的详情页网址(零散或批量生成),直接采集详情页内容,无需列表页。一个详情页为一条数据。

详细使用步骤:

  1. 启用 "详情页" 采集模式
  2. 采集规则配置
  3. 采集结果


1. 启用 "详情页" 采集模式

  在采集任务列表【创建采集任务(高级模式)】-> 采集模式选择【详情页(单网页:零散、批量或无限循环)】-> 输入任务名和采集的详情页网址,保存 -> 进入详情提取器配置采集规则。

  采集的详情页网址可以是零散几个,或按数字递增批量生成。


2. 采集规则配置

  详情提取器配置采集规则:

  可视化鼠标操作界面,快速自定义选择采集多种内容(如标题、正文、标签、关键词等),还可设置自动数据处理(如多余链接处理、文本替换、提取内容、数据过滤、HTML标签清除等)。

  详细使用说明可看详情提取器-内容采集规则配置

  

  字段数据处理配置:

  完成采集规则配置后,点击右上角保存


3. 采集结果

  启动任务进行采集。

采集完成结果如下图所示:


简数导航:简数首页  简数控制台  采集入门教程  数据导出发送  采集翻译

results matching ""

    No results matching ""