简数导航:简数控制台  采集入门教程  数据导出发送  采集翻译  采集场景示例

列表提取器(网址采集规则)

  列表提取器用于批量提取多个详情页链接(即设置网址采集规则),配置主要有3个步骤:

  1. 点击“重置当前字段”按钮,清除已有配置重新开始;
  2. 用鼠标点击目标采集链接(标题),只需点击两个不同链接,系统便会自动选中所有相似链接;
  3. 检查页面左侧 “数据预览” 区域,若显示相应链接地址则配置成功(缺少域名的相对链接也可正常使用)。若未显示链接,可尝试调整点选范围,正确配置的【当前字段Xpath】通常以a或者a/kds结尾。

网址采集配置结果示例:

完整操作步骤:

  1. 清除旧配置
  2. 在页面上点选目标采集链接
  3. 列表页配置常见问题及解决

1. 清除原有配置

  适用场景:智能向导创建任务过程中、或任务创建完成后,如果网址采集规则有误时,可进入 “列表提取器” 进行修改。

  操作:在列表提取器右上方点击 【重置当前字段配置】按钮,点击 【OK】,即可清除全部已有配置:


2. 在页面上点选目标采集链接

  操作:在可视化窗口中,用鼠标点击两个不同的目标采集链接(通常为标题),系统会自动识别并选中所有同类链接。

  验证:查看页面左侧 “数据预览” 区域:

  • 若显示出对应链接地址(相对链接、绝对链接均有效),说明配置正确;

  • 若未显示链接,可依次尝试以下解决方案:

  1)调整点选范围:重新选择,调整点选的区域范围(扩大或缩小),也可尝试选择其他可跳转的同类链接(如 “阅读全文” 按钮);

  2)手动修改 “当前字段 Xpath”:详情链接的 Xpath 值通常以/aa/kds结尾,若当前结果末尾不符,可删除结尾多余部分(/kds 删除或保留均不影响效果);

  3)开启动态加载:若目标采集区域内容为空,可尝试勾选“使用JS动态数据”选项,通过动态加载页面后再尝试点选;

  4)特殊链接处理:若链接地址在 onclick 属性中,可点击查看《如何获取特殊链接网址教程》;

  如果以上方法都无法解决,请联系官方协助:QQ:2926881910、3071166977、3043176563;


3. 列表页配置常见问题及解决

1)列表提取器的入口

  列表提取器的入口,位于任务基本信息页面下方;

2)多列表页采集规则通用性验证

  适用场景:任务配置了多列表页采集(如翻页)时,验证规则在其他列表页是否生效。

  操作方式:点击【典型列表页网址】输入框,在下拉列表中选择其他列表页链接,查看数据预览是否正常显示链接即可。


简数导航:简数首页  简数控制台  采集入门教程  数据导出发送  采集翻译

results matching ""

    No results matching ""