简数导航:简数控制台 采集入门教程 数据导出发送 采集翻译 采集场景示例
列表提取器(网址采集规则)
列表提取器用于批量提取多个详情页链接(即设置网址采集规则),配置主要有3个步骤:
- 点击“重置当前字段”按钮,清除已有配置重新开始;
- 用鼠标点击目标采集链接(标题),只需点击两个不同链接,系统便会自动选中所有相似链接;
- 检查页面左侧 “数据预览” 区域,若显示相应链接地址则配置成功(缺少域名的相对链接也可正常使用)。若未显示链接,可尝试调整点选范围,正确配置的【当前字段Xpath】通常以
a或者a/kds结尾。
网址采集配置结果示例:
完整操作步骤:
1. 清除原有配置
适用场景:智能向导创建任务过程中、或任务创建完成后,如果网址采集规则有误时,可进入 “列表提取器” 进行修改。
操作:在列表提取器右上方点击 【重置当前字段配置】按钮,点击 【OK】,即可清除全部已有配置:
2. 在页面上点选目标采集链接
操作:在可视化窗口中,用鼠标点击两个不同的目标采集链接(通常为标题),系统会自动识别并选中所有同类链接。
验证:查看页面左侧 “数据预览” 区域:
- 若显示出对应链接地址(相对链接、绝对链接均有效),说明配置正确;
- 若未显示链接,可依次尝试以下解决方案:
1)调整点选范围:重新选择,调整点选的区域范围(扩大或缩小),也可尝试选择其他可跳转的同类链接(如 “阅读全文” 按钮);
2)手动修改 “当前字段 Xpath”:详情链接的 Xpath 值通常以/a 或a/kds结尾,若当前结果末尾不符,可删除结尾多余部分(/kds 删除或保留均不影响效果);
3)开启动态加载:若目标采集区域内容为空,可尝试勾选“使用JS动态数据”选项,通过动态加载页面后再尝试点选;
4)特殊链接处理:若链接地址在 onclick 属性中,可点击查看《如何获取特殊链接网址教程》;
如果以上方法都无法解决,请联系官方协助:QQ:2926881910、3071166977、3043176563;
3. 列表页配置常见问题及解决
1)列表提取器的入口
列表提取器的入口,位于任务基本信息页面下方;
2)多列表页采集规则通用性验证
适用场景:任务配置了多列表页采集(如翻页)时,验证规则在其他列表页是否生效。
操作方式:点击【典型列表页网址】输入框,在下拉列表中选择其他列表页链接,查看数据预览是否正常显示链接即可。