简数导航:简数首页 简数控制台 采集入门教程 数据导出发送 采集翻译
下级页面(跳转子页面)采集
如果需要采集的内容在详情页的下级页面(跳转子页面)中,例如下载页,多选项卡页等,可使用简数采集器的分页采集功能来获取。
具体使用方法:
1. 选择跳转链接区域
在简数详情页提取器中,勾选对应字段的【该字段内容有多分页】选项 -》启用【分页点选开关】 (显示 √ 标志),然后选择包含下级页面跳转链接的区域。
比如下图为例,课程介绍是详情页,还需要采集章节目录页里的内容,对应字段分页区域则应选择包含章节目录跳转链接的区域。
2. 获取下级页面内容的Xpath值
在浏览器访问跳转页面链接(如章节目录页面),获取要采集的内容区域的xpath值://*[@class="chapter-ul"]
备注:如何获取xpath值可查看《Xpath常见语法使用详细教程》。
3. 填写Xpath值到提取器
在简数采集器详情页提取器对应字段的当前字段Xpath处,填写下级页面内容的xpath值://*[@class="chapter-ul"]
,保存后测试采集,检查效果。