简数导航:简数首页  简数控制台  采集入门教程  数据导出发送  采集翻译

下级页面(跳转子页面)采集

如果需要采集的内容在详情页的下级页面(跳转子页面)中,例如下载页,多选项卡页等,可使用简数采集器的分页采集功能来获取。

具体使用方法:

  1. 选择跳转链接区域
  2. 获取下级页面内容的Xpath值
  3. 填写Xpath值到提取器

1. 选择跳转链接区域

  在简数详情页提取器中,勾选对应字段的【该字段内容有多分页】选项 -》启用【分页点选开关】 (显示 √ 标志),然后选择包含下级页面跳转链接的区域。

  比如下图为例,课程介绍是详情页,还需要采集章节目录页里的内容,对应字段分页区域则应选择包含章节目录跳转链接的区域。


2. 获取下级页面内容的Xpath值

  在浏览器访问跳转页面链接(如章节目录页面),获取要采集的内容区域的xpath值://*[@class="chapter-ul"]

备注:如何获取xpath值可查看《Xpath常见语法使用详细教程》。


3. 填写Xpath值到提取器

  在简数采集器详情页提取器对应字段的当前字段Xpath处,填写下级页面内容的xpath值://*[@class="chapter-ul"],保存后测试采集,检查效果。


简数导航:简数首页  简数控制台  采集入门教程  数据导出发送  采集翻译

results matching ""

    No results matching ""