简数导航:简数首页 简数控制台 采集入门教程 数据导出发送 采集翻译
内容分页(详情分页,鼠标点击三下即可完成配置)
内容分页:指详情页的内容被拆分在多个页面(链接)中,采集时需要进行合并。
具体操作说明:
1. 分页配置流程
内容分页配置非常简单,在详情提取器中,鼠标点击三下即可完成配置:(以content字段为例)
- 勾选【该字段内容使用了分页】;
- 勾选【分页点选开关】 或者点击【分页区域Xpath】的输入框,以便开启进行第3步的操作;
- 点选分页链接所在区域。完成!
2. 其他参数配置(可选)
点击【更多分页设置】按钮,分页还可以配置其它参数:
- 分隔符:两个页面内容合并的分隔符;(
<br/>
标签是换行) - 最大分页数量:采集最大分页数量(0则不限制,计数包含首页);
- 分页链接包含字符:当采集的链接包含填写的字符,该链接会保留,不包含则会被过滤;
提示:通常用于当点选的分页区域含其它非分页链接时,可定义过滤非分页链接。
3. 分页采集限制
分页限制--目前分页链接采集只支持:首页全部列出模式(即其它链接全部在第一个页面展示出)。
如下图:可以完整采集分页内容;
如下图:只能采集显示的页数分页内容(1,2,3,4,5,6,11),中间 ... 的页数无法采集到;