本章介绍简数采集器的一些基本概念。

基本概念

  1. 列表页:是内容的 “目录” 或 “索引页”,比如新闻网站首页、分类栏目页、博客的文章列表、商品搜索结果页,我们可以从列表页里面提取大量文章(详情页)的网址;
  2. 详情页:是 “具体内容” ,我们从里面提取 “详细的信息” ,比如一篇文章的标题、正文、作者、发布时间、来源等;
  3. 列表提取器:主要用于提取多个详情页链接(即设置网址采集规则);
  4. 详情提取器:提取详情页中的内容,可视化采集和自动生成提取规则,无需看页面源代码,简单快捷完成采集规则配置;


简数导航:简数控制台  采集入门教程  数据导出发送  采集翻译  采集场景示例

results matching ""

    No results matching ""