详情页

  大多数网站都是以列表页详情页的数据层次结构进行组织的,例如我们进入新浪新闻频道,有很多标题链接,这可认为是列表页。点标题链接后进入的便是详情页。

  详情页:包含具体内容的页面,如一篇网页文章,里面含有:标题,作者,发布日期,正文内容,标签等等。

例子:

简数采集中,使用详情提取器来配置要采集文章的哪些字段(标题、正文等):

  为了简化操作,系统默认提供一些常用字段:

  title(标题),author(作者),pubDate(发布日期),content(内容),tag(标签),description(描述),keywords(关键字),category(分类)。

  用户可以根据实际情况增减字段,不过还是建议使用默认的,方便后续的其它操作。


简数导航: 简数采集   简数控制台   如何使用简数SEO工具(推荐)   微信公众号文章采集   今日头条采集  

results matching ""

    No results matching ""