简数导航: 简数采集器   简数控制台  

2.1 创建采集任务

 要采集数据,必须先创建一个采集任务,并定义采集规则(鼠标点选即可)。
  • 创建普通采集任务有两种方式: 智能向导 【创建采集任务】 和高级创建 【创建任务(高级)】 ;

详细使用教程:

  1. 智能向导 【创建采集任务】(推荐使用)
  2. 高级创建 【创建任务(高级)】
  3. 常用字段


1. 智能向导 【创建采集任务】(推荐使用)

  智能向导可以自动生成普通文章常用的字段(标题,内容,日期等,详情见常用字段)。

  完整的详细教程请看【文章采集入门教程】;

  提示:需完整完成智能向导步骤(点击 ‘下一步’ 直到 ‘Finish’),系统才会自动生成常用字段。


2. 高级创建 【创建任务(高级)】

  使用高级创建任务需要用户自己定义字段。一般用于采集跟自己业务比较相关的字段信息,如商品等。

  创建高级任务后,基本信息,列表提取器和详情提取器规则都为空,需自行设置;

  采集模式:

  • 列表+详情页(批量采集):默认模式,适合要采集的详情页(内容数据)的网址是从列表页中提取的,“采集起始网址”中配置的网址指列表页网址;

  • 详情页(零散或批量采集):适合要直接采集的内容页,它不需要从其它页面获取网址。


常用字段

  【创建采集任务】按照智能向导步骤,一步步操作,完成后详情提取器会自动生成以下默认常用字段:

  title(标题),author(作者),pubDate(日期),content(内容),tag(标签),description(描述),keywords(关键字),category(分类)。


简数导航: 简数采集器   简数控制台

results matching ""

    No results matching ""