简数采集常见问题

  1. 任务启动后,可以切换或关闭页面吗?
  2. 任务一直处于运行状态,但没有更新提示或者没有采集到数据
  3. 详情提取器的description和keywords字段如何设置?
  4. 如何采集已删除的数据?


1.任务启动后,可以切换或关闭页面吗?

  可以的。启动采集(包括定时采集、自动发布)、按条件发布这些启动或执行后都可以关闭页面,包括关机。任务会在云端自动运行的。

  “按列表选择发布” 发布过程则不可以关闭页面。

2.任务一直处于运行状态,但没有更新提示或者没有采集到数据

  可能原因:程序更新维护,服务器重启了。这时你可以先暂停任务,再继续采集就可以了。注意可以不使用停止,停止了的话会重新采集列表详情链接,浪费时间。

3.详情提取器的description和keywords字段如何设置?

  详情提取器的description和keywords字段是获取页面对应的meta标签content属性中的内容,如果使用智能向导创建采集任务,这两个字段是会自动生成的,无需配置;

  提示:有些页面没有对应meta标签,则采集内容则为空;

  I、在详情提取器 【当前字段Xpath】 填写:

  • description字段://meta[@name="description"]

  • keywords字段://meta[@name="keywords"]


  II、在description和keywords字段的 【高级设置】中提取值类型选择 ‘节点属性’,属性值填写 content;

4.如何采集已删除的数据?

  无法批量采集已经删除的数据,原因是系统会记录已采集过的数据网址(就算已经删除数据),且启动采集默认的是重复数据跳过不采集。

  有两种方法解决:

  I、清空已采集网址

  清空系统的已采集网址记录:【结果数据&发布】==》 【更多操作】 ==》 清空已采集网址 ==》 启动采集即可;

  II、重复数据覆盖采集

  启动任务采集时,重复数据处理选择【覆盖已存在数据】;(采集后建议改回跳过不再采集保存,避免下次重复采集相同数据)


简数导航: 简数采集   简数控制台   如何使用简数SEO工具   微信公众号文章采集   今日头条采集  

results matching ""

    No results matching ""