简数采集常见问题

  1. 任务启动后,可以切换或关闭页面吗?
  2. 任务一直处于运行状态,但没有更新提示或者没有采集到数据
  3. 详情提取器的description和keywords字段如何设置?
  4. 如何采集已删除的数据?
  5. 进入控制台后经常跳回登录界面解决方法
  6. 登录失败,原因绑定用户失败的解决方法
  7. 如何获取任务id
  8. 如何删除已采集的数据?


1.任务启动后,可以切换或关闭页面吗?

  可以的。启动采集(包括定时采集、自动发布)、按条件发布这些启动或执行后都可以关闭页面,包括关机。任务会在云端自动运行的。

  “按列表选择发布” 发布过程则不可以关闭页面。

2.任务一直处于运行状态,但没有更新提示或者没有采集到数据

  可能原因:程序更新维护,服务器重启了。这时你可以先暂停任务,再继续采集就可以了。注意可以不使用停止,停止了的话会重新采集列表详情链接,浪费时间。

3.详情提取器的description和keywords字段如何设置?

  详情提取器的description和keywords字段是获取页面对应的meta标签content属性中的内容,如果使用智能向导创建采集任务,这两个字段是会自动生成的,无需配置;

  提示:有些页面没有对应meta标签,则采集内容则为空;

  I、在详情提取器 【当前字段Xpath】 填写:

  • description字段://meta[@name="description"]

  • keywords字段://meta[@name="keywords"]


  II、在description和keywords字段的 【高级设置】中提取值类型选择 ‘节点属性’,属性值填写 content;

4.如何采集已删除的数据?

  无法批量采集已经删除的数据,原因是系统会记录已采集过的数据网址(就算已经删除数据),且启动采集默认的是重复数据跳过不采集。

  有两种方法解决:

  I、清空已采集网址

  清空系统的已采集网址记录:【结果数据&发布】==》 【更多操作】 ==》 清空已采集网址 ==》 启动采集即可;

  II、重复数据覆盖采集

  启动任务采集时,重复数据处理选择【覆盖已存在数据】;(采集后建议改回跳过不再采集保存,避免下次重复采集相同数据)

5.进入控制台后经常跳回登录界面解决方法

  如果进入简数控制台之后,每次请求都跳到登录界面,请检查您所在网络IP地址是否不固定,可刷新多次登录页面查看下方的ip地址,或联系管理员QQ:3043176563或3071166977。

6.登录失败,原因绑定用户失败的解决方法?

  当登录进入简数控制台时,提示:登录失败,请重试,原因:绑定用户失败,请重试!

  解决方法,再重新登录一次即可,提示的绑定用户失败信息无需理会。

7.如何获取任务id?

  任务id只有简数管理员有权限查看或复制任务。

  进入任务界面,在左侧上方或者url地址的后面都有任务id:

8.如何删除已采集的数据?

  当采集的数据总数量超过套餐限制,就需要删除已发布或者无用的数据,腾出空间继续采集;

  提示:直接删除任务,任务里的数据和暂存简数的图片都会被删除的;

  • 查看当前数据存储量:在控制台界面点击左侧列表的账户及套餐余量

  • 任务里删除不要的数据:进入某个任务的【结果数据&发布】栏目,可以选择勾上不要的数据,然后点击删除按钮,也可以直接删除整个任务的数据,点击删除全部数据按钮;

  • 任务列表处删除数据:点击对应任务数据量列的红色垃圾桶按钮,删除该任务的全部数据;


简数导航: 简数采集   简数控制台   如何使用简数SEO工具   微信公众号文章采集   今日头条采集  

results matching ""

    No results matching ""