简数导航: 简数采集器   简数控制台  

图片下载设置常见问题

  1. 图片存储到阿里云oss不显示问题
  2. 如何删除暂存简数的图片?
  3. 图片暂存简数,如何发布后自动删除图片?
  4. 图片暂存简数,发布后图片在discuz无法显示?
  5. 如何采集到图片?
  6. 图片重复问题
  7. 如何只采集图片,不要文本内容?


1.图片存储到阿里云oss不显示问题

  直接复制图片地址访问,出现

解决:在阿里云对象管理中,选择你自己的bucket--》基础设置--》读写权限--》设置--》公共读


2.如何删除暂存简数的图片?

  图片暂存在简数有存储空间限制,如果满了就需要删除掉图片,腾出空间才能采集新的图片;

  • 删除单个任务里的图片:进入某个任务的【结果数据&发布】栏目 ==》 点击【更多操作】按钮 ==》 在下拉列表中点击【清空本任务图片】;


  • 清空所有任务的图片:点击左侧列的【账户及套餐余量】 ==》 点击显示图片存储空间格中的清空 ==》 等待系统删除图片,可能需要几分钟;


3. 图片暂存简数,如何发布后自动删除图片?

  图片暂存简数,如何设置发布成功后自动删除对应的数据和图片(删除的是简数控制台中发布成功的数据,以及对应暂存在简数的图片,不影响用户网站的文章和图片);

  注意:只适用于HTTP传输图片方式,FTP方式则不支持;

  I、自动发布删除图片

  在自动发布设置页面,选择【删除成功数据】或者【删除成功及失败数据】(ftp回传的不支持删图片),保存;

  II、手动发布删除图片

  在手动发布设置页面,选择【删除成功数据】或者【删除成功及失败数据】(ftp回传的不支持删图片),发布;


4. 图片暂存简数,发布后图片在discuz无法显示?

  discuz的暂存简数图片设置,需改为绝对地址,一般是以下其中一种,区别在于有无uc_server目录,请用户核实自己的discuz系统目录:

  • http://www.xxxxxx.com/uc_server/data/attachment/forum
  • http://www.xxxxxx.com/data/attachment/forum


5. 如何采集到图片?

  图片在网页里是HTML代码的img标签,所以要想采集到图片,这个字段首先得设置【获取Html】,才会保留HTML标签;

  Xpath路径不能是img结尾,应该是img标签的上一层标签(或者更上多层标签也行),这个标签里面包含了img标签,所以就能采集到图片了,可以巧用【扩大点选区域】按钮;


6. 图片重复问题

  采集的数据每张图片都重复显示了,一张变成两张了,但是原文章是正常的。

  一般这种情况,其实原文也是有两张重复的图片,只是其中一张被隐藏了,可以通过以下设置来解决图片重复问题的:

  I、先保留noscript标签;

  II、再删除全部noscript标签,即可删除重复的图片;


7. 如何只采集图片,不要文本内容?

  如果只想采集图片,不保留其他文本内容可以这样设置:详情提取器进入content字段的数据处理 --》选择【常用截取&提取】 --》点击【只保留图片】按钮,保存即可;


简数导航: 简数采集器   简数控制台

results matching ""

    No results matching ""