图片文件下载或托管

    图片文件下载,即把目标网站内容中的图片进行下载或存储,变成属于自己网站的图片。
(图片下载可避免因目标网站使用防盗链技术而无法显示图片,如微信公众号文章图片做了防盗链)
图片存储有4种方式:
  1. 存储到阿里云OSS:采集时,简数直接把图片上传到用户配置的阿里云oss上面,并自动修改内容的图片链接。不需再通过ftp回传。
  2. 七牛对象存储 : 与存储到阿里云oss类似机制。
  3. 腾讯云对象存储:与存储到阿里云oss类似机制。
  4. 存储到简数:采集时,图片会先下载存储到简数服务器,并且链接改为用户自己网站链接。用户可以在任务采集完成后,通过系统提供的FTP回传功能(wordpress、织梦DEDE、Zblog用户可不用FTP,直接使用http回传),把图片通过ftp传输到自己的服务器上面。

主要操作如下:

1、在“详情提取器”中配置字段(微信公众号采集不需要这一步)

注意:必须有一个字段的属性配置勾选了 “获取Html”。(如内容字段content,系统已默认选中)

2、在任务主页面“图片下载配置

配置“存储到简数”或“存储到阿里云OSS”或“存储到七牛云”或“腾讯云COS”中。下面以存储到阿里云OSS为例:

先从控制台左侧菜单“公共配置管理”--“图片云存储管理”--添加“阿里云OSS配置”,如下:

填写相应配置后,保存,然后点击“测试上传图片”,如果弹出图片则测试成功。

成功后,则可以到任务“图片文件下载”中选择该配置,保存即可。完成!!!!!

我们也推荐存储到云存储中,配置和操作都比较简单,还可以直接测试配置是否正确。

下面是"暂存简数"的配置说明

如:选中“简数到存储”。需要在下面列表先创建一个存储,系统已针对wordpress默认创建了“简数存储-WordPress”,用户也可根据自己实际存储位置创建或修改对应存储目标。如下图:

注:简数存储需在存储目标中填写“文件链接地址前缀”\(可以是目录相对路径或完整URL http ://www.xxx.com/yyy/...(建议用完整路径),服务器将使用这个前缀+服务器默认生成的路径和图片名称,来替换原网页中图片的链接。

填写后保存即可。启动采集后,系统碰到网页中有图片便会进行下载,并存储在简数服务器或阿里云OSS或七牛云存储上。采集后,可以检查有图片的数据(需看源码):如下图(简数存储):

暂存简数的,数据采集完成后,需要在发布时把图片回传到用户服务器:

    系统提供两种方式回传:

     1、http回传\(简数独家\),几乎不用配置,系统在发布时已默认该方式。适用图片较少的文章。

      2、ftp回传:传输稳定,可续传,适用图片较多的情况。

通过Ftp把图片回传到用户服务器上

进入任务的选项卡“图片文件FTP回传”:填写用户ftp服务器信息,如下:

比较重要的是“文件上传根目录”,需要根据用户ftp目录来填写,服务器会把暂存在简数存储中的图片传输到该目录中。

填写后,可用“测试登录和上传文件”来测试是否可以连接到你的ftp服务器。正常后就可以“启动FTP”进行数据传输了。

ftp最终路径是: "文件上传根目录"+服务器默认生成的路径和图片名称

例如:ftp文件上传根目录 为: /wp-content/uploads/

则上传后,在ftp目录中的完整路径是: /wp-content/uploads/2018/04/zzzzz.jpg 2018/04是采集时的年份和月份,zzzzz.jpg是重命名后的图片名称。

发布后效果如下图:http://wordpress.simpledatas.com/?p=275

查看代码:(下图数据未更新)完成!

results matching ""

    No results matching ""