简数导航:简数首页 简数控制台 采集入门教程 数据导出发送 采集翻译
HTML标签过滤
可过滤不保留指定HTML标签,如table、hr、img等。(提示:用户一般不需要配置,简数采集器已默认过滤不常用的标签);
使用说明:
1. 基本功能
使用HTML标签过滤功能的前提,该字段要为获取HTML,且删除的只是HTML标签本身,标签中的文本是保留的;
系统默认使用【过滤部分html标签】功能(勾上即启用),该功能会过滤掉不常用的标签和标签属性(属性会删除class,id,alt等,保留style),如果勾掉不启用,会保留原文的全部HTML标签和属性;
保留标签属性:alt和title,这两个属性一般是出现在图片标签里,默认不启用;
2. 自定义HTML标签过滤
如果要自定义选择保留HTML标签,不使用系统默认的HTML标签过滤,请按照以下操作:
I、 【过滤部分html标签】功能勾上启用;
II、 点击【重置为默认】按钮,显示系统默认的过滤HTML标签规则;
III、勾上的标签是保留的,按照自己需求选择要保留和过滤的HTML标签,最后记得保存;
下图例子是保留div标签操作:
注意:如果保留的标签不存在,可以联系客服(qq:3043176563或3071166977)。