数据批量修改工具

  针对采集结果数据,系统提供灵活的数据二次加工处理,快速批量完成一些原本很费时的操作。如数据替换,填充,截取,删除等批量操作。

  进入某一个任务,切换到选项卡“结果数据&发布”,点击 “批量修改工具” ,选择要批量处理的功能,如下图:



数据批量处理工具主要功能如下:

1. 常用快捷处理:

  可进行字符替换和一些快捷删除功能.

  • ‘要操作的字段’:默认是content字段,可选择该任务详情提取器中已定义的字段;

  • ‘数据范围’: 只能选择 ‘任务所有数据’ 或 ‘当前页面记录’;

    ‘当前页面记录’ 指的是在 ‘结果数据&发布’ 选项卡中数据列表所在当前一页的所有数据;

  • ‘字符替换|删除’:替换不支持正则语法,为完全匹配才替换;(删除是在 ‘替换为’ 处填上空格来实现;)

  • ‘常用快捷删除’:生效范围是前面所选 ‘数据范围’ 的每条数据的 ‘要操作字段’ ;

    I、删除所有链接:批量删除所选字段中所有的链接(a标签),不保留文本;

    II、删除所有链接(保留文本):批量删除所选字段中所有的链接(a标签),保留文本;

    III、删除所有图片:批量删除所选字段中所有的图片(img标签);

    IV、删除已选字段值为空的记录:检查‘数据范围’里的每条数据,若数据的所选字段为空,无任何内容,删除该条数据(记录);

    V、清空已选字段数据:批量删除所选字段的内容;


2. 数据填充:

  可填写固定值,或截取某字段内容来填充空白内容字段。

  • ‘要操作的字段’:默认是content字段,可选择该任务详情提取器中已定义的字段;

  • ‘数据范围’: 只能选择 ‘任务所有数据’ 或 ‘当前页面记录’;

    ‘当前页面记录’指的是在 ‘结果数据&发布’ 选项卡中数据列表所在当前一页的所有数据;

  • 添加固定内容:在 ‘要操作的字段’ 前面或后面可添加填写的内容;

  • 截取内容填充:若数据的 ‘要操作的字段’ 内容为空值则会填充截取的内容(截取同一条数据其他一个字段的部分内容),内容不为空则跳过不执行;

    提示:截取的字段可以选择其他在该任务详情提取器中定义的字段,默认是content字段; 前多少个字符可自定义,默认是220个字符(包括标点符号的);

  • 空值填充默认值:若数据的 ‘要操作的字段’ 内容为空值则会填充填写的默认值内容,默认值内容可以自定义;

    提示:简单概括说,‘空值填充默认值’ 是填充固定内容,‘截取内容填充’ 是填充动态内容;


3. HTML标签删除:

  批量删除html标签元素,可以指定删除的个数、标签名称、以及位置。

  • ‘要操作的字段’:默认是content字段,可选择该任务详情提取器中已定义的字段;

  • ‘数据范围’: 只能选择 ‘任务所有数据’ 或 ‘当前页面记录’;

    ‘当前页面记录’指的是在 ‘结果数据&发布’ 选项卡中数据列表所在当前一页的所有数据;

  • 删除位置:可以选择 ‘前面’ 、‘最后’(从最后开始往前数)和 ‘全部’ (即删除全部,无需填写删除个数) ;

  • 删除个数:填写正整数;

  • 标签名:填写html的标签名,格式为:div p a img等,不用写成<div>,<p>;

  • 保留文本:可选择删除标签时,标签内的文本是否保留;


简数导航: 简数采集   简数控制台   如何使用简数SEO工具(推荐)   微信公众号文章采集   今日头条采集  

results matching ""

    No results matching ""