新闻泛采集

  新闻泛采集支持新闻资讯按关键词泛采集(覆盖国内8千多家新闻资讯类网站和APP,最新资讯实时抓取),使用方法非常简单,只需输入对应关键词即可。

使用步骤:

  1. 任务创建和配置
  2. 数据处理配置(可选)
  3. 采集结果
  4. 注意事项


1. 任务创建和配置:

  I、任务创建有两个入口:

  • 在控制台左侧 “采集任务管理” 列表中,点击 “新闻泛采集”;

  • 在创建任务栏目处,点击 “+新闻泛采集”;

  II、任务配置:

  • 填写任务名:不能填写特殊符号;

  • 关键词:可以同时填写多个关键词,用逗号,分隔即可(是英文半角逗号),例如:华为,小米 也可填写多组关键词,每组关键词用分号;隔开(是英文半角分号),例如:华为,小米;宝马,奔驰;电脑,手机; 提示:每个逗号分隔的关键词关系默认是或者OR,可在下方的关键词关系处修改为并且AND;

  • 选择日期:不能超过30天;

  • 采集页数:设置采集的页数及每页的条数,定时采集最多设置5页;

  • 关键词匹配字段:默认标题和正文,即标题或正文内容一处有出现关键词,即会采集入库,可单独选择标题或正文;

  • 关键词关系:

    • 或者OR:多个关键词中有一个在数据中出现,就采集入库;
    • 并且AND:多个关键词要全部在数据中同时出现,才采集入库,只出现个别的,不采集入库;
  • 网站分类:可选择不限制(默认)、新闻网站、政府网站、报刊网站和APP;


2. 数据处理配置(可选)

  不需要数据处理的可以跳过这一步

  I、数据处理入口

  点击【配置数据替换、填充、删除等】按钮进入数据处理配置;

  注意:使用该功能,必须要先采集有数据入库,该功能是在已采集的数据基础上设置的!

  II、数据处理配置

  该功能类似详情提取器的配置,可以设置删除、填充、替换和过滤等功能;

  • 【已有数据链接】:对应显示的网址是该任务已采集入库数据的网址,可点击出现下拉列表选择其他已采集数据的网址;

  • 【测试数据处理】按钮:数据处理规则设置后,可点击【测试数据处理】,对【已有数据链接】对应的已采集入库数据直接执行规则,而不是重新采集一次再执行规则;

  • 【查看该已有数据】按钮:查看【已有数据链接】对应的已采集入库数据,所以弹出的是简数预览&编辑数据界面;

   注意:该设置保存后,对新采集入库的数据生效,之前已入库的数据无效;


3. 采集结果:

  默认采集字段:

  标题、内容、发布时间、标签、描述、关键词、网站名称(x_name)、网站域名(x_id)、第一张图片链接等;


注意事项:

  • 新闻泛采集是对接第三方接口实现,使用上会受第三方接口稳定性影响,如发现问题,请随时联系我们。

  • 新闻泛采集为单独收费项目,服务费:0.04币/1条。(现在充值5-7折)


简数导航: 简数采集   简数控制台   如何使用简数SEO工具   微信公众号文章采集   今日头条采集  

results matching ""

    No results matching ""