微信公众号采集

  使用简数数据采集平台采集微信公众号文章,非常简单,只需输入:公众号ID或名称或者关键词。

使用步骤:

  1. 新建微信公众号采集任务
  2. 微信公众号采集任务配置
  3. 采集结果
  4. 采集微信公众号注意事项
  5. 附录


1. 新建微信公众号采集任务:

  新建微信公众号采集任务有两个入口:

  • 在控制台左侧 “采集任务管理” 列表中,点击 “采集微信公众号”;

  • 在创建任务栏目处,点击 “+微信公众号”;


2. 微信公众号采集任务配置:

  • 填写任务名 、选择采集方式(按公众号ID(微信号)或者关键词)、输入对应值、采集页数和日期范围,保存,即可启动抓取。

      还可以同时使用多个ID或关键词,多个用逗号,分隔即可。(是半角逗号);

  • ‘数据处理(可选)’ 处可做一些简单数据处理,删除图片或链接,添加版权说明等;


3. 采集结果:

  默认采集字段:

  微信公众号名称(weixin_name),公众号ID(weixin_id),标题(title),正文(content),发布日期(pubData),作者(author),标签(tag),描述(description,可使用正文截取)和关键字(keywords);


采集微信公众号注意事项:

  • 使用采集方式 ‘按公众号ID(微信号)’ 时,建议填写公众号ID(获取方式可看附录),采集成功率会更高;

  • 本平台是通过搜狗微信搜索获取到文章的,因此采集会受搜狗影响,包括时效性、可采集数量等;

  • 微信公众号采集的原始图片是无法正常显示的(防盗链),如需图片,请在“图片下载配置”中,选择暂存简数或阿里云OSS或七牛存储;

  • 采集到的原文链接是临时的,过期后不可访问;

  • 采集页数和内容日期范围,有些时候会无效;(出现时请咨询QQ管理员:3071166977)

  • 因代理IP有时不可用或网络状态影响,简数不保证一定可以采集到数据,没采集到数据建议重试几次;(数据没采集到是不会产生费用)

  • 微信公众号采集为单独收费项目,服务费:0.05币/1条。(现在充值5-7折)


附录:

I、如何获取公众号ID

  在 ‘公众号ID(微信号)’ 处填写微信号名称,再点击旁边的 ‘核查公众号’ 按钮,即可看到微信号;

  下面以 ‘环球网’ 为例:


II、微信文章零散采集

  微信文章零散采集一般用于精准采集,用户只需输入微信文章地址即可采集。

  在微信公众号文章采集的基本信息页面,点击 ‘手动输入文章链接采集(可选)’ 按钮;

  提示:如果需要下载图片,数据处理等,请先配置后再点击零散采集按钮;


  输入单个或多个详情网址,一行一个,以http://https://开头;


简数导航: 简数采集   简数控制台   如何使用简数SEO工具   微信公众号文章采集   今日头条采集  

results matching ""

    No results matching ""