• 简数采集器文档中心
  • 基本概念
    • 列表页
    • 详情页(内容页)
  • 一 新手入门
    • 采集入门教程
    • 采集视频教程
    • 系统使用流程简介
  • 二 数据采集和处理
    • 2.1 创建采集任务
    • 2.2 列表提取器(网址采集规则)
      • 2.2.1 列表翻页配置(批量网址采集)
      • 2.2.2 JS异步加载数据配置
      • 2.2.3 Json提取网址
      • 2.2.4 Sitemap提取网址
      • 2.2.5 特殊网页提取网址
    • 2.3 详情提取器(内容采集规则)
      • 2.3.1 图片&链接删除
      • 2.3.2 字符替换(支持正则)
      • 2.3.3 常用截取&提取
      • 2.3.4 内容填充&随机值&固定值
      • 2.3.5 内容过滤排除(屏蔽词)
      • 2.3.6 HTML标签过滤
      • 2.3.7 更多字段数据处理配置
      • 2.3.8 内容分页(详情分页)
      • 2.3.9 下级页面(跳转子页面)
    • 2.4 图片下载及云存储
      • 2.4.1 云存储(阿里、腾讯、七牛云、又拍云)
      • 2.4.2 图片暂存
      • 2.4.3 图片下载配置常见问题
    • 2.5 采集启动
    • 2.6 定时自动采集和发送
      • 2.6.1 定时自动采集+自动发送
      • 2.6.2 定时发送
      • 2.6.3 全自动化配置
    • 2.7 按关键词采集(泛采集)
    • 2.8 单网页一键采集
    • 2.9 无限循环采集
    • 2.10 JSON数据采集
    • 2.11 数据处理设置(采集前)
    • 2.12 数据处理工具(采集后)
  • 三 数据导出、发送和导入
    • 3.1 数据导出为文件
    • 3.2 导出发送到CMS
    • 3.3 发送到数据库
    • 3.4 发送到自定义http接口
    • 3.5 定时导出发送
    • 3.6 收集发送后的摘要信息
    • 3.7 导入文件数据
    • 3.8 发送目标模板
  • 四 AI根据关键词生成文章【AI生成】
  • 五 AI处理数据、翻译和第三方API
    • 5.1 DeepSeek处理采集数据
    • 5.2 豆包处理采集数据
    • 5.3 文心一言处理采集数据
    • 5.4 Kimi处理采集数据
    • 5.5 AI处理已采集数据(更多)
      • 5.5.1 阿里通义处理采集数据
      • 5.5.2 讯飞星火处理采集数据
      • 5.5.3 智谱处理采集数据
      • 5.5.4 腾讯混元处理采集数据
      • 5.5.5 5118 API接入
      • 5.5.6 常用的AI指令
    • 5.6 AI生成创作视频教程
    • 5.7 采集翻译工具
      • 5.7.1 百度翻译API接口
      • 5.7.2 腾讯云翻译API接口
      • 5.7.3 阿里云翻译API接口
      • 5.7.4 DeepL翻译API接口
    • 5.8 简繁体转换
  • 六 SEO处理规则
    • 6.1 标题插入关键词
    • 6.2 自动内链
    • 6.3 正文插入段落(如图片、链接、摘要等)
    • 6.4 正文插入动态段落
    • 6.5 敏感词替换
    • 6.6 SEO词库及段落库
    • 6.7 摘要内容库
    • 6.8 正文插入图片
  • 七 数据汇总库
    • 7.1 汇总库管理
    • 7.2 汇总库创建和使用
    • 7.3 导入任务数据
    • 7.4 上传导入Excel、Txt、CSV等
    • 7.5 导入并用AI生成文章
  • 八 常见问题FAQ
    • 8.1 简数采集常见问题(汇总)
      • 8.1.1 重新采集时,采集不到数据的解决方法
      • 8.1.2 采集内容没有排版解决方法
      • 8.1.3 采集内容有乱码解决方法
      • 8.1.4 采集内容为空时不采集设置方法
      • 8.1.5 无列表页翻页采集方法
      • 8.1.6 获取到多余网址解决方法
      • 8.1.7 正文内容采集技巧
    • 8.2 图片下载配置常见问题
    • 8.3 导出发送常见问题(汇总)
      • 8.3.1 如何添加IP到白名单或安全组
      • 8.3.2 发送目标无对应字段选项解决方法
      • 8.3.3 发送到多分类(栏目)
    • 8.4 账号登录相关问题
  • 九 采集经验与使用技巧
  • Published with GitBook

九 采集经验与使用技巧

  • 采集经验与使用技巧(汇总)

简数导航:简数首页  简数控制台  采集入门教程  数据导出发送  采集翻译

采集经验与使用技巧(汇总)

  1. 提取器技巧:点选采集内容时,定位不到区块问题解决方法

  2. 列表提取器获取特殊链接网址(如在onclick属性)

  3. 配置采集文章描述和关键词(description和keywords)

  4. Xpath简单用法

  5. 获取Cookie进行登录采集

  6. 导航站网址采集发布教程

  7. 简数翻译工具使用,支持百度、谷歌、阿里、腾讯、有道翻译和DeepL翻译接口

  8. 正则表达式常用语法

  9. 采集数据并使用百度翻译接口API进行翻译

  10. 简数采集器中使用阿里翻译接口API教程

  11. 采集数据并使用腾讯翻译接口API进行翻译

results matching ""

    No results matching ""