• 简数采集文档中心
  • 基本概念
    • 列表页
    • 详情页(内容页)
  • 一 新手入门
    • 采集入门教程(简化版)
    • 文章采集入门教程(超详细)
    • 采集入门教程(视频版)
  • 二 数据采集
    • 2.1 创建采集任务
    • 2.2 列表提取器(网址采集规则)
      • 2.2.1 列表翻页配置(批量网址采集)
    • 2.3 详情提取器(内容采集规则)
      • 2.3.1 字段数据处理配置
        • 2.3.1.1 常用删除&填充
        • 2.3.1.2 字符替换
        • 2.3.1.3 HTML标签删除
        • 2.3.1.4 常用截取&提取
        • 2.3.1.5 随机&固定值
        • 2.3.1.6 内容过滤排除或屏蔽
        • 2.3.1.7 HTML标签过滤
        • 2.3.1.8 高级提取
      • 2.3.2 内容分页(详情分页)
    • 2.4 图片下载及云存储
      • 2.4.1 云存储(阿里、腾讯、七牛云、又拍云)
      • 2.4.2 存储到简数
      • 2.4.3 图片下载配置常见问题
    • 2.5 采集启动
    • 2.6 定时采集 + 自动发布
    • 2.7 定时自动发布 & 站群发布
    • 2.8 微信公众号采集
    • 2.9 今日头条采集
    • 2.10 新闻泛采集
    • 2.11 关键词泛采集(搜索引擎)
    • 2.12 结果数据批量修改工具
  • 三 数据发布
    • 3.1 发布到--WordPress
    • 3.2 发布到--帝国
    • 3.3 发布到--织梦DEDE
    • 3.4 发布到--ZBlog
    • 3.5 发布到--Discuz
    • 3.6 发布到更多开源CMS
      • 3.6.1 发布到--Destoon
      • 3.6.2 发布到--Typecho
      • 3.6.3 发布到--Emlog
      • 3.6.4 发布到--Mipcms
      • 3.6.5 发布到--苹果CMS
      • 3.6.6 发布到--Phpcms
      • 3.6.7 发布到--易优CMS
      • 3.6.8 发布到--米拓CMS
      • 3.6.9 发布到--云优CMS
      • 3.6.10 发布到--phpwind
      • 3.6.11 发布到--PbootCMS
    • 3.7 发布到--自定义http接口
    • 3.8 数据导出为excel、csv和sql等
    • 3.9 发布插件安装或下载(汇总)
    • 3.10 发布失败,请尝试添加IP白名单或安全组
    • 3.11 发布分类或栏目怎样填写
    • 3.12 发布多分类(栏目)设置技巧
    • 3.13 发布目标管理
  • 四 如何使用SEO工具(推荐)
    • 4.1 SEO规则创建和使用
    • 4.2 SEO各种策略介绍(强烈推荐)
      • 4.2.1 正文随机插入动态段落(强烈推荐)
      • 4.2.2 标题插入关键词
      • 4.2.3 正文插入段落及标题自动关键词
      • 4.2.4 自动内链
      • 4.2.5 同义词替换
      • 4.2.6 简繁体转换
      • 4.2.7 组合多个字段发布
      • 4.2.8 随机插入图片、关键词、链接
    • 4.3 采集翻译工具
    • 4.4 SEO词库及句料库
    • 4.5 第三方原创API接入
      • 4.5.1 5118原创API接入
      • 4.5.2 奶盘API
      • 4.5.3 小发猫API
      • 4.5.4 爱写稿API
      • 4.5.5 写作社API
  • 五 站群 & 链轮
    • 5.1 站群发布
    • 5.2 链接段落库
    • 5.3 链轮模型
      • 5.3.1 链轮模型基本配置
      • 5.3.2 站点互链设置
      • 5.3.3 链轮模型使用
  • 六 常见问题FAQ
    • 6.1 简数采集常见问题
    • 6.2 数据发布常见问题(公共)
    • 6.3 图片下载配置常见问题
    • 6.4 开源CMS发布常见问题
      • 6.4.1 Wordpress发布常见问题
      • 6.4.2 织梦DEDE发布常见问题
      • 6.4.3 Zblog发布常见问题
      • 6.4.4 帝国发布常见问题
      • 6.4.5 Discuz发布常见问题
      • 6.4.6 Destoon发布常见问题
      • 6.4.7 Typecho发布常见问题
      • 6.4.8 Emlog发布常见问题
      • 6.4.9 Mipcms发布常见问题
      • 6.4.10 苹果cms发布常见问题
      • 6.4.11 Phpcms发布常见问题
      • 6.4.12 易优CMS(eyoucms)发布常见问题
      • 6.4.13 米拓CMS发布常见问题
      • 6.4.14 云优CMS发布常见问题
      • 6.4.15 Phpwind发布常见问题
      • 6.4.16 Pboot发布常见问题
  • 七 采集经验与使用技巧(汇总)
    • 7.1 采集数据处理—经验与技巧
    • 7.2 自动采集与发布—经验与技巧
    • 7.3 发布数据—经验与技巧
    • 7.4 提取器配置—经验与技巧
    • 7.5 图片采集—经验与技巧
    • 7.6 其他—经验与技巧
  • Published with GitBook

7.4 提取器配置—经验与技巧

提取器配置—经验与技巧

  1. 提取器小技巧:列表选择详情页链接时,去除多余的链接

  2. 提取器技巧:点选采集内容时,定位不到区块问题解决方法

  3. 列表提取器获取特殊链接网址(如在onclick属性)

  4. 配置采集文章描述和关键词(description和keywords)

  5. Xpath简单用法


简数导航: 简数采集   简数控制台   如何使用简数SEO工具   微信公众号文章采集   今日头条采集  

results matching ""

    No results matching ""