采集经验与使用技巧(汇总)

自动采集与发布

  1. 如何配置自动采集、自动更新网站数据

  2. 采集后自动发布配置



发布

  1. 文章发布后,日期不正确的解决方法(wordpress变为“定时")

  2. 织梦DEDE模块管理页空白解决方法

  3. 简数已支持发布到Wordpress主题LightSNS,可发布为文章、动态、帖子等



提取器小技巧

  1. 提取器小技巧:列表选择详情页链接时,去除多余的链接

  2. 提取器技巧:通过修改Xpath解决定位不到问题

  3. 配置采集文章描述和关键词(description和keywords)



其他

  1. 列表提取器获取特殊链接网址(如在onclick属性)

  2. 使用fiddler获取网站Cookie,并应用到简数采集

  3. 简数翻译工具使用,支持百度、Google、有道翻译接口

  4. 网站数据采集实践及建议

  5. 正则表达式常用语法



采集数据处理

  1. 采集数据处理:快速删除链接、图片

  2. 采集数据处理:删除前后多余内容

  3. 采集数据处理:字符替换

  4. 采集数据处理:内容使用随机或固定值

  5. 采集数据处理:HTML标签过滤

  6. 采集数据处理:正则提取或替换内容

  7. 采集数据处理:高级配置



SEO优化工具

  1. SEO优化工具:自动内链

  2. SEO优化工具:插入段落及标题

  3. SEO优化工具:同义词替换

  4. SEO优化工具:数据中间插入另一数据的描述

  5. SEO优化工具:简繁体转换


简数导航: 简数采集   简数控制台   如何使用简数SEO工具(推荐)   微信公众号文章采集   今日头条采集  

results matching ""

    No results matching ""