简数导航:简数首页 简数控制台 采集入门教程 数据导出发送 采集翻译
接入第三方API(AI处理数据)
简数采集器支持调用第三方API接口对采集数据进行研究分析,提取重要信息,例如关键词提取,摘要提取。
目前支持的第三方API接口:DeepSeek API、百度文心一言API、阿里通义千问API、字节跳动豆包API、Kimi大模型API、讯飞星火API、智谱AI大模型API、5118智能核心词提取API,5118智能摘要提取API,天行抽取关键词API,讯飞关键词提取API等;
提示:该功能需用户自提供第三方API接口帐号信息(一般为接口的api key),调用第三方接口产生的费用由用户自行承担;
具体使用步骤:
1. 添加API接口信息
简数采集器【第三方API接入管理(AI处理)】,添加对接第三方API接口的配置。
以DeepSeek为例, 先开通API功能,再填写对应的 API-Key 值到简数。
2. 添加API处理规则
API处理规则:设置调用指定的API接口,对指定的字段执行自定义指令(AI Prompt);
【API处理规则管理】 --》【添加API处理规则】 --》设置调用API接口分析处理数据哪些字段的内容,字段前后可选择添加自定义指令(例如AI提示词)。
DeepSeek AI接口常见设置和格式,例如:
请用[ +
title
+ ]生成一段描述,不要超过15个字请从" +
title
+ "提取出几个关键词
注意:API接口是计算内容token的费用,建议慎重选择长内容字段(例如content
正文字段)作为输入,一般只配置title
标题字段。
3. 使用API处理规则处理数据
第三方API处理规则使用方式有两种:手动执行和自动执行:
1)手动执行API处理规则
在采集任务的 【结果数据&导出】,【翻译规则分析等API执行】--》【第三方API执行】--》选择相应的API处理规则 ==》执行按钮,等待执行完成。
2)自动执行API处理规则
采集任务自动化配置的【自动执行API配置】处 --》勾选上【采集后,自动执行API】--》选择要执行的API处理规则,保存;
一般配合定时采集功能使用,数据采集完成后就自动执行第三方API规则,十分方便;
4. 查看API接口执行结果
第三方API规则执行成功后,会生成新的字段,并不是替换掉原来字段中的内容,可以在【结果数据】查看。
如果需对接导出发送接口,请注意选择对应新生成的字段。(无新字段选择解决方法)