简数导航:简数首页 简数控制台 采集入门教程 数据导出发送 采集翻译
上传导入文件数据(Excel、Txt、Html、Zip、csv)
简数采集器支持导入Excel、Txt、Html、Zip、CSV等多种格式文件里的数据到汇总库。
导入步骤:先上传要导入的文件,再执行文件导入。
具体操作如下:
1. 文件上传
进入某个数据汇总库,点击【数据处理&导入导出发送】栏目,然后点击【从文件导入(支持Excel、Txt、Html...)】按钮,弹出文件上传窗口:
(1)拖拽文件到上传区域,或者点击上传区域选择要导入的文件;
(2)选择成功后,在上传区域会显示对应的文件;
(3)点击【上传文件】按钮,文件上传完成,会在文件列表中显示出来;
备注:一次上传最多20个文件,每个文件大小最大5M,将计入总存储空间。
2. 导入文件数据
文件上传只是保存文件到系统,文件中的数据并未导入汇总库,还需进行导入文件数据操作:
单个文件数据导入:在文件对应行的操作列,点击导入按钮;
多个文件数据导入:在文件对应行第一列,勾上表示已选择(可选择多个),再点击上方【执行导入已选文件】;
导入数据完成后,刷新【数据处理&导入导出发送】页面便可查看到导入的数据。
备注:导入文件数据暂时不支持筛选删除重复数据功能,重复数据会被导入的。
3. 导入文件格式
简数采集器目前支持导入的文件格式为:Excel、Txt、Html、Zip、Csv等。
各种文件格式要求如下:
3-1)导入Excel文件格式要求(格式灵活简易)
导入Excel文件格式要求:
(1)第一行必须为字段名表头,字段数量和顺序无固定要求,可自由排列组合,非常灵活方便。
(2)表头目前支持以下字段名(不符合的忽略不导入),中英文字段名可混合使用(不区分大小写),基本兼容大部分软件的Excel导入导出格式,无缝衔接。
- 标题:
title、标题
; - 正文:
content、内容、正文、详情、detail、body
; - 时间:
pubdate、日期、时间、日期时间
; - 作者:
author、作者
; - 分类:
category、分类、栏目、类别
; - 标签:
tag、tags、标签
; - 描述:
description、描述、摘要
; - 关键词:
keyword、keywords、关键词
; - 数据网址:
url、链接、原文链接、网址、页面网址、pageurl
; - 如需支持其它表头字段名称,可联系管理员QQ:3043176563、3071166977:
(3)表头格式例子;
3-2)导入Txt文件格式要求
简数采集器支持导入Txt文件数据到汇总库。
导入Txt文件格式要求:
(1)Txt文件名称作为标题导入为title;
(2)Txt文件内容作为正文导入为content;
多个Txt文件可使用Zip文件格式导入更快捷:先将多个Txt文件放到一个文件夹里,然后压缩此文件夹成一个Zip格式文件,最后上传导入Zip文件数据到汇总库。
3-3)导入Html文件格式要求
简数采集器支持导入Html(或htm)文件数据到汇总库。
导入Html文件格式要求:
(1)Html文件名称作为标题导入为title;
(2)Html文件内容作为正文导入为content;(如果内容中包含</body>
标签,那系统只会获取<body>
到</body>
标签之间的内容作为content)
多个Html文件可使用Zip文件格式导入更快捷:先将多个Html文件放到一个文件夹里,然后压缩此文件夹成一个Zip格式文件,最后上传导入Zip文件数据到汇总库。
3-4)导入Zip文件格式要求
简数采集器支持导入Zip文件里的数据到汇总库。
导入Zip文件格式要求:
(1)Zip文件里目前只能是Txt或Html格式的文件;
(2)Zip文件大小最大不能超过5M,超过可拆分成多个Zip文件;
3-5)导入CSV文件格式要求
简数采集器支持导入CSV文件数据到汇总库。
导入CSV文件格式要求和导入Excel要求相同,请参考导入Excel文件格式要求。
3-6)导入后数据是乱码解决方法
从文件导入数据完成后,在汇总库查看数据是乱码,这是由于文件字符编码导致的问题,导入前重新选择编码即可,详细步骤如下:
(1)【导入文件编码】默认是UTF-8,改为选择GBK;
(2)选择一个文件执行导入即可;