导入元数据
你需要处理什么原始数据,就将该数据进行导入数据集后清洗处理。同时,你如果有开发能力,可以在我们的开发者文档中查看如何通过API导入。
最后更新于
数据集新建后可在首页点击数据集直接进入数据集详情页
在导入页面,你可以从多个数据来源中选择适合的导入方式:
从API导入:
查看API章节。
配置完成后,你就可以使用API来导入数据了。
从网页导入:支持https://
开头的网页数据抓取。
从本地文本导入:支持 .docx
.pdf
.txt
.md
.json
等文件处理。
从音频导入:支持 .mp3
.wav
文件处理。
从图片导入:支持 .png
.jpg
文件处理。
从视频导入:支持 .mov
.mp4
.mpv
文件处理。
为了更好地管理和查看导入任务,你可以使用任务筛选功能:
使用“筛选任务”功能,根据任务状态(如“未开始”、“正在导入”、“已完成”、“导入失败”)快速查找任务。
也可以通过搜索框输入任务名称或任务名称来定位具体任务。
导入页面会显示所有任务的进度:
在“未开始”或“正在导入”标签中,每个任务旁边都有一组按钮,用于启动、停止或删除任务。以下是这些按钮的具体功能说明:
开始按钮
功能:点击“▶️”按钮,启动已配置但尚未启动的导入任务。
使用场景:在任务配置完成并准备好执行时,使用“▶️”按钮启动任务。任务开始后,系统将按设定的规则进行数据抓取和导入。
停止按钮
功能:点击“⏸️”按钮,中断正在进行的任务。任务停止后,系统将不再继续抓取或处理数据。
使用场景:当你需要中断任务或发现任务配置错误时,可以使用“⏸️”按钮。停止任务后,任务状态会显示为“已停止”,你可以选择删除任务。
删除按钮
功能:点击“❌️”按钮,永久删除任务及其相关上传的数据(不包括已抓取的部分)。请注意,删除操作是不可逆的。
使用场景:在确认不再需要某个任务时,可以使用“❌️”按钮将其彻底移除。这适用于配置错误或已完成的任务上传数据不再需要保存的情况。
通过导入进度区域及其各个按钮的功能,你可以全面掌控所有数据导入任务,随时暂停、继续、停止或重试任务,并深入分析任务的执行情况。如果有进一步的疑问或需要帮助,请随时联系支持团队。