导入元数据

你需要处理什么原始数据,就将该数据进行导入数据集后清洗处理。同时,你如果有开发能力,可以在我们的开发者文档中查看如何通过API导入。

数据集新建后可在首页点击数据集直接进入数据集详情页

1. 选择导入方式

Dataset

在导入页面,你可以从多个数据来源中选择适合的导入方式:

  • 从API导入

    1. 查看API章节。

    2. 配置完成后,你就可以使用API来导入数据了。

  • 从网页导入:支持https://开头的网页数据抓取。

  • 从本地文本导入:支持 .docx .pdf .txt .md .json等文件处理。

  • 从音频导入:支持 .mp3 .wav文件处理。

  • 从图片导入:支持 .png .jpg文件处理。

  • 从视频导入:支持 .mov .mp4 .mpv 文件处理。

2. 筛选和管理任务

为了更好地管理和查看导入任务,你可以使用任务筛选功能:

  1. 使用“筛选任务”功能,根据任务状态(如“未开始”、“正在导入”、“已完成”、“导入失败”)快速查找任务。

  2. 也可以通过搜索框输入任务名称或任务名称来定位具体任务。

3. 查看导入进度

导入页面会显示所有任务的进度:

  1. 在“未开始”或“正在导入”标签中,每个任务旁边都有一组按钮,用于启动、停止或删除任务。以下是这些按钮的具体功能说明:

    1. 开始按钮

      • 功能:点击“▶️”按钮,启动已配置但尚未启动的导入任务。

      • 使用场景:在任务配置完成并准备好执行时,使用“▶️”按钮启动任务。任务开始后,系统将按设定的规则进行数据抓取和导入。

    2. 停止按钮

      • 功能:点击“⏸️”按钮,中断正在进行的任务。任务停止后,系统将不再继续抓取或处理数据。

      • 使用场景:当你需要中断任务或发现任务配置错误时,可以使用“⏸️”按钮。停止任务后,任务状态会显示为“已停止”,你可以选择删除任务。

    3. 删除按钮

      • 功能:点击“❌️”按钮,永久删除任务及其相关上传的数据(不包括已抓取的部分)。请注意,删除操作是不可逆的。

      • 使用场景:在确认不再需要某个任务时,可以使用“❌️”按钮将其彻底移除。这适用于配置错误或已完成的任务上传数据不再需要保存的情况。

通过导入进度区域及其各个按钮的功能,你可以全面掌控所有数据导入任务,随时暂停、继续、停止或重试任务,并深入分析任务的执行情况。如果有进一步的疑问或需要帮助,请随时联系支持团队。

最后更新于