预置数据集

查找预置数据集

预置数据集的入口位于,英博云控制台:AI 资产 -> 数据集,在页面搜索自己所需的数据集。

例如:搜索 openai,页面如下,点击 复制访问路径,获取该数据集在 /public 下的具体地址,示例路径:/public/huggingface-datasets/openai/gsm8k

查找数据集示例图

在开发机中使用预置数据集

在获取了预置数据集的访问路径后,可以直接在开发机中查看与使用。

在开发机上执行:

ls /public/huggingface-datasets/openai/gsm8k

即可查看数据集目录下的内容。

在实际推理或训练过程中,可以像使用本地文件一样,直接加载该路径下的数据集,而无需重复下载。

优势:

  • 节省数据下载时间

  • 降低本地存储和内存开销