Dataset Marketplace

标准化训练数据集目录

预构建的跨行业高质量数据集,统一的授权与质量标准,可按任务类型与行业快速筛选。

定制专属数据集
共 48 个具身智能数据集 · 数据自动脱敏 · 支持 API 拉取
排序:
GEN

具身智能多模态指令微调数据集 · Embodied-Instruct-1M

将视觉、环境状态与自然语言指令对齐,覆盖导航、抓取、交互等常见具身任务,可直接用于多模态生成式模型的指令微调。

多模态 · 指令微调 具身智能 / 生成式 AI 研究 + 内部商用
指令对数量
1.0M 指令-响应对
起始授权价
¥ 120,000
NLP

多模态家庭服务机器人对话数据集 · Home-Assist-Dialogue

覆盖清洁、送物、提醒、陪伴等 15+ 家庭场景,包含多轮上下文、意图标签、动作序列与安全相关标注。

多轮对话 · 指令微调 家庭 / 室内服务 内部商用
样本数
1.4M 对话轮次
起始授权价
¥ 76,000
CV

协作机械臂表面缺陷与抓取位姿数据集 · Cobot-Defect-Pose

覆盖金属、塑料、PCB 等多类工件,包含缺陷检测、分割与抓取位姿标签,支持缺陷种类和严重程度分级。

目标检测 / 分割 工业制造 / 协作机器人 内部商用 + 再授权
样本数
860K 图像 + 位姿样本
起始授权价
¥ 135,000
ASR

室内移动机器人语音导航指令数据集 · Indoor-Nav-ASR

覆盖 10+ 常见方言 / 口音的导航与任务指令,录音经过脱敏,提供字级时间戳、语义槽位与导航目标标注。

语音识别 室内导航 / 服务机器人 研究 + 商用
音频时长
12,000+ 小时
起始授权价
¥ 52,000
LOG

具身智能机器人交互与传感日志数据集 · Embodied-Interaction-Log

含多轮任务执行过程中的动作序列、传感器读数与环境状态,适合强化学习与行为克隆建模。

强化学习 / 行为克隆 仿真 / 真实混合 匿名化传感与控制日志
用户规模
9.6M 轨迹片段
起始授权价
¥ 110,000
第 1 / 9 页