文档与集成示例(Demo)

下列内容展示 shenbi AI 在真实环境中可能提供的 API 形式、数据目录结构和简单的训练代码片段。 当前仅为前端示例,不代表真实可用接口。

1. 通过 API 获取数据目录

购买或开通试用后,你可以在企业控制台中查看 Access Token,并通过 HTTPS API 获取某个数据项目或数据集的文件清单。

示例:获取项目 WH-Robot-Q1-2026 的数据目录

curl -X GET \
  "https://api.shenbi.ai/v1/projects/WH-Robot-Q1-2026/files?split=train" \
  -H "Authorization: Bearer <YOUR_TOKEN>" \
  -H "Accept: application/json"

2. 与训练代码的简单集成示例

以下是一个简化的 Python 伪代码片段,展示如何加载具身智能多模态指令数据,并送入你自己的训练循环。

from torch.utils.data import Dataset, DataLoader

class EmbodiedInstructDataset(Dataset):
    def __init__(self, manifest_path: str):
        self.items = load_manifest(manifest_path)  # 每条记录对应一个指令-观测-动作样本

    def __len__(self):
        return len(self.items)

    def __getitem__(self, idx):
        item = self.items[idx]
        image = load_image(item["obs_image_path"])
        state = encode_state(item["obs_state"])
        instruction = tokenize_text(item["instruction"])
        response = tokenize_text(item["assistant_response"])
        return {
            "image": image,
            "state": state,
            "instruction": instruction,
            "response": response,
        }

train_loader = DataLoader(
    EmbodiedInstructDataset("embodied_instruct_train.jsonl"),
    batch_size=32,
    shuffle=True,
    num_workers=4,
)

实际项目中,我们会提供与你的框架相匹配的示例(如 PyTorch / JAX / TF),并对字段含义进行详细说明。