文档与集成示例(Demo)
下列内容展示 shenbi AI 在真实环境中可能提供的 API 形式、数据目录结构和简单的训练代码片段。 当前仅为前端示例,不代表真实可用接口。
1. 通过 API 获取数据目录
购买或开通试用后,你可以在企业控制台中查看 Access Token,并通过 HTTPS API 获取某个数据项目或数据集的文件清单。
示例:获取项目 WH-Robot-Q1-2026 的数据目录
curl -X GET \ "https://api.shenbi.ai/v1/projects/WH-Robot-Q1-2026/files?split=train" \ -H "Authorization: Bearer <YOUR_TOKEN>" \ -H "Accept: application/json"
2. 与训练代码的简单集成示例
以下是一个简化的 Python 伪代码片段,展示如何加载具身智能多模态指令数据,并送入你自己的训练循环。
from torch.utils.data import Dataset, DataLoader
class EmbodiedInstructDataset(Dataset):
def __init__(self, manifest_path: str):
self.items = load_manifest(manifest_path) # 每条记录对应一个指令-观测-动作样本
def __len__(self):
return len(self.items)
def __getitem__(self, idx):
item = self.items[idx]
image = load_image(item["obs_image_path"])
state = encode_state(item["obs_state"])
instruction = tokenize_text(item["instruction"])
response = tokenize_text(item["assistant_response"])
return {
"image": image,
"state": state,
"instruction": instruction,
"response": response,
}
train_loader = DataLoader(
EmbodiedInstructDataset("embodied_instruct_train.jsonl"),
batch_size=32,
shuffle=True,
num_workers=4,
)
实际项目中,我们会提供与你的框架相匹配的示例(如 PyTorch / JAX / TF),并对字段含义进行详细说明。