Referência — API Python
Superfície pública do pacote ort-vision-sdk (tudo importável diretamente de
ort_vision_sdk).
Tarefas
| Classe | Descrição |
|---|---|
Classifier |
Classificação de imagem (saída (1, num_classes)). |
Detector |
Detecção de objetos (cabeças YOLO anchor-free). |
Segmenter |
Segmentação de instância (cabeças YOLO-seg). |
VisionTask |
Classe base comum (não instancie diretamente). |
DetectorHead |
Tipo das famílias de decoder de detecção (ex.: "yolo"). |
SegmenterHead |
Tipo das famílias de decoder de segmentação (ex.: "yolo-seg"). |
Cada tarefa expõe três variantes de inferência com a mesma assinatura:
predict(), async_predict() (asyncio.to_thread) e ort_async_predict()
(InferenceSession.run_async). Todas retornam list[Results] de comprimento 1
por imagem.
Construtores (resumo)
Classifier(model_path, *, labels=None, providers=None, session_options=None,
input_size=(224, 224), mean=..., std=..., apply_softmax=True)
Detector(model_path, *, head="yolo", labels="coco", providers=None,
session_options=None, input_size=(640, 640), conf_threshold=0.25,
iou_threshold=0.45, max_detections=300)
Segmenter(model_path, *, head="yolo-seg", labels="coco", providers=None,
session_options=None, input_size=(640, 640), conf_threshold=0.25,
iou_threshold=0.45, max_detections=300, mask_threshold=0.5)
Detector.predict() e Segmenter.predict() aceitam overrides por chamada:
conf_threshold, iou_threshold, classes.
Envelopes de resultado
| Envelope | Visão em massa | Iterar produz | Campos notáveis |
|---|---|---|---|
ClassificationResults |
probs |
n/a (resultado único) | cls, conf, name, probabilities |
DetectionResults |
boxes |
DetectionResult |
cls, conf, box.xyxy, cropped_image |
SegmentationResults |
boxes, masks |
SegmentationResult |
cls, conf, box.xyxy, mask, segmented_image |
Todo envelope expõe também names, orig_img, orig_shape, path e um
speed opcional (timings).
Visões em massa (estilo Ultralytics)
| Classe | Atributos |
|---|---|
Boxes |
xyxy, xywh, xyxyn, xywhn, cls, conf, data |
Probs |
top1, top5, top1conf, top5conf, data |
Masks |
data, xyxy |
Tipos por instância
| Tipo | Campos canônicos | Aliases Ultralytics |
|---|---|---|
DetectionResult |
class_id, class_name, confidence, bbox, cropped_image |
cls, name, conf, box |
SegmentationResult |
+ mask, segmented_image |
cls, name, conf, box |
ClassificationResult |
class_id, class_name, confidence |
cls, name, conf |
ClassProbability |
class_id, class_name, probability |
cls, name |
BoundingBox |
x1, y1, x2, y2 + xyxy |
— |
Imagens e rótulos
| Símbolo | Descrição |
|---|---|
load_image(image) |
Carrega qualquer entrada suportada para um ndarray HWC uint8 RGB. |
ImageInput |
Tipo de união das entradas aceitas por predict(). |
ImageArray |
Alias para o ndarray HWC uint8 RGB. |
resolve_labels(spec, ...) |
Resolve uma LabelSpec para dict[int, str]. |
LabelSpec |
Tipo de união aceito por labels= (preset, lista, dict, path, None). |
COCO_CLASSES |
Tupla com as 80 classes do preset COCO. |
Fonte da verdade
As assinaturas completas, com tipos e docstrings, vivem no código-fonte em
sdk-python/src/ort_vision_sdk/.
Esta página resume a superfície pública exportada em __init__.py.