Segmentação
A tarefa Segmenter suporta cabeças YOLO-seg (v8-seg, v11-seg, v26-seg). Ela faz
tudo o que o detector faz e, além disso, decodifica os protótipos de máscara em
máscaras binárias por instância.
Construindo o segmentador
from ort_vision_sdk import Segmenter
seg = Segmenter(
"yolov8n-seg.onnx",
head="yolo-seg", # família de decoder (padrão)
labels="coco", # padrão — preset COCO de 80 classes
input_size=(640, 640), # padrão
conf_threshold=0.25,
iou_threshold=0.45,
max_detections=300,
mask_threshold=0.5, # corte soft → binário da máscara
)
import { Segmenter } from "@mauriciobenjamin700/ort-vision-sdk-web";
const seg = await Segmenter.create("/models/yolov8n-seg.onnx", {
head: "yolo-seg", // padrão
labels: "coco", // padrão
inputSize: [640, 640], // padrão
confThreshold: 0.25,
iouThreshold: 0.45,
maskThreshold: 0.5,
});
Predizendo
result = seg.predict("street.jpg")[0]
# Mesma visão Boxes do detector …
print(result.boxes.xyxy, result.boxes.cls, result.boxes.conf)
# … mais máscaras binárias por instância
for inst in result:
print(inst.name, inst.conf, inst.box.xyxy)
print(inst.mask.shape) # (h, w) uint8 ∈ {0, 255}, recortada na bbox
print(inst.segmented_image.shape) # (h, w, 3) RGB com o fundo zerado
No Web:
const result = (await seg.predict("/images/street.jpg"))[0];
for (const inst of result) {
console.log(inst.className, inst.confidence, inst.bbox.asXyxy());
console.log(inst.mask.width, inst.mask.height); // máscara binária recortada
// inst.segmentedImage: RGBImage com o fundo zerado
}
A visão Masks
Além de boxes, o envelope de segmentação expõe a visão em massa masks
(masks.data, masks.xyxy), espelhando a interface Masks do Ultralytics.
Por instância, a máscara é recortada na bounding box:
- Python:
inst.maské um ndarray(h, w)uint8 com valores em{0, 255}, einst.segmented_imageé o recorte RGB com o fundo zerado. - Web:
inst.maské um objetoMask(data/width/height, layout row-major), einst.segmentedImageé umRGBImage.
Veja também
- Guia de detecção — a mesma visão
Boxese o mesmo fluxo. - Referência da API Python
- Referência da API Web