Formátumok és méretkorlátok
Claude négy képformátumot támogat, JPEG, PNG, GIF és WebP. Animált GIF esetén fontos tudni, hogy az animáció nem támogatott, a modell csak az első kockát veszi figyelembe. A fájlméret korlátja közvetlen API használat esetén 10MB base64 formátumban, Amazon Bedrock és Google Cloud platformon 5MB, a claude.ai felületen szintén 10MB. Emellett a kép mérete legfeljebb 8000x8000 pixel lehet, és ha egy kérésben 20-nál több kép szerepel, szigorúbb per-kép méretkorlát lép életbe.
Amit Claude nem tud megbízhatóan
Claude nem azonosít személyeket egy képen, ilyen kérést elutasít. Pontatlanná válhat homályos, elforgatott, vagy 200 pixel alatti apró képeknél. A koordináta és lokalizációs kimenetek, tehát amikor egy objektum pontos helyét kellene megadni a képen, mindig csak közelítő értékek. A számlálás, vagyis az objektumok pontos darabszámának megállapítása egy képen, szintén nem mindig pontos. Claude azt sem tudja megállapítani, hogy egy adott kép AI-generált-e vagy sem.
Egészségügyi és tartalmi korlátok
Fontos külön kiemelni, hogy Claude egészségügyi diagnosztikai képek, mint a CT vagy MRI felvételek, értelmezésére nem alkalmas helyettesítő orvosi vélemény gyanánt. Ilyen felvételeket kizárólag szakképzett orvos értékelhet ki felelősen. Emellett Claude nem dolgoz fel nem megfelelő vagy explicit tartalmú képeket sem, ezekre a kéréseket elutasítja.
Forrás
Az Anthropic hivatalos Claude Vision dokumentációjának (platform.claude.com/docs/en/build-with-claude/vision) magyar feldolgozása.
Workshop
AI Transformation Day
Egésznapos, vezetőknek szóló program. Feltérképezzük, hol tart a szervezet, mi az első reális lépés, és milyen belső feltételek szükségesek a sikerhez. A nap végén konkrét, prioritizált cselekvési lista.
Érdekel a program →