Együttes elemzés több képből
Ha egy kérésben több kép is szerepel, Claude ezeket nem külön-külön, hanem együttesen elemzi, és a válaszban összefüggésbe is tudja hozni őket egymással. Ez különösen hasznos két kép összehasonlításánál, például két termékváltozat közötti különbség kiemelésénél, vagy egy folyamat egymást követő lépéseinek értelmezésénél, mint amilyen egy több oldalas dokumentum beszkennelt oldalai.
Címkézd a képeket
Ha több képet küldünk egy kérésben, érdemes minden kép elé egy rövid szöveges címkét illeszteni, például "Image 1:" vagy "Image 2:". Ez nem technikai kényszer, hanem gyakorlati segítség, mert így a kérdésben és a válaszban is pontosan lehet hivatkozni az egyes képekre, elkerülve a félreértést arról, hogy éppen melyik képről van szó.
Több kép, egy limit
A képek száma nem korlátlan egy kérésen belül. A claude.ai felületen legfeljebb 20 kép küldhető egy üzenetben. Az API-n ennél nagyobb a mozgástér, a 200k tokenes kontextusablakú modelleknél 100 kép engedélyezett kérésenként, más modelleknél pedig akár 600 kép is. Emellett minden kép mérete is korlátozott, legfeljebb 8000x8000 pixel lehet, és 20 képnél többet tartalmazó kérésnél szigorúbb per-kép méretkorlát is életbe lép.
Emlékezet a beszélgetésben
Ha egy beszélgetés több fordulóból áll, Claude az összes korábbi fordulóból emlékszik a benne szereplő képekre. Ez azt jelenti, hogy egy követő kérdésnél nem kell újraküldeni a korábban már elküldött képeket, elég csak az új szöveges kérdést feltenni, a modell a teljes eddigi kontextust, beleértve a képeket is, figyelembe veszi.
Forrás
Az Anthropic hivatalos Claude Vision dokumentációjának (platform.claude.com/docs/en/build-with-claude/vision) magyar feldolgozása.
Workshop
AI Transformation Day
Egésznapos, vezetőknek szóló program. Feltérképezzük, hol tart a szervezet, mi az első reális lépés, és milyen belső feltételek szükségesek a sikerhez. A nap végén konkrét, prioritizált cselekvési lista.
Érdekel a program →