Google lanserer Nano Banana 2, sin nye AI-drevne bildemodell

  • Nano Banana 2 er Googles nye modell for bildegenerering og -redigering basert pÃ¥ Gemini 3.1 Flash Image.
  • Den kombinerer rask responstid med høy visuell gjengivelse, oppløsninger pÃ¥ opptil 4K og forbedret sporing av komplekse instruksjoner.
  • Den integreres med Gemini-appen, Search, Lens, AI Studio, Google Cloud, Flow og Google Ads, med utvidet utrulling til flere land og sprÃ¥k.
  • Den inkluderer avanserte funksjoner som lesbar og oversettbar tekst i bildet, konsistens av tegn og objekter, og forsegling med SynthID- og C2PA-legitimasjon.

Google Nano Banana 2 AI-bildemodell

Google har tatt et nytt steg i sin strategi for kunstig intelligens med presentasjonen av Nano-banan 2, også identifisert som Gemini 3.1 Flash-bildeDet er en modell for bildegenerering og -redigering som har som mål å minimere gapet mellom responshastighet og visuell kvalitet. Selskapet har til hensikt at innholdsskapere skal kunne jobbe med bilder i nær sanntid uten å ofre detaljerte, brukbare resultater i profesjonelle sammenhenger.

Lanseringen kommer etter den første Nano Banana og Nano Banan ProDisse versjonene hadde allerede befestet Googles tilstedeværelse innen AI-drevet visuell generering. Med denne nye iterasjonen satser selskapet på en modell som bringer funksjoner som tidligere ble ansett som «high-end» til en mye mer smidig arbeidsflyt, designet for brukere som ofte genererer bilder, fra markedsføringsteam til uavhengige skapere og selskaper som opererer i Europa og andre markeder.

Hva er Nano Banana 2, og hvilken rolle spiller den i Gemini-økosystemet?

Google beskriver Nano Banana 2 som sin mest avanserte bildemodell til dags dato innenfor Gemini-miljøetDen unike funksjonen er at den er bygget på Flash-arkitekturen, som fokuserer på svært raske responstider. Målet er at verktøyet ikke bare skal produsere iøynefallende komposisjoner, men også passe sømløst inn i arbeidsflyter der hvert sekund teller.

I praksis hevder selskapet at Nano Banana 2 arver verdenskunnskapen, resonnementet og den visuelle gjengivelsen fra Nano Banana Pro.Men den kombinerer dem med hastigheten til Flash-modeller. Dette vil tillate deg å generere eller redigere bilder på få sekunder, noe som er spesielt relevant for de som jobber med konstante iterasjoner, A/B-testing eller raske gjennomganger med kunder og team spredt over forskjellige land.

Den nye modellen er rettet mot både skapelse fra bunnen av som redigering av eksisterende materialeGoogle understreker at endringer, justeringer eller variasjoner kan iverksettes uten at hver modifikasjon innebærer lang ventetid, noe som passer med vanlige oppgaver i byråer, kommunikasjonsavdelinger eller små bedrifter som administrerer sitt eget visuelle innhold.

Videre posisjonerer selskapet Nano Banana 2 som en sentral del av sin generative AI-strategi: den er integrert i forbrukerprodukter og utviklerverktøy, med mål om at den samme modellen skal tjene som grunnlag for opplevelser på mobil, i nettleseren og i forretningsorienterte skymiljøer.

Verdenskunnskap og støtte innen nettsøk

En av grunnpilarene i Nano Banana 2 er måten den utnytter Gemini-kunnskapsbasen på.Ifølge Google kan modellen basere seg på informasjon og bilder fra den virkelige verden. Nettsøk i sanntid å representere konsepter, objekter eller spesifikke scener med større nøyaktighet.

Denne forbindelsen til nettet gjør det mulig å generere bilder som er bedre tilpasset nåværende kontekster, noe som er nyttig for infografikk, informativt innhold eller datavisualiseringer som må gjenspeile spesifikke situasjoner. For mediehus, spesialiserte blogger eller institusjonelle kommunikasjonsavdelinger i Europa kan denne funksjonen legge til rette for illustrasjon av nyhetsartikler, rapporter og presentasjoner uten å måtte starte på nytt hver gang.

Google bemerker at denne dypere forståelsen også bidrar til å konvertere notater til diagrammer, disposisjoner og forklarende diagrammerMed andre ord, modellen «trekker» seg ikke bare fra en generisk beskrivelse, men forsøker også å strukturere informasjonen på en visuelt tydelig måte, noe som er spesielt interessant innen utdanning, bedriftsopplæring eller teknisk dokumentasjon.

Med denne tilnærmingen ønsker selskapet å differensiere Nano Banana 2 fra andre modeller som utelukkende fokuserer på estetisk effekt. Tanken er at verktøyet kan brukes til både kunstneriske kreasjoner og... visuelt materiale som følger med komplekse data, prosesser eller konsepter, noe som forsterker appellen til organisasjoner som jobber med rapporter og analyser regelmessig.

Forbedret håndtering av tekst i bilder, oversettelse og lokalisering

Et av de mest omtalte problemene med AI-bildegenerering har tradisjonelt vært tekstbehandling integrert i selve bildetder feil i bokstaver eller ord kan ødelegge et ellers gyldig design. Google hevder at Nano Banana 2 løser dette problemet med et betydelig kvalitetssprang.

I følge informasjonen som er gitt, er modellen i stand til å generere lesbar og sammenhengende tekst i markedsføringsmodeller, plakater, kort eller bannereDette reduserer antall mislykkede forsøk på grunn av skrivefeil. Dette kan være spesielt nyttig for små team som ikke har en egen designavdeling og trenger funksjonelle resultater raskt.

I tillegg til disse mulighetene er det mulighet for Oversett og lokaliser tekst direkte i bildetMed andre ord, systemet oppdager ikke bare teksten som finnes i et fotografi eller en komposisjon, men lar den også tilpasses forskjellige språk uten å måtte bygge opp verket fra bunnen av. For europeiske kampanjer i flere markeder kan denne funksjonen spare tid og forenkle den kulturelle og språklige tilpasningsprosessen.

Innen områder som e-handel, turisme eller nettbasert opplæring, er denne kombinasjonen av lesbar tekst, oversettelse og lokalisering Den tar sikte på mer smidige arbeidsflyter. Det samme kreative arbeidet kan gjenbrukes i flere land, og justere tekster og meldinger ved hjelp av AI i stedet for å gjøre om hele design for hvert språk.

Med alt dette posisjonerer Nano Banana 2 seg som et verktøy som forsøker å redusere en av de klassiske friksjonene ved generativ billedspråk: behovet for å ty til eksterne redaktører for å polere eller korrigere teksten som vises i komposisjonen.

Visuell konsistens, overholdelse av instruksjoner og utskriftskvalitet

En annen viktig del av annonsen fokuserer på Kreativ kontroll og visuell konsistensGoogle hevder at Nano Banana 2 er i stand til å opprettholde likheten med opptil fem tegn innenfor samme arbeidsflyt og respektere troskap opp til fjorten objekterslik at de ikke endrer seg drastisk fra ett bilde til et annet.

Denne kapasiteten er beregnet for bruk som storyboards, scene-for-scene-fortellinger, reklamekampanjer eller utvikling av sammenhengende visuelle universerI disse sammenhengene kan en karakter eller et produkt som endrer utseende fra ett panel til det neste, ødelegge opplevelsen, så vektleggingen av visuell kontinuitet er spesielt relevant for merkevarer og kreative prosjekter.

Selskapet merker også en forbedring i følge komplekse instruksjonerModellen ville være bedre rustet til å tolke nyansene i instruksjonene – fra stilelementer til detaljerte begrensninger på komposisjon, belysning eller innramming – og bedre samsvare med brukerens forventninger. Dette burde føre til færre iterasjoner som kreves for å oppnå et tilfredsstillende resultat.

Teknisk sett tilbyr Nano Banana 2 kontroll av sideforhold og en rekke oppløsninger fra 512 piksler til 4KDette gjør det mulig å tilpasse den samme kreativen til vertikale, horisontale eller panoramaformater, som dekker alt fra raske innlegg på sosiale medier til bakgrunnsbilder eller materialer designet for HD-skjermer.

Google insisterer på at modellen presenterer en generell forbedring av visuell gjengivelseMed rikere belysning, bedre definerte teksturer og skarpere detaljer er målet at Flash-modus ikke skal oppfattes som et «reduksjonsalternativ», men som et raskt alternativ som også kan levere en finish av høy kvalitet. I sektorer som e-handel eller institusjonell kommunikasjon kan denne kombinasjonen av hastighet og kvalitet utgjøre en reell forskjell i det daglige arbeidet.

Tilgjengelighet i Google-produkter og internasjonal utrulling

Kunngjøringen av Nano Banana 2 er ikke begrenset til et isolert testmiljø. Google beskriver en bred utrulling på tvers av økosystemet sitt, som begynner med Gemini-appen og strekker seg til flere av hovedtjenestene.

I Gemini-appen, Nano Banana 2 Den vil erstatte Nano Banana Pro i modusene Hurtig, Tenkning og Pro.slik at den nye modellen blir standardalternativet for de som genererer bilder fra assistenten. Selskapet presiserer imidlertid at abonnenter av Google AI Pro og Ultra De vil fortsatt ha tilgang til Nano Banana Pro for spesialiserte oppgaver, og få tilgang til den fra alternativene for bilderegenerering når det er nødvendig.

Modellen ankommer også kl. Google-søk gjennom AI-modus og linsebåde i den offisielle appen og i nettlesere på mobil og datamaskin. Google fremhever at tilgjengeligheten utvides til 141 nye land og territorier ya åtte ekstra språkDette forsterker potensialet som et verktøy for massebruk utover spesifikke markeder.

Innen utviklings- og skysektoren tilbys Nano Banana 2 i AI Studio og gjennom Gemini API I forhåndsvisning, slik at bedrifter og utviklere kan integrere bildegenerering i sine egne applikasjoner. Det er også integrert i Google Cloud ved hjelp av Vertex AI i en innledende fase åpner dette døren for prosjekter som trenger å skalere visuell produksjon fra infrastrukturer som ligger i selskapets sky.

Videre indikerer Google at Nano Banana 2 blir standard modell for bildegenerering i FlowVerktøyet, som er rettet mot kreative arbeidsflyter og i noen tilfeller audiovisuell produksjon, er tilgjengelig for alle Flow-brukere uten ekstra kostnad i form av kreditter. Innen reklamefeltet er modellen integrert i Google Ads å forbedre forslag til grafisk design når de setter opp kampanjer, noe som kan ha en direkte innvirkning på arbeidet til byråer og annonsører i Spania og resten av Europa.

Ã…penhet, opprinnelse og sikkerhet for generert innhold

Utover de kreative funksjonene dedikerer Google deler av annonsen til opprinnelse og verifisering av AI-generert innhold, et stadig mer sensitivt tema for regulatorer, brukere og europeiske medier.

Selskapet forklarer at de kombinerer teknologien til SynthID-vannmerke med innholdslegitimasjon basert på standarden C2PABildene som genereres med Nano Banana 2 inkluderer dermed usynlige signaler og standardiserte metadata som lar oss vite om AI har blitt brukt i opprettelsen av dem, og i noen tilfeller detaljer om modellen som ble brukt og konteksten for genereringen.

Google indikerer at SynthID-verifiseringsfunksjonen i Gemini-appen har blitt brukt mer enn 20 millioner ganger siden novemberDette gir en idé om interessen for å identifisere opprinnelsen til visuelt innhold. Selskapet annonserte også sin intensjon om å integrere C2PA-verifisering i applikasjonen, noe som styrker sporbarheten i tråd med de regulatoriske diskusjonene som finner sted i Europa angående syntetisk innhold.

Denne vektleggingen av åpenhet samsvarer med behovet for at bedrifter, offentlige forvaltninger og media tydeligere kan identifisere når et bilde stammer fra en AI-modell. I et miljø der visuelt innhold sprer seg raskt gjennom sosiale medier og digitale plattformer, har det blitt avgjørende å ha merkings- og verifiseringsmekanismer for å bygge tillit.

Totalt sett er Googles strategi med Nano-banan 2 Den kombinerer flere lag: på den ene siden hastighet, kvalitet og kreativ kontroll; på den andre siden integrering i hverdagsprodukter og profesjonelle verktøy; og i tillegg proveniensmål utformet for et scenario der AI-generert innhold vil ha en stadig mer synlig tilstedeværelse i dagliglivet og økonomisk aktivitet i Spania, Europa og andre markeder.

GPT-bilde 1.5
Relatert artikkel:
GPT Image 1.5: hvordan AI endrer bildegenerering og -redigering

Følg oss på Google Nyheter