Microsoft Word, Outlook og PowerPoint for å få AI-drevet automatisk bildeteksting-verktøy trent på store datasett etter Azure Services

Microsoft har bekreftet at de har utviklet et kraftig og smart bildetekstsystem. Det AI-drevne systemet kan raskt og autonomt generere relevante kationer av bilder. Systemet er kanskje ikke så flytende eller kreativt som mennesker som lager bildetekster for bilder, men det har angivelig blitt trent på store datasett for å forbedre relevans og nøyaktighet. Microsoft forsikrer at systemet er dobbelt så kraftig som det som er vanlig i tjenestene til selskapet.

Microsoft har et nytt automatisk teksting-system for bilder. Systemet lanseres først i Azure Cognitive Services. Imidlertid har Microsoft antydet at det samme vil dryppe ned til Microsoft Word, Outlook og PowerPoint.

Hvordan fungerer det nye bildetekstsystemet for AI-Drive?

Ethvert AI-drevet system må først trenes på relevante datasett. Disse algoritmene lærer av datapunktene og får deretter muligheten til å etterligne de forventede atferdsmønstrene. Microsofts nye automatiske bildetekstesystem er angivelig trent med et stort datasett med bilder som ble parret med ordmerker. Disse ordlappene ble kartlagt til et tydelig objekt i et bilde.

Etter den første opplæringen finjusterte forskerne den forhåndstrente modellen for bildetekst på det allerede undertekste bildedatasettet. Opplærings- og finjusteringsprosessen tillot AI-modellen å lære å komponere en forståelig setning. Den nye AI-modellen utnytter deretter det visuelle ordforrådet til å selvgenere bildetekster for bilder som inneholder nye eller forskjellige objekter nøyaktig. Det ser ut til at det er lagt vekt på objektet som er spesifikt eller unikt i bildet.

Som med alle AI-modeller er ikke Microsofts bildetekstsystem 100 prosent nøyaktig eller perfekt. Imidlertid forsikrer Microsoft at den nye AI-modellen er dobbelt så bedre som bildetekstmodellen som for øyeblikket brukes i selskapets produkter og tjenester. Intern testing indikerer at den nye modellen kan lage bildetekster som er mer beskrivende og nøyaktige enn billedtekstene skrevet manuelt av mennesker, hevder Xuedong Huang, en teknisk teknisk stipendiat fra Microsoft og teknologidirektør for Azure AI Cognitive Services i Redmond, Washington,

“Vi tar dette AI-gjennombruddet til Azure som en plattform for å betjene et bredere sett med kunder. Det er ikke bare et gjennombrudd i forskningen; tiden det tok å gjøre dette gjennombruddet til produksjon på Azure, er også et gjennombrudd. ”

Det Huang antydet var at Microsoft har klart å akselerere utviklingen, foredlingen og distribusjonen av AI-modeller som kan konkurrere mot menneskelig generert innhold. Det er imidlertid viktig å merke seg at disse modellene vanligvis følger et bestemt sett med retningslinjer og er sterkt avhengige av datasettene.

Microsoft har jobbet hardt de siste årene for å tilføre kraften til AI over flere av sine produkter og tjenester. AI har makten til å øke produktiviteten mens de frigjør mennesker til å gjøre mer kreative oppgaver. Interessant, Microsoft har som mål å hjelpe alle brukere med å få tilgang til det viktige innholdet i et hvilket som helst bilde for mennesker med synshemming gjennom det nye automatiske bildetekstsystemet.

Facebook Twitter Google Plus Pinterest