Google snakker om viktigheten av åpen kildekode og åpne data i et nylig blogginnlegg
Google som selskap har alltid støttet programvare og data med åpen kildekode, i det minste i stand. Det er nesten en trend med store selskaper nå, ettersom både Google og Microsoft har gitt fremtredende bidrag til open source-scenen. “Google er også en stor bidragsyter til programvare med åpen kildekode. Sentrale eksempler på dette inkluderer Android, operativsystemet vårt for smarttelefoner, Chromium, kodebasen for Chrome-nettleseren vår (som også driver mange konkurrenter), og TensorFlow, vårt maskinlæringssystem. Googles utgivelse av Kubernetes endret cloud hosting for alltid, og har muliggjort innovasjon og konkurranse i skyindustrien. Google er også den største bidragsyteren av åpen kildekode til GitHub, et delt lager for programvareutvikling. I 2017 utførte Googlers mer enn 250.000 endringer i titusenvis av prosjekter på GitHub alene.”
I de fleste tilfeller handler det ikke egentlig om raushet, men mer om å dra nytte av gratis utvikling og deretter tjene på bred adopsjon. Uansett har disse bidragene hjulpet tusenvis av forskere og har ledet programvareutvikling på en enhetlig måte, noe som bør feires. Google i en nylig blogginnlegg fremhevet deres bidrag til åpen data og programvare med åpen kildekode.
Med fremveksten av sporing i sanntid og utvikling av førerløse biler gjøres det mye forskning innen datasyn, og Google er et av selskapene i forkant av Visual Tech.
Google sitter også på mye data som kan hjelpe NLP-forskning og hjelpe datamaskiner bedre å forstå menneskets tale. I blogginnlegget fremhevet Google delingen av en nøkkeldatabase som sier "Med hensyn til språkbehandling har vi delt Natural Questions-databasen, som inneholder 307373 menneskeskapte spørsmål og svar. Vi har også gjort tilgjengelig Trillion Word Corpus, som er basert på ord som brukes på offentlige nettsider, og Ngram Viewer, som kan brukes til å utforske de mer enn 25 millioner bøkene i Google Books. Disse samlingene kan brukes til statistisk maskinoversettelse, talegjenkjenning, stavekorreksjon, gjenkjenning av enheter, informasjonsutvinning og annen språkforskning. ”
Søkemotoren er en av Googles kjernevirksomheter og får over 63 000 spørsmål hvert sekund. Disse dataene er veldig viktige for selskapet, og Google analyserer disse dataene for målrettet annonsering. Noen innsikt i de samlede dataene blir likevel offentliggjort i Googles trendportal.
“Google tilbyr også Google Trends, en gratis tjeneste som gjør det mulig for alle å se og laste ned samlet søkeaktivitet siden 2004 for Google Søk, Bildesøk, Nyhetssøk, Shopping og YouTube. Du kan få søkeinformasjon for land, regioner, metroområder og byer på en månedlig, ukentlig, daglig og til og med timebasis. Trends-dataene er mye brukt av forskere innen så varierte felt som medisin og økonomi. I følge Google Scholar er det mer enn 21.000 forskningsartikler som siterer Trender som datakilde. ”
Hvorfor jobbe med prosjekter med åpen kildekode?
Jeg snakket kort om dette i begynnelsen av artikkelen. En ny programvare kan implementere en god idé og innovere rommet, men det hindrer ikke andre i å implementere lignende ideer og deretter arbeide for å gjøre det bedre. Mange selskaper har lært det på den harde måten, for eksempel Windows Phone. Som vi vet var det en rungende fiasko og av mange grunner, men å ha et lukket miljø og kontrollere lisensiering var en stor del av det. Hardoop og HDFS var versjoner av MapReduce med åpen kilde bygget av Google, og selskapet lærte viktigheten av åpen kildekode tidlig. Oppsummert er beslutningen om å lage en IP-kildekode strategisk.
Google i blogginnlegget sitt går inn på noen få andre grunner, og sier "Først og fremst er vårt primære oppdrag "å organisere verdens informasjon og gjøre den allment tilgjengelig og nyttig." Absolutt en åpenbar måte å gjøre informasjon tilgjengelig og nyttig på er å gi den bort!”
De snakker også om hvorfor de ikke kan gi ut ting som sier "Selvfølgelig kan vi ikke frigjøre alle dataene vi bruker i vår virksomhet. Vi må beskytte brukernes personvern, opprettholde konfidensialitet for bedriftskunder og beskytte Googles egen intellektuelle eiendom. Men med forbehold om slike hensyn, prøver vi generelt å gjøre dataene våre så “universelt tilgjengelige og nyttige” som mulig.“