Hvordan bestemme ekte lydkvalitet for streaming av lyd

For et par år siden skrev vi en artikkel om hvordan vi kan bestemme den virkelige bithastigheten til en hvilken som helst lydfil, samt hvorfor det er bortkastet tid å konvertere YouTube til 320 kbps MP3. Målet vårt var å hjelpe brukerne med å bestemme den virkelige lydkvaliteten til musikkfiler de har betalt for og lastet ned, for å unngå musikktjenester som hevder å tilby høykvalitets tapfri lyd, men for eksempel serverer MP3-filer konvertert til FLAC.

Mange brukere spurte også hvordan de kan bestemme den virkelige lydkvaliteten til streaming musikk, i stedet for lokale filer. Dette er et flott spørsmål, ettersom mange HiFi-streamingtjenester har dukket opp de siste årene, og hevdet å tilby høykvalitets tapte musikkstrømmer til brukerne.

Du tror kanskje du vil være i stand til å bare ta opp streaminglyden, lagre den lokalt som en .WAV-fil og kjøre den gjennom en spektrumanalysator som Spek. Dette kan ikke gjøres. Det er umulig å fange litt perfekt lyd fra en streamingkilde ved hjelp av det vanlige hovedkortets lydkort.

Så det vi trenger å gjøre er å bruke en nesten perfekt nøyaktig spektrumanalysator for å streame lyd og forstå hvordan vi kan lese den i sanntid.

Krav:

MusicScope-programvare
Streaming lydtjeneste etter eget valg

MusicScope er en lydanalysator og måleverktøy i sanntid som kan gi veldig presis tilbakemelding på streaminglyd. Dessverre sluttet utviklerne å selge lisenser for programvaren, men prøveversjonen lar deg teste opptil 30 sekunder med lyd.

For formålet med denne guiden skal vi gi eksempler på bruk av programvaren med lokale filer i forskjellige formater. Imidlertid kan all gitt informasjon også gjelde for streaming av lyd, for eksempel fra Spotify, Deezer, etc.

Bestemme frekvens og LRA-lydstyrkeområde

La oss prøve et tapsfritt (.M4A ALAC) spor "A Stroll Through the Sky" fra filmen Howl’s Moving Castle. Det er et orkesteropptak, så vi bør få et fint utvalg av alle frekvensområdene. For eksempel kan vi se isolerte høyfrekvente topper som cymbal shimmers mellom 11 og 22 kHz.

Når vi ser på grafene i MusicScope, kan vi se at det er et veldig høyt dynamisk område, slik vi forventer av et orkesteropptak.

Det MusicScope også kan gi oss er LRA (loudness range), som måler kontrasten mellom de mykeste og høyeste frekvensene. For dette spesifikke sporet kan vi se at det er en forskjell på rundt 23 desibel mellom de mykeste og høyeste passasjene.

Når det gjelder mikrodynamikk, har dette spesifikke sporet et veldig høyt dynamisk område, som vi forventer av et orkesteropptak av høy kvalitet, men det skjer også noen få interessante ting.

MusicScope kan fortelle oss om et spor vil ha nytte av å bli mestret med høyere oppløsning. Så spesielt dette sporet er spilt inn med en 16-bits dybde med en samplingsfrekvens på 44 kHz. Men vi kan fortelle at sporet har mye takhøyde. Fra 0 til 6 desibel under fullskala er det ingen data i det lineære frekvensspektret.

Så dette sporet har en effektiv bithastighet på bare rundt 14 til 15 bits, noe som betyr at de kunne ha brukt dynamisk rekkevidde under komprimering, eller at mikrofonene som ble brukt under opptak ikke hentet all informasjonen.

Så selv om det var en 96 kHz versjon av denne filen, ville den ikke ha nytte, fordi det er mest sannsynlig at mikrofonene som ble brukt under opptak ikke hentet alle dataene. Dette er fordi de fleste mikrofoner er designet for å kartlegge til frekvenser av menneskelig hørselsområde, så ærlig talt ville et 96 kHz / 24-biters opptak av dette sporet ikke virkelig gi noen merkbar forskjell.

Takeawayen fra dette er at for å forbedre lydkvaliteten, fokuserer vi på det som skjer under innspilling og mestring. Et overfokus på “høyoppløselige” lydfiler av hensyn til filer med høy oppløsning, distraherer oss fra det som virkelig betyr noe, som er opptaksutstyr og prosess som brukes.

Hvordan vite om en sang kan ha en bedre lydversjon

La oss prøve å bruke et EDM-spor, ‘Zebra’ fra Oneohtrix Point Never i 24-biters 44 kHz-format. Det som er interessant med dette sporet er bare den rene tettheten til den musikalske informasjonen i dette sporet. Du kan se på spektrogrammet en solid grønn blokk, og se den fylle seg gjennom hele sporet.

Dette sporet har en LRA på ca 12,9, noe som er ganske høyt for et EDM-spor. Det som er interessant her er at du kan se at det er en 24-biters sporing som bruker nesten hele 24 bitene i det dynamiske området. Den mykeste musikken i dette opptaket er rundt 100 dB under den høyeste støyen.

Så du kan fortelle bare å se på spektrogrammet at dette sporet er avskåret ved 22 kHz, det er en veldig hard cutoff, og høyfrekvente toppene på rundt 22 kHz er bare rundt 60 desibel under fullskala.

Dette betyr at hvis vi hadde en 96 kHz versjon av dette sporet, ville det sannsynligvis være nok informasjon til overs over 22 kHz, som ikke gjorde det til denne versjonen av sporet.

For å si det enkelt, vil lytteopplevelsen din kunne tenkes å dra nytte av en versjon med høyere oppløsning av dette sporet. Dette sporet når grensene for formatet (44 kHz samplingsfrekvens). Når du forstår tankeprosessen her, kan du virkelig begynne å forstå om du får servert den best mulige versjonen av et spor på en hi-fi-streamingtjeneste.

Hvordan fortelle lydopptak av dårlig kvalitet

La oss bruke sporet "Fly Away" av TeddyLoid, i 16-biters 44 kHz-format. Vi kan hør umiddelbart at sporet var veldig mestret.

Ved å se på radardiagrammet kan vi se at sporet kontinuerlig topper hele sangvarigheten, slik at det kontinuerlig klipses mot fullskala. Så hvis du spilte dette sporet gjennom mellomstore utstyr, ville det sannsynligvis forvrengt mye.

Også dette sporet har en LRA på rundt 2.3, noe som betyr at det er en spredning på 2,3 desibel dynamisk område i hele dette sporet, noe som virker ganske vanvittig.

Dårlig kvalitet eller tilsiktet produksjon?

Når vi vurderer et spor som "Fly Away", må vi også vurdere om det faktisk er et dårlig mestret spor som en amatørproduksjon, eller om det var forsettlig. Sporet "Fly Away" var ment å være en slags "disponibel", høyt dansespor. Det høres ut som om det spilles gjennom dårlige høyttalere, noe som faktisk kan ha vært intensjon bak mestring av sporet.

Tenk på det som kamerafiltre. Hvis du tar en høyoppløselig selfie og bruker et sepia-filter og for eksempel legger til litt uskarphetseffekt. Folk tror kanskje du tok et uskarpt bilde av dårlig kvalitet, men det var egentlig din intensjon. Det samme kan skje i musikkproduksjon, for eksempel med vilje dårlig “garage punk” musikk.

Så for å oppsummere. Vi kan bruke MusicScope til å bestemme all slags informasjon om et musikkspor, men vi bør også vurdere hva kunstnerens intensjon var, og om en mastering av dårlig kvalitet faktisk var en form for kunst, eller noe sånt.