Microsoft Azure-granskning: Enastående granskning av röstbearbetning

Microsoft Azure Speech to Text är en av de mest avancerade plattformerna för röstigenkänning. Som en del av Microsofts produktutbud för Cognitive Speech Services använder den sig av djupa inlärningsalgoritmer för att övervinna dålig ljudkvalitet och kan anpassa sig till olika talstilar för exakta ljudtranskriptioner. I denna Microsoft Azure Speech to Text-granskning kommer vi att titta närmare på den här tjänsten. 

Det är värt att notera att Microsoft Azure Speech to Text inte är ett traditionellt program för användarvänlig diktering. Istället är detta en utvecklingsorienterad plattform som är utformad för att hjälpa företag att skapa, testa och hantera sina egna produkter. Om du bara vill transkribera ett parti ljudfiler kan alternativa tal-till-text-appar vara ett bättre alternativ. Ta en titt på vår Bästa tal-till-text mjukvaruhandbok för de bästa alternativen.

Microsoft Azure Tal till text: Planer och prissättning

Med hjälp av Microsoft Azure Speech to Text kan du transkribera upp till fem timmars ljud gratis och skapa en anpassad röstmodell per månad. Men med den kostnadsfria planen är det bara en enda samtidig ljudbegäran tillgänglig åt gången, vilket betyder att det här alternativet inte är genomförbart för de flesta företag.

Azure-taltjänstfakturering delas upp i en sekunders steg. (Bildkredit: Microsoft)

Om du vill transkribera mer än ett talklipp på en gång måste du uppgradera till det vanliga prissystemet Azure. Detta kostar $ 1 per timme ljud och stöder upp till 20 samtidiga förfrågningar. Ytterligare avgifter är involverade om du behöver använda en anpassad ljudmodell eller transkribera flerkanaliga ljudfiler. Dessa extra tjänster kostar $ 1,40 respektive $ 2,10 per ljudtimme.

Även om Microsoft listar sina priser i en “per ljudtimme” som industristandarden, faktureringen delas faktiskt upp i en sekunders steg så att du inte betalar för mer behandlingstid än vad som krävs.

Microsoft Azure Tal till text: funktioner

Den viktigaste Azure Speech to Text-funktionen är den åtkomst den ger till Microsofts kraftfulla naturliga språkbehandlingssystem. Under de senaste åren har Microsofts tal AI nått flera viktiga milstolpar. Detta innebär att det nu kan fullfölja uppgifter som tidigare var omöjliga för en taligenkänningstjänst, som exakt att transkribera korssamtal under små gruppsamtal.

Microsoft Azure Speech to Text-tjänst kan integreras med Office 365 för optimal noggrannhet. (Bildkredit: Microsoft)

Azure arbetar med dussintals språk och dialekter och kan utbildas – med hjälp av anpassade taligenkänningsmodeller – för att bättre anpassa sig till användarens talstil, bakgrundsmiljöbuller och ordförråd. Om din organisation redan är engagerad i Microsofts produktekosystem kan du utnyttja användaren Office 365-data för att bättre förbättra taligenkänningsnoggrannheten för organisationsspecifika termer. Och det är viktigt att detta kan göras utan att kompromissa med din datasäkerhet eftersom tal till text kan köras lokalt.

Microsoft Azure Tal to Text: Setup

Microsoft Azure har utformats för utvecklare snarare än för konsumenter. Detta innebär att installationen är en involverad och lite utmanande procedur som bäst lämnas åt någon med en hel del teknisk kunskap. 

Att ställa in Azure är inte exakt enkelt om du inte har kodningsupplevelse. (Bildkredit: Microsoft)

Det snabbaste sättet att konfigurera Azure är att använda Azure Speech SDK på ett programmeringsspråk som Java eller C ++. För detta måste du registrera dig för ett gratis Azure-konto och skapa ett tomt projekt i din utvecklingsmiljö. Du måste sedan använda Microsoft Visual Studio och skriva ett kort program för att initiera Microsofts SpeechRecognizer-objekt. 

Microsoft Azure Tal till text: Gränssnitt

Liksom andra bulktranskriptionsplattformar är Microsoft Azure Speech to Text avsett att köras som ett applikationsprogrammeringsgränssnitt (API), läggs till Office 365-program eller integreras i nya plattformar och tjänster. På grund av detta finns det inget enda Azure Speech to Text-gränssnitt. Vad slutanvändaren kommer att se beror på hur Azure Speech to Text har integrerats.

Online-portalen Azure är intuitiv och enkel att använda. (Bildkredit: Microsoft)

Samtidigt kommer utvecklaren som hanterar Azure att göra det via Microsofts online Azure Portal, som känns modern och lätt att navigera. Det tar bara några minuter att hitta resurssidan för taltjänster och när en instans har lagts till i ditt konto kan övervakningsvarningar och användning visas i ett enda fönster.

Microsoft Azure Tal till text: Performance

Som en del av vår Microsoft Azure Speech to Text-granskning var vi angelägna om att se hur den här plattformen hanterade utmaningen att bearbeta råa röstinspelningar, så när vårt Azure-konto var redo att ladda upp laddade vi upp en serie klipp med olika nivåer av bakgrundsljud . Över hela linjen gjorde Azure ett bra jobb med att bearbeta våra prover eftersom vi inte såg mer än en handfull fel under vår utvärdering.

Att aktivera Azures anpassade talmodell förbättrade transkriptionens noggrannhet. (Bildkredit: Microsoft)

Azure kämpade något när de bearbetade ovanliga eller specialfraser som idrottslagnamn och vetenskapliga termer till en början, men detta löstes snabbt genom att aktivera alternativet för anpassad modell. När vi hade aktiverat det här alternativet kunde Azure anpassa sig till den unika ordförråd och talstil som vi använde.

Microsoft Azure Tal till text: Support

För att lära dig hur du interagerar med Azure Speech Services SDK genom olika programmeringsspråk och integrerar Azure Speech to Text-funktioner i din egen plattform behöver du definitivt lite hjälp. Lyckligtvis har Microsoft skapat en omfattande katalog över träningsmaterial för Azure-plattformen, där du hittar kodexempel och praktiska tips. 

Utbildningssektionen på Azure-webbplatsen innehåller många användbara resurser. (Bildkredit: Microsoft)

Dessutom får alla Azure-kunder gratis fakturerings- och prenumerationshanteringsstöd som kan nås via ett biljettsystem. Mer djupgående support kan läggas till ditt konto för en återkommande avgift, från 29 USD per månad.

Microsoft Azure Tal till text: Slutlig dom

Azure Speech to Text-plattformen använder den senaste tekniken för att ge en nästan perfekt transkriptionstjänst. Det är mest lämpligt för företag som redan investerat i Microsoft Office 365-ekosystemet eftersom anpassade röst- och ordförrådsmodeller kan genereras säkert från ditt befintliga dokumentarkiv. Vissa små företag kan kämpa med Azure eftersom det krävs uppmärksamhet från en kvalificerad Microsoft-molnutvecklare för att installera den.

Tävlingen

Amazon Transcribe, Google Cloud Speech-to-Text och Watson Speech to Text är direkta konkurrenter till Microsoft Azure. Dessa tre plattformar är också alla kapabla att utföra stora volym-transkriptioner exakt. Google Cloud är den enda nära konkurrent som kan arbeta med fler språk än Azure, och det är också billigare, med en startfrekvens på bara 0,006 dollar per minut jämfört med Azures 0,017 $..

För att hitta andra alternativ till Microsoft Azure Speech to Text, kolla in vår bästa guide-till-text-programvaruhandbok.