PlainTalk - PlainTalk

PlainTalk er samlebetegnelsen for flere talesyntese ( MacinTalk ) og talegenkendelsesteknologier udviklet af Apple Inc. I 1990 investerede Apple meget arbejde og penge i talegenkendelsesteknologi og hyrede mange forskere inden for området. Resultatet var "PlainTalk", udgivet med AV -modellerne i Macintosh Quadra -serien fra 1993. Det blev gjort til en standard systemkomponent i System 7 .1.2, og er siden blevet sendt på alle PowerPC og omkring 68.000 Macintoshes.

Software

Talesyntese

Teknologi

Apples tekst-til-tale bruger difoner . Sammenlignet med andre metoder til syntetisering af tale er den ikke særlig ressourcekrævende, men begrænser, hvor naturlig talesyntesen kan være. Amerikansk engelsk og spansk version har været tilgængelig, men siden fremkomsten af ​​Mac OS X har Apple kun afsendt amerikanske engelske stemmer, der er afhængige af tredjepartsleverandører som f.eks. Acapela Group til at levere stemmer til andre sprog (i OS X 10.7, Apple licenseret en masse tredjeparts stemmer og stillede dem til rådighed for download i tale-kontrolpanelet).

En applikationsprogrammeringsgrænseflade kendt som Speech Manager gør det muligt for tredjepartsudviklere at bruge talesyntese i deres applikationer. Der er forskellige kontrolsekvenser, der kan bruges til at finjustere intonationen og rytmen. Taleens lydstyrke , tonehøjde og hastighed kan også konfigureres, hvilket giver mulighed for sang.

Input til synthesizeren kan eksplicit styres ved hjælp af et specielt fonemalfabet .

Original MacinTalk

MacinTalk 1 demo

Den oprindelige Macintosh-tekst-til-tale-motor, MacinTalk (navngivet af Denise Chandler), blev brugt af Apple i 1984-introduktionen af Macintosh , hvor computeren annoncerede sig selv for verden (og stakkede af med en IBM-computers vægt) . Selvom det blev inkorporeret i Macintoshs operativsystem, blev det ikke officielt understøttet af Apple (selvom programmeringsoplysninger blev gjort tilgængelige via en Apple Technical Note). MacinTalk blev udviklet af Joseph Katz og Mark Barton, der senere grundlagde SoftVoice, Inc., der i øjeblikket markedsfører TTS -motorer til Windows, Linux og integrerede platforme. Macintalk brugte direkte adgang til den originale Macintosh -lydhardware og alle forsøg på at licensere kildekoden fra Apple til at opdatere den til nyere Mac'er mislykkedes. [1] [2]

MacinTalk 2

MacinTalk 2 -demo med stemmer fra Mr. Hughes og Marvin

Til sidst frigav Apple et understøttet talsyntesesystem, kaldet MacinTalk 2. Det understøtter enhver Macintosh, der kører System Software 6.0.7 eller nyere. Det forblev den anbefalede version til langsommere maskiner, selv efter udgivelsen af ​​MacinTalk 3 og Pro.

MacinTalk 3, Pro

MacinTalk 3 introducerede en lang række stemmer. Bortset fra de voksne voksenstemmer "Ralph", "Fred" og "Kathy" og børns stemmer som "Prinsesse" og "Junior", blev forskellige nyhedsstemmer inkluderet, som "Whisper", "Zarvox" (en robotstemme med melodi baggrundslyde, med en lignende stemme kaldet "Trinoids" også inkluderet), "Cellos" (en stemme, der sang sin tekst til en Edvard Grieg -melodi , med lignende sangstemmer som "Good News", "Bad News", "Pipe Organ" ), "Albert" (en hæslydende stemme), "Bells", "Boing", "Bubbles" og andre.

Hver af disse stemmer kom med sin egen eksempeltekst, der ville blive talt, når man ramte knappen "Test" i Tale -kontrolpanelet. Nogle vil bare sige deres navn, sprog og den version af MacinTalk, de blev introduceret med. Andre ville sige sjove ting, som "jeg kan godt lide at være inde i denne smarte computer", "jeg har en frø i halsen ... Nej, jeg mener en rigtig frø!", "Vi må glæde os over denne morbide stemme" (en parodivestlig kirkesalme med orgelmusik ), eller "Det lys, du ser for enden af ​​tunnelen, er forlygten på et hurtigt nært tog". Disse stemmer samt deres testtekster findes stadig i Mac OS X i dag.

Med den stigning i computerkraft, som AV Mac'erne og PowerPC -baserede Macintoshes leverede, havde Apple råd til at øge kvaliteten af ​​syntesen. MacinTalk 3 krævede en 33 MHz 68030 processor og MacinTalk Pro kræves en 68040 eller bedre og mindst 1 MB af RAM . Hver synthesizer understøttede et andet sæt stemmer.

Tekst-til-tale i Mac OS X

Tekst-til-tale har været en del af hver Mac OS X (senere macOS) version. Victoria -stemmen blev forbedret betydeligt i Mac OS X v10.3 og tilføjet som Vicki (Victoria blev ikke fjernet). Dens størrelse var næsten 20 gange større på grund af de anvendte diphone-prøver af højere kvalitet.

En ny, meget mere naturligt lydende stemme, kaldet "Alex" er blevet føjet til Mac-tekst-til-tale-listen med udgivelsen af Mac OS X 10.5 Leopard.

Med Mac OS X 10.7 Lion er stemmer tilgængelige på yderligere amerikansk engelsk og andre engelske accenter samt 21 andre sprog.

Funktionen Tal markeret tekst, når der trykkes på tasten , gør det muligt at læse markeret tekst fra ethvert program via en tastekombination. Fra Mac OS X 10.1 til Mac OS X 10.6 ville funktionen kopiere den markerede tekst til udklipsholderen og læse den derfra. Fra Mac OS X 10.7 til Mac OS X 10.10 krævede en ny implementering af funktionen softwareudviklere at implementere en talesyntese -API i deres applikationer. Dette forhindrede udklipsholderen i at blive overskrevet, men betød også, at for applikationer, der ikke brugte API'en, ville funktionen ikke fungere som forventet og læse titellinjen frem for den markerede tekst.

I macOS Sierra 10.12 blev Siri introduceret til Mac'en, men stemmen var ikke tilgængelig som System Voice, hvilket betød, at Siri -stemmerne kun kunne bruges i Siri. Siri blev gjort tilgængelig som systemstemme i macOS Catalina 10.15, så det kunne fungere for enhver tekst. Siri -stemmerne fungerer på en helt anden måde, og saykommandoen er stadig ude af stand til at bruge Siri.

Tale genkendelse

Apple hyrede mange talegenkendelsesforskere i 1990. Efter cirka et år demonstrerede de en teknologi med kodenavnet Casper. Den blev frigivet som en del af PlainTalk -pakken i 1993. Selvom den var tilgængelig for alle PowerPC Macintoshes og AV 68k -maskiner (det var en af ​​de få applikationer, der brugte DSP i Centris 660AV og Quadra 840AV ), var den dog ikke en del af standardsysteminstallationen før Mac OS X, hvilket kræver, at brugeren udfører en brugerdefineret OS -installation for at få talegenkendelsesfunktioner.

I Mac OS X 10.7 Lion og tidligere var Apples talegenkendelse kun stemmekommandoorienteret, dvs. ikke beregnet til diktering. Den kan konfigureres til at lytte efter kommandoer, når der trykkes på en genvejstast, efter at den er blevet adresseret med en aktiveringsfrase som f.eks. "Computer" eller "Macintosh" eller uden prompt. En grafisk statusmonitor, ofte i form af en animeret karakter, giver visuel og tekstlig feedback om lytterstatus, tilgængelige kommandoer og handlinger. Det kan også kommunikere tilbage med brugeren ved hjælp af talesyntese.

Tidlige versioner af talegenkendelse gav fuld adgang til menuerne. Denne understøttelse blev senere fjernet, da den krævede for mange ressourcer og gjorde anerkendelsen mindre pålidelig, kun for at blive tilføjet igen i Mac OS X 10.3 som en "universel adgangsteknologi" kaldet talte brugergrænseflader.

Brugeren kan starte genstande placeret i en særlig mappe, kaldet "Speakable Items", simpelthen ved at tale deres navn (mens systemet er i lyttetilstand ). Apple leverede et antal AppleScripts i denne mappe, men aliasser , dokumenter og mapper kan åbnes på samme måde.

Yderligere funktioner leveres af individuelle applikationer. En applikationsprogrammeringsgrænseflade lader programmer definere og ændre et tilgængeligt ordforråd . For eksempel Finder giver et ordforråd til at manipulere filer og vinduer .

I OS X 10.8 Mountain Lion introducerede Apple "Diktat", beregnet til generel tekst. Oprindeligt krævede det afsendelse af lyddata til Apple -servere til behandling. I OS X 10.9 Mavericks tilføjede Apple muligheden for at downloade support til diktering uden en internetforbindelse. Fra OS X 10.9.3 understøttes otte sprog (19 dialekter).

I populærkulturen

I radio

MacinTalk -talesyntesen kan høres i et par radioprogrammer:

  • Nogle af radiostikkene i BBC Radio 1 -serien Blue Jam bruger MacinTalk.

I musik

MacinTalk -talesyntesen kan høres i et par sange:

  • MacinTalks "Vicki" taler i pauserne i Studio Killers "In Tokyo".
  • "Repeating I går" fra As I Lay Dying 's Shadows Are Security -album brugt MacinTalk i introen.
  • " Tilfredshed " af Benny Benassi , samt andre sange af ham.
  • "Toby's Mac" af tobyMac , fra hans første album Momentum .
  • MacinTalks "Fred" er med i Radiohead -sangene " Paranoid Android " og "Fitter Happier", begge fra deres album fra 1997 OK Computer . I den tidligere sang bruges Fred til at levere baggrundsvokal, mens han i sidstnævnte fungerer som den ledende "vokalist".
  • Fall Out Boy brugte MacinTalk i begyndelsen af ​​" Grand Theft Autumn/Where Is Your Boy " (Millennium Version) og i slutningen af ​​det sidste nummer og bonusspor på deres album Infinity on High .
  • Det franske band Air bruger flere Macintosh -stemmer i deres nummer "How Does it Make You Feel"
  • " Yoshimi Battles the Pink Robots, Pt. 1 " af The Flaming Lips har stemmen "Zarvox"
  • Mange Aphex Twin -numre, herunder " Ventolin (Crowsmengegus Mix) ", Funny Little Man "og" Cow Cud Is a Twin "har også PlainTalk
  • Sangen "John Orr the Arsonist" af And Then There Were None indeholder en kort monolog, der bruger denne stemme.
  • "The Vic -E Interpretation - Interlude" fra TLC 's album FanMail indeholder "Victoria", der sammenligner og kontrasterer klubkultur i USA og Japan.
  • "Intro" fra OutKast 's Stankonia -album indeholder stemmen "Bells".
  • Sangen "Pomme C" af den franske sanger Calogero på albummet Pomme C indeholder en kort monolog i begyndelsen ved hjælp af stemmen "Vicki"
  • "DWYL" af Phil Joel
  • Albummet Antichrist Superstar af bandet Marilyn Manson gør gentagne gange brug af MacinTalk -stemmer "Kathy", "Princess" og "Junior", der ofte er lagt oven på hinanden. Albummets titelsang ender med, at MacinTalk -stemmerne gentager: "Når du lider, ved, at jeg har forrådt dig". MacinTalk -stemmer bruges igen i musikvideoen og liveopførelser af " Antichrist Superstar ". MacinTalk -stemmerne gentager "Du kan lige så godt slå dig selv ihjel - du er allerede død" i slutningen af ​​sangen. Sangen " Man That You Fear " slutter også med, at MacinTalk stemmer siger: "Når alle dine ønsker bliver opfyldt, vil mange af dine drømme blive ødelagt."
  • De fleste af hr Oizo 's Transseksuel EP og Lambs Anger album indeholder MacinTalk stemmer
  • Korea Idol T-ara 's sang "Bo Peep Bo Peep" fra Absolute First Albums introduktionsdel 'Tab dig ikke så hurtigt'
  • Den El-P sangen "Stepfather Factory", fra 2002 albummet Fantastisk Skader , ender med MacinTalk-stemmer gentage, "Hvorfor gør du mig såre dig? Jeg elsker dig".
  • I EDM -producenten Skrillex 'nummer med titlen "I Wish You All The Luck Of The World" kan MacinTalk -stemmen "Alex" høres gentage "David, I wish you all luck in the world" flere gange i forskellige baner.
  • Rob & Goldies nummer fra 1997 "The Shadow (The Process Mix af Rick Smith for Underworld )" gør omfattende brug af "Victoria" -stemmen og læser en ordbogsdefinition af "skygge" og et digt fra bogen Process: A Tomato Project .
  • Jean-Michel Jarres album " Métamorphoses " fra 2000 bruger MacinTalk til at generere tekster på nummeret "Love, Love, Love".
  • Åbningslinjen for " Treasure " af Bruno Mars på albummet Unorthodox Jukebox er stemmen Alex siger: "Baby egern, du er en sexet jævel".
  • I "Nogle gange bliver tingene, uanset hvad" af deadmau5 fra albummet Tilfældigt albumtitel , linjen med sløjfe, "Nogle gange bliver tingene komplicerede" en kombination af stemmerne "Ralph" og "Kathy".
  • Electro house duo BSOD's ( deadmau5 & Steve Duda ) nummer "This is the Hook" bruger "Ralph" stemmen til at signalere forskellige dele af et typisk elektronisk musiknummer.
  • Den tyske elektroniske handling Monolake bruger PlainTalk "Whisper" -stemmen i nummeret "Bicom" på deres album Cinemascope .
  • Plogue Art et Technologys virtuelle synthesizer chipspeech efterligner MacinTalk 1.0.
  • I'm A Disco Dancer (And A Sweet Romancer) af Christopher Just bruger forskellige MacinTalk -stemmer
  • David James bruger nogle MacinTalk -stemmer i sin sang (Always) A Permanent State

I film

I fjernsynet

I videospil

  • MacinTalk blev brugt i den japanske version af spillet Killer7 , som stemmer fra Remnant Psyches.
  • MacinTalk blev brugt i spillet No More Heroes . Før hver chefkamp ville "Whisper" -stemmen annoncere den nuværende chefs navn.
  • Videospilserien KKnD havde MacinTalk -stemmen "Zarvox" for det 21. århundredes robottenheder placeret i tech -bunkers i begge spil.
  • Den originale udgivelse fra 1999 af The Silver Case brugte "Ralph" og "Boing" i sit introduktionsspor.
  • Videospillet Grand Theft Auto IV brugte "Vicki" som stemmen til DJ'en i radiostationen " The Journey " i spillet .
  • Videospillet Machinarium fra 2009 indeholder flere Macintalk -stemmer i sin omgivende musik.
  • Den 3DO version af Stjerne Control 2 brugte "Bruce" som talerør for Slylandro Probe. Spillet krediterer sondeens stemme som 840AV . "Agnes" blev også brugt som stemmen på kaptajnens skibscomputer, hørt ved det første møde med Orz -løbet.
  • Den japanske og europæiske version af Sonic CD brugte MacinTalk -stemmer i baggrundsmusikken på Metallic Madness 'Bad Future -stadier.
  • Videospillet Castle Crashers brugte den nye stemme Boing til en karakter kendt som The Painter.
  • 2003 -videospillet Shin Megami Tensei: Nocturne brugte "Albert" til vokal i sit soundtrack.

I webvideoer

  • I Homestar Runner -tegneserien "Everybody to the Limit" blev MacinTalk -stemmen "Zarvox" brugt som stemmen til Visor Robot -karakteren, og senere brugt til samme formål i tegneserien "Marzipans telefonsvarer #17".
  • MacinTalk -stemme "Zarvox" blev brugt til at stemme robotten i Smosh -videoen "AWESOME NEW ROBOT!", Og "Fred" -stemmen blev brugt til at stemme Stephen Hawking i "15 HOUR ENERGY!"
  • YouTuber Max Gilardi brugte forskellige Macintalk -stemmer til sine videoer.
  • Den Gør Fiends web-serie havde en version af episoden "Kitty Kitty Kitty", hvor den oprindelige lyd blev erstattet med et edb-tale simulator.
  • Åbningen for Nitro Rad har stemmen, der siger ordene "Nitro Rad."

I logoer

  • Den MTV Home Video logo fra 1998 til 2010 bruger "Kathy", "Trinoids" og "Fred" stemmer.

Hardware

Apple producerede to mikrofoner under produktnavnet "Apple PlainTalk Microphone". Den første leveret inklusiv med Macintosh LC og tidlige Performa -modeller, og var cirkulær i udseende. Det var designet til at sidde i en holder fastgjort på siden af ​​et CRT -display og blive løftet ud og holdt af munden, når man taler. Den anden model blev introduceret sammen med AV -modellerne i Macintosh Quadra -serien i 1993, men blev også solgt separat. Den var designet til at blive placeret oven på skærmen og være følsom over for lyd forfra. Begge modeller havde et længere stik, hvis spids blev brugt til at forsyne mikrofonen med forspænding .

Referencer

eksterne links