Címlapsztori


Játékszer vagy szintetikus személyiség?

„Prodyka vagyok"

Újabb megpróbáltatás vár a jó öreg DOS parancsokhoz szokott programozókra és felhasználókra. Alig szokták meg a minduntalan legördülô listákat, a képernyôt betöltô ikonokat, figurákat, az egeret, amivel meg kellett tanulni mozgatni a képernyôn tolongó szimbólumokat, ügyeskedni a TrackBall-lal, pláne a TrackPointtal, most itt az újabb csapás: a képernyôn ide-oda röpdösô, beszélô, sôt visszabeszélô Prody papagáj.

Egyelôre ugyan csak angolul tud, s igencsak megköveteli magának a különleges bánásmódot: a gyors s kiváló minôségû eszközöket, de minden bizonnyal nincs messze az idô, amikor mezei felhasználók szolgálatába is elszegôdik. S kicsit sem fogunk csodálkozni, ha az irodák úgy néznek majd ki, mint egy diszpécser központ vagy egy call centeres munkahely, hogy korszerûbb példával éljek. Ennek az oka, hogy madarunkat irányítani a fejbeszélô (headset) segítségével a legkényelmesebb, s talán így zavarja legkevésbé a szobában dolgozó többi munkatársat.

A programban az amerikai Associative Cognition, Inc. fejlesztôi a mesterséges intelligencia kutatások legújabb eredményeit használták fel. (Szinte már mondani sem kell, hogy a cég alapítója és elsôszámú vezetô embere Király József, magyar származású. Honlapjukra ellátogatva a kaliforniai cím mellett meglepetésemre még két magyar cég nevét találtam.)

Prody az eszét a gépi tanulás kutatásában elért eredményeknek köszönheti. Az ALM (Associative Learning Memory) képezi a tudása alapját. Az ALM nem más, mint az élôlények ideghálózatának és idegi folyamatainak tanulmányozása során elért eredményeket felhasználó úgynevezett eseményosztályozó algoritmus. Igen komoly, több évtizedes munka áll tehát a kis papagáj mögött. A gépi tanulás már régóta foglalkoztatja a tudósokat, de a gyakorlatban is használható eredmények csak mostanában kezdenek születni. Természetesen a technika fejlôdése is besegít, hiszen ezeknek az eszközöknek az alkalmazásához elengedhetetlen a nagyon gyors gép és a nagy tároló kapacitás. Ennek a folyamatnak eredményeként született meg a kis madár, „akit" már nem is lehet a lekicsinylô program névvel illetni, a mesterséges személyiség jobban illik rá. Találónak tûnik, hogy papagáj képében jelent meg közöttünk, tanítása minden bizonnyal élô társaihoz hasonlóan nagy türelmet igényel. Készítôi segítôtársnak szánták, hogy a gépekkel is emberi módon tudjunk kommunikálni. Elnevezésére is szívesen használják az asszisztens szót. Tudása pedig napról napra gyarapítható, igazi személyiséggé formálható. Remélhetôleg nem lesz beképzelt s nem nô a fejünkre, vagy &endash; hogy stílszerû legyek &endash; a memóriánkra. Bár igaz, ami igaz: a gép memóriáját és futási idejét meglehetôsen leterheli. Ha egyedül vagyunk, kiválóan pótolja a kollégákat: vicceket mesél, kvíz játékokkal szórakoztat vagy énekel. Elônye viszont, hogy egyetlen mozdulattal elhallgattatható, s talán meg sem sértôdik.

Komolyabb feladatok végrehajtására is betanítható, ezeket makrószerûen billentyû és egérparancsok sorozatából állíthatjuk össze. Megkönnyíti a munkánkat, ha komplett feladatokat csak egyetlen billentyû lenyomásával jelezzük, s ezt kis segédünk azonnal elvégzi. Szinte lesi a kívánságainkat: például követi az egér mozgását. Hanggal navigálhatunk a Windows alkalmazások között és a Weben való kalandozáshoz sem kell „egerésznünk". A gyerekeknek bizonyára élvezetesebbé teszi a tanulást, ha például a fôvárosok neveit Prodyval játszva sajátíthatják el. Néhány kísérletezés után felismeri a hangunkat. Ha elég türelmesek vagyunk még egyszerûbb magyar nyelvû utasításokat is megért. Bizonyos helyzetekre való reagálása is elég változatos, nem csak beszél, hanem animáció segítségével is kifejezi nem tetszését vagy örömét. Ha elegünk van belôle, szomorúan gubbaszt a képernyô sarkában.

Az biztos, a kis Prody megszínesíti majd az életünket. Egyre kell csak vigyázni: továbbra sem szabad a PC-k közelébe macskát engedni, mert most már nem csak az egérre, hanem a papagájra is veszélyes. S gondoljunk csak szegény Svejkre: neki sem sikerült Lukás fôhadnagy macskáját és kanáriját összeismertetni!

Prody konfiguráció-igénye:

&endash; Windows 95 vagy Windows NT 4.0 operációs rendszer

&endash; Mindmaker's TextAssist‚ és VoiceAssist alkalmazások, amelyeket a Prody Parrot 2.0 csomag tartalmaz

&endash; 90 MHz (vagy gyorsabb) Pentium processzoros PC a Windows 95-höz, 120 MHz (vagy gyorsabb) PC a Windows NT 4.0-hoz

&endash; Legalább 16 MB RAM a Windows 95-höz, 32 MB RAM a Windows NT 4.0-hoz

&endash; Sound Blaster 16 vagy 32, AWE 64 vagy más Sound Blaster hangkártya

&endash; Irányított mikrofon és hangszóró

&endash; Madárbarát gazdi

Tegnap sci-fi, holnap ...

Érdekes megoldásokon dolgozik a Xerox grenoble-i kutatólaboratóriuma. Olyan számítógépes alkalmazásokat fejlesztenek, amelyek a szövegszerkesztô programokban, számítógépeken, Interneten keresztül közlekedô és tárolt információkat tartalom szerint képesek elemezni, feldolgozni, sôt, elôre meghatározott szempontok szerint kivonatokat készíteni, dokumentumokat szûrni, a felhasználó által beállított értékrend szerint rangsorolni és így tovább. Jó célra hasznosítva hihetetlenül hasznossá válhatnak ezek az applikációk, mert segítenek például az Interneten lévô szinte áttekinthetetlen információhalmazból, vagy a digitális könyvtárakból a számunkra hasznos tudáshoz hozzáférni.

Minden bizonnyal nincs messze az az idô sem, amikor ezek a fejlesztések, no meg Prody papagáj és az IBM diktálást megértô szoftvereinek tudása is összekapcsolható, ami ma még szinte beláthatatlan távlatokat nyithat meg elôttünk.

A dolog árnyoldala azonban, hogy ezekkel a technológiákkal vissza is lehet élni &endash; és akkor bizony lehet, hogy Orwell legijesztôbb álmai is valóra válnak egy-egy mélynövésû, ôrült elméjû politikus vezette országban.

Gyôri Erzsébet

elôre, hátra, tartalom, honlap


Beszédértô számítógép

Titkárnôk, reszkessetek?

Régi álom megvalósulása körvonalazódik az IBM ViaVoice programcsomagja segítségével. Jó lenne az írásbeliséget úgy megvalósítani, hogy a külsô segítség: íródeák, gyorsíró, titkárnô, klaviatúra ne kelljen hozzá. Gondolatainkat hangosan kimondva, valami okos kis szerkezet rögtön írásos anyaggá formálná.

Ezt a kissé utópisztikus kívánságot valósítja meg a ViaVoice, amit egyszerûbb szövegek, feljegyzések készítésére szántak. A ViaVoice upgrade verziót akkor tudjuk a gépünkre telepíteni, ha már birtokunkban van a VoiceType 3.0, a Simply Speaking, a Simply Speaking Gold vagy a ViaVoice 4.1 programok valamelyike. A Windows '95 illetve Windows NT operációs rendszer szükséges hozzá. Természetesen a program igényel hang ki- s bemenetet. Itt ért ugyan némi csalódás, mert az IBM ThinkPad 600 gépén szerettük volna kipróbálni, de sajnos a beépített hangkártyája nem bizonyult 100 százalékig Sound Blaster kompatíbilisnek. Így aztán a minimum konfigurációt voltunk kénytelenek használni, egy 133 MHz-es Pentium-S processzort, SB 16 hangkártyával. Kicsit ugyan tiltakozott a telepítô a lassú gép miatt, de azért befejezte a munkát. A tesztelés körülményeirôl még annyit, hogy a Simply Speakig Gold volt az alapprogram és Windows 95-ös operációs rendszer alatt futtattuk.

Ha szerencsésen sikerült túljutni a mikrofon és a hangszóró beállításokon, amikor a teremzaj szintjét és a beszéd erôsségét állítja be magának a program, elkezdhetjük a tanulás, tanítás folyamatát. Természetesen ez a verzió magyarul még nem tud, de például a UK English kiejtésünket tesztelhetjük több, de inkább kevesebb sikerrel. Meglehetôsen vidám dolog, amikor a bediktált néhány szavas mondatból csak a kötôszavak stimmelnek, a többi zagyvalék. A felhasználó személyének itt a szokásosnál nagyobb jelentôsége van, a beszédgyorsaság, artikuláció, hangszín és a többi miatt. Már az installáció alatt megnyílik egy információs ablak, s innen kezdve a beszélô alapértelmezés szerint a telepítô személy lesz. Az ô hangjához állítja be a gyakorlat illetve a felolvasás során a lehetséges paramétereket, hogy minél jobb eredményt érjen el a felismerésben. Természetesen annyira nem irigy a program, hogy csak a telepítôje használhatja, hanem fel lehet venni a felhasználók közé több személyt is, de ezeknek is célszerû végigjárni az iskolát. Ahhoz, hogy ne legyen kétségünk afelôl, hogy a mi hangmintáink alapján dolgozik a rendszer, a képernyôre mindig kiíródó felhasználói név nyújt segítséget.

A telepítô füzetke tanácsa szerint elôször a Dictation Trainer szolgálatait kell igénybe venni. Az elsô szint három egyszerû mondatot tartalmaz, a második szinten 11 bonyolultabb mondat szerepel a korrekciós tanácsokkal. Ugyancsak ajánlott az Enrolment használata, ami megpróbálja javítani a felismerés valószínûségét. Ez kezdetnek 100 mondat rögzítését igényli, de ha az ember netalán erôs magyar akcentussal beszéli a nyelvet, 473 mondat felvétele a szükséges. A képernyô sarkában látható egy kis színes csík, ebbôl tudjuk, hogy megfelelô hangerôvel mondjuk-e a szöveget. Amikor sikerült a mondatot felismernie, automatikusan tovább lép. Ez a tevékenység elég sok idôt igényel, különösen, ha nem ideálisak a körülmények, s nem elég szép a kiejtésünk. Érdekes viszont, hogy arra is van lehetôség, hogy meghallgassuk a felolvasott szöveget, sôt el is tudjuk tárolni.

A program könnyen kezelhetô, világos utasításokat ad, mikor mit nyomjunk meg, mikor beszéljünk és a többi. Ha szükséges, akkor hangszórón keresztül is halljuk, milyen fázisában vagyunk a munkának.

Ha mindezzel készen vagyunk, s családunk, munkatársaink még nem bolondultak meg teljesen, megpróbálkozhatunk a diktálással! A SpeakPad névre hallgató diktáló programot elindítva akár el is kezdhetnénk a munkát, de azért nem eszik annyira forrón a kását! A program készítôi elsô próbálkozásként néhány egyszerû mondatot ajánlanak, ami nyüzsög a hasonló hangzású szavaktól. Bevallom én remekül szórakoztam, de a megjelenô szöveg csak sokadszorra kezdett hasonlítani a diktáltra. A leírtakat természetesen korrigálhatjuk. Kétféle mód is lehetséges: egyszerûen beírjuk a helyes szót, vagy a felkínált lehetôségek közül választunk. Visszahallgathatjuk a szöveget, ha már nem emlékeznénk rá világosan, mit is mondtunk. (Nekem végül néhány egészen egyszerû mondattal kísérletezve, némi korrekció után sikerült eljutni használható irományhoz. Igaz ugyan, hogy nem jártam lelkiismeretesen végig az ajánlott kurzusokat.)

A SpeakPad a Windows Wordjét használja keretprogramként. A menü sora kicsit más, mint a megszokott, valamint találunk benne egy Dictation nevû pontot is. Innen indíthatjuk a hangos tevékenységeket, miután a szövegszerkesztôknél megszokott módon beállítottuk a használni kívánt betûtípust, nagyságot és egyebeket.

Az IBM ViaVoice a kipróbált angol nyelven kívül németül, spanyolul, franciául, olaszul és amerikai angolul tudó gépírókat pótolhat. Nekem kicsit úgy tûnik, hogy komolyabb munkáknál egyenlôre érdemesebb és gyorsabb a billentyûzeten matatni, vagy szakembert alkalmazni, de az eszközök egyre korszerûbbek lesznek, s velük fejlôdhetnek ezek a ma még kicsit nehézkesnek tûnô, de nagy lehetôségeket felcsillantó programok is. Minden bizonnyal nem ez a végsô változata, tökéletesítése biztos jelenleg is folyik. S talán egyszer magyarul is kipróbálhatjuk, ami nyilván szép feladatot ad a hazai fejlesztôknek.

A program által igényelt minimum követelmények

&endash; Win '95 vagy Windows NT 4.0 operációs rendszer

&endash; PC 166 MHz Pentium, vagy annál gyorsabb processzor, illetve a 150 MHz MMX Pentium vagy azzal kompatíbilis, vagy annál gyorsabb.

&endash; 32 MB RAM a Windows '95-höz, 48 MB Windows NT 4.0-hoz

&endash; 90-126 MB hely a merevlemezen

&endash; SoundBlaster 16 vagy IBM Mwave hang kártya

&endash; CD-ROM olvasó

&endash; ha szükséges a laptop illetve a számítógép típusától függôen mikrofon adapter.

Gyôri Erzsébet

 

elôre, hátra, tartalom, honlap