Élet és Tudomány, 1998. évi 22. szám

Számítógépek fejlődési irányai 2.

ANALOGIKAI SZÁMÍTOGÉP

Bizonyos jelenségek számítógépes feldolgozása során olyan számítási feladatokba ütközünk, amelyekben a mai óriásgépek is gyengék, ugyanakkor a természet gazdaságosan és gyorsan megoldja azokat. Néhány ezer idegsejt vagy molekula - mint számítógép - csodákra képes. A számítógép-architektúra természet inspirálta megváltozása sok tudományterületre lesz majd hatással, s a kutatás és megértés módszerét is gazdagíthatja.

A térhallás (sztereoakusztika) lényegét manapság mindenki ismeri: a két fülünkbe érkező hang időkülönbségéből következtetni tudunk a hangforrás irányára. Képünk (1. ábra) vázolja azt az eseményt, amikor egy bagolytól úgy 3 méterre egy egér motoz. A madár két fülétől a távolság különbsége egy-két milliméternyi, következésképp a beérkező hangjelek időkülönbsége 30-60 mikroszekundum. Hogyan képes ilyen kis eltérést értelmezni a bagoly, amikor neuronjai egy nagyságrenddel lassúbbak, több milliszekundumos időtartammal érzékelnek? A megoldást Marc Konishi adta meg 15 éves megfigyelőmunkája alapján.

1. A bagoly a két fülébe érkező hang időkülönbségéből érzékeli a hangforrás irányát

2. Az interaktív cellasorozatban a gerjesztés időkülönbségétől függően eltolódik a markánsan tüzelő cella pozíciója. Ez kódolja az irányt

A rejtély nyitja a CNN számítógép működési elve. A sorba kapcsolt, egymással interaktív viszonyban levő neuronokat a hangjel gerjeszti, és hatáshullámokat indít el a "processzor"-láncban. Az indító hangimpulzusok közötti különbség nagysága befolyásolja az interferenciákat, így a létrejövő állóhullám jellemző lesz a két hullámfolyamat indításának eltérésére, lényegében függetlenül attól, hogy maga a folyamat, az interferenciakép kialakulása mennyi ideig tartott.

Hiperélesség az időben

Ennek az elvnek a kísérleti bizonyítékát láthatjuk a 2. ábrán. Egy egydimenziós CNN modell vázlatát adtuk meg, valamint a hatáshullám-folyamat végkimeneteleit a hangjelek érkezésének három eltérő időkülönbsége esetében. Zérus időkülönbségnél a középső cella (a 8-as) tüzel (a legerősebb az oszcillációja), 30 mikroszekundum időkülönbségnél a mellette lévő (a 7-es), stb. Ily módon ezeket az időkülönbségeket a neuronrendszer a tüzelő cella kialakulásával hely- (pozíció-) kóddá alakítja. A több milliszekundumos lassúságú cellák (neuronok) rendszere ezzel 10-40 mikroszekundum élességgel képes differenciálni. Ez a hiperélesség az időben jelensége.

Egy képtömörítő módszer

A mesterséges képfeldolgozásban egyre bonyolultabb algoritmusokat alkalmazunk, és a képpontok körül egyre nagyobb sugarú tartományban igyekszünk figyelembe venni a hatásokat. A természetes vizuális rendszerben ez épp fordítva van. Kis sugarú, nagyon egyszerű elemzésekből veszünk sokfélét, majd ezeket kombináljuk (a sokképernyős színház elve).

Példának a 3. ábrán egy képtömörítési eljárás eredményét látjuk. A bemondónő képéből azoknak a részeknek a maszkjait állítjuk elő, ahol érdemi változás történik. A képnek csupán ezeket a területeit kell kódolni és továbbküldeni, így sokkal rövidebb kódot kapunk. De ehhez és más, hasonlóan összetett eljárásokhoz a CNN-t tovább kellett fejleszteni.

3. ábra. Egy bemondónő mozgóképének változó és állandó részei

Több mint száz hasznos képfeldolgozó template-et terveztek már. Sok olyan feladat van azonban, amelyben a kapott képek csupán közbülső eredmények, s így ezek a template-ek mint elemi utasítások szerepelnek egy összetett eljárásban. Ilyenkor egy olyan számítógépre volna szükségünk, amelynek az architekturális magja a CNN, de elemi utasításait, a template-eket algoritmikusan, tárolt program részeként lehetne használni.

Celluláris analogikai szuperszámítógép

Ez a CNN univerzális kép (CNN Universal Machine), amelyben keveredik az analóg (folytonos) tér-időbeli dinamika és a diszkrét utasításokkal dolgozó logika. Ezért nevezzük analogikai számítógépnek is. E kettős képesség prototípusa az agyféltekék munkamegosztása.

CNN: Egy négyzetrács valamennyi csúcspontjában egy processzor (cella) van, mindegyik a szomszédaival közvetlenül összekötve. Ez a processzorsereg a celluláris neurális/nemlineáris hálózat, a CNN (Cellular Neural/nonlinear Network). Mindegyik cella hatást kap a környezetétől: visszacsatolás, és hatást küld a környezetének: előrecsatolás (a cella környezetébe saját maga is beleértendő). A hatások erősségeit két mátrix jellemezheti. Ez a hatásmintázat, template (egy küszöbértéket beállító tényezőt hozzávéve) meghatározza a CNN működését, és a cellák interakciójából állapotmintázatok jönnek létre, amelyek - ha a kezdeti feltételek megfelelők voltak - stabilizálódnak.

A CNN és a képfeldolgozás. Feleltessünk meg minden képelemnek (pixelnek) egy processzort/cellát! A cellák bemenetei, állapotai és kimenetei (u, x, y) egy-egy képet kódolnak (a színeket és az árnyalatokat alkalmas kódszámokkal jellemezve). Az egyes template-eknek sajátos képfeldolgozó tulajdonságuk van.

(Ezekről részletesebben szóltunk előző heti cikkünkben.)

A CNN univerzális gép architektúrájához természetesen szükséges egy magas szintű nyelv, egy fordítóprogram*, egy assembler* és interpreter*, valamint egy operációs rendszer. Ezeket mind tartalmazza az MTA SZTAKI-ban kidolgozott CNN Chip Prototyping System (CCPS). E számítógép-architektúrára építve születtek meg Európában, Japánban és az Egyesült Államokban az első kísérleti csip- illetve "Chip set"-implementációk. Az eredmény lényege: trillió vagy ehhez közeli művelet másodpercenként, tárolt programozottam. Ez a számítási teljesítmény mintegy két nagyságrenddel múlja felül a mai szokványos architektúrákat. Hozzá kell azonban tenni: kísérleti példányokról van szó.

"Zajos" szívdobbanások

A CNN univerzális gép nagyon alkalmas mozgóképek feldolgozására. A csevegő bemondónő után befejezésül, egy szó szerint életbevágó alkalmazás. A 4. képen elsőnek egy mozgó felvételnek, egy eleven szívről (pontosabban a bal kamráról) készült ultrahangos echo-elektrokardiogramnak egy kimerevített pillanatképét (a) látjuk. Ebből az informatikai értelemben vett zajtömegből kell kielemezni a mozgó szívrészlet kontúrját. A második képen (b) látható kontúr, illetve a harmadikon a hamisszínes megjelenítés (c) egy komplex analogikai CNN-algoritmus eredménye. Mindezt pillanatképenként kell produkálni, a lehető legnagyobb sűrűséggel. A CNN univerzális csipek nagy sebességével a feladat megoldása a lényegében egyidejűség szintjén adható meg, ami azt jelenti, hogy a vizsgálat vagy a műtét közben folyamatosan megfigyelhetők a kiválasztott mozgó kontúrok.

4. ábra. A bal szívkamra echo-elektrokardiogram felvételén (A) végrehajtott kontúrdetekció eredménye szürke tónusos megjelenítéssel (B) és hamissszínes megjelenítéssel (C)

A CNN univerzális gép kiterjesztett CNN-cellákból áll, amelynek van lokális (saját) analóg és logikai memóriája (LAM és LLM). Van továbbá lokális kommunikációs és vezérlőegysége (LCCU), amellyel a kapcsolatot tartja a "karmesterrel": a globális analogikai programozóegységgel (GAPU). Vannak még lokális logikai és analóg egyszerű műveleti egységei is (LAOU és LLU), amelyek bemenő adataikat a saját memóriaregisztereikből (LAM és LLM) veszik, és oda is teszik vissza az eredményeiket.

A GAPU-nak (a karmesternek), természetesen, tartalmaznia kell:

  • az utasításregisztereket- ezek egyrészt az analóg utasításokat kódoló template-ek regiszterei (APR) és a logikai utasítások regiszterei (LPR) -, valamint
  • a cellafunkciókat váltó kapcsolóállások regiszterét (SCR) és
  • a gépi kódot tartalmazó globális analogikai vezérlőegységet (GACU).

Nagy kísértés a természettudományos és műszaki műveltségű kutató számára, hogy egyes fogalmak elnevezését vagy jelentését általánosítva, saját eredményeitől fellelkesülve olyan területekre téved, és ott általánosít, ahol e fogalmak vagy jelentések nem érvényesek. Főként veszedelmes, mikor az emberre vagy az emberi társadalomra nézve von le naiv, ám magabiztos következtetéseket. Nyilvánvalóan az ismereteknek egészen más kategóriáiba sorolandók olyan fogalmak, mint az emberi méltóság, a szolidaritás elve stb.

Az antropomorfizmus csapdái

Sajnos, a legnagyobb tudósok körében sem ritka ez a csapda, főként ha közéleti szereplést vállalnak. Ilyen félreérthető fogalmak a "neuro"-számítógépek, a mesterséges "intelligencia", a "létért való ádáz küzdelem" stb. A "természet motiválta" szókapcsolattal itt arra akartam utalni, hogy tanulni kívánunk az ismert, és az egyre mélyebb modellekkel mind jobban megismert természettől, és e modellek mesterséges, programozható másolataival szeretnénk hatékonyabb gépeket csinálni - olcsón, megbízhatóan, gyárthatóan.

Reméljük ugyanakkor, hogy újabb modelljeink a természettudományos kutatásokban is hasznosakká válnak. A számítógépmodell például nagyon nagy hatással van az élő tudományokra. Sok esetben egy jelenségnek azt a magyarázatát tartjuk hihetőnek, amely közelít a számítógép-modellhez. (Bár ezzel néha becsapjuk magunkat, ráerőltetve a jelenségre a nem megfelelő számítógép-modellt.) Az élő rendszerek valamely területén (például a látásban), egy adekvátabb modell új lehetőségeket adhat a biológusoknak. Jó példa erre a retinában lévő néhány új effektus felfedezése. Ez egyben vissza is hat a műszaki alkotásokra: ilyen lehetőség a bionikus szemüveg*.

A fenti példák neurobiológiai vonatkozásai nagyrészt ahhoz az együttműködéshez kötődnek, amelyek a Neoromorf információs Technológia elnevezésű doktori programban Hámori József akadémikus kutatócsoportjával közösen folytatunk. Mindkettőnk kutatócsoportjában mérnökök, biológusok, fizikusok, orvosok, matematikusok dolgoznak együtt a természet információfeldolgozó folyamatainak jobb megértésén, és ezek elektronikai megvalósításán. A bemutatott példák egy része is ennek a kutatócsoportnak az eredménye illetve a velük együttműködő orvosoké (Dr. Tahy Ádám és munkatársai).

A számítógépről alkotott fogalom ma széleskörűen motiválja a művelt emberiséget, de antropomorf, ember által birtokolt tulajdonságokkal való felruházása zavarokat kelthet. Egy gazdagabb számítógépfogalom talán nem csak a vágyálmokat erősíti.

ROSKA TAMÁS
akadémikus

KISLEXIKON

Interpreter: a magas szintű nyelveken írt programokat lefordítja gépi kódú utasításokra, egyidejűleg futtatva (léptetve) is a programot. Ez a folyamatos értelmezés lehetővé teszi, hogy bármelyik helyen módosítsunk.

Fordítóprogram: a magas szintű nyelveken írt programokat lefordítja gépi kódú utasításokra, és ezután futtatja le a programot. Így gyorsabb, mint az interpreterrel, de módosítás esetén az egész programot újra kell fordítani.

Assembler: egyszerű, a géppel közvetlenül értelmezhető utasításokat (assembly nyelv) gépi kódra fordítja.

Bionikus szem: a retina CNN jellegű modelljeit egy CNN számítógépcsipen akár programozottan megvalósító eszköz. Direkt fényérzékelőket tartalmaz, minden kis processzorban egyet.

Bionikus szemüveg: a bionikus szem-csipet felhasználva képes olyan analogikai programok lefuttatására, melyek lehetővé teszik jellegzetes alakzatok, tárgyak, feliratok, arcok felismerését és jelzését (akár beszéddel is).


Források

L. 0. Chua and L. Yang, "Cellular neural networks: Theory", IEEE Transactions on Circuits and Systems, Vol. 35, pp. 1257-1272, 1988

T. Roska and L. 0. Chua, "The CNN Universal Machine: An analogic array computer", IEEE Transactions on Circuits and Systems-II, Vol. 40, pp. 163-173, March 1993

F. Werblin, T. Roska, and L.O. Chua, "The analogic cellular neural network as a Bionic Eye", International J. Circuit Theory and Applications, Vol. 23, pp. 541-569, 1995

K. Lotz, L. Bölöni, T. Roska, J. Hámori, "A cellular neural network model of the time-coding pathway of sound localization - hyperacuity in time", In: Proceedings IEEE ICNN-96, Washington, DC, Vol. 2, pp. 670-675, 1996

Cs. Rekeczky, Y. Nishio, A. Ushida, T. Roska, Á. Tahy, "Image Segmentation by Soft Computing on the CNN Universal Machine -A Case Study of Echocardiography", In: Proceedings NOLTA-96, Kochi, Japan, pp. 213- 216, 1996