Arbori sistolici binari - PDF Free Download

1 Universitatea Tehnică Gh. Asachi Iaşi Facultatea de Automatică şi Calculatoare Şcoala de Studii Doctorale Arbori sistolici binari O. Brudaru aprilie 2006 Raport tehnic nr. 4/2006 Universitatea Tehnică Gh. Asachi Iaşi Facultatea de Automatică şi Calculatoare Şcoala de Studii Doctorale Bulevardul Dimitrie Mangeron nr. 53 A, Iaşi, cod 700050

CUPRINS 1. Structura sistolică arborescentă 1 2. Comenzile de bază 2 INSERT 3 MEMBER 4 DELETE 5 3. Dicţionar VLSI bazat pe L-arbori 6 3.1. Maşini de tip dicţionar 6 3.1.1. Cerinţe şi performanţe 6 3.1.2. Soluţii existente de dicţionare VLSI 7 Reţea liniară de celule 7 Dicţionarul Leiserson 7 Dicţionarul Ottmann 8 Dicţionarul Somani & Agarawa 9 Dicţionar pe grilă sistolică 10 3.2. L-arbori 11 3.2.1. Coadă sistolică cu priorităţi 11 3.2.2. Cuplarea cozii cu un arbore 13 Bibliografie

1 Arbori sistolici În acest capitol este prezentat modul de implementare a unui arbore binar într-o structură sistolică şi sunt explicate operaţiile de bază pe care trebuie să le execute o asemenea structură. 1. Structura sistolică arborescentă Pentru unele probleme de căutare, conectarea arborescentă a elementelor de procesare este mai avantajoasă decât conectarea într-o structură liniară. În continuare se va presupune că fiecare celulă plasată într-un nod terminal al unui arbore sistolic binar poate reţine o cheie. Dacă numărul de niveluri din k arbore este k atunci numărul de vârfuri terminale este N = 2. Structura arborescentă ilustrată în fig. 1 poate fi văzută ca fiind formată din două straturi. in out Fig. 1. Structură de procesare arborescentă pentru 3 N = 2 Primul strat grupează elementele ce asigură propagarea comenzilor şi a fluxurilor de date de la rădăcină către nodurile terminale care corespund elementelor de procesare propriu-zisă. Al doilea strat are rolul de a combina informaţiile şi de a propaga rezultatele către rădăcina arborelui. Elementele 3 trasate în fig. 1 (pentru N = 2 ) cu linie continuă, formează primul strat şi realizează duplicarea mesajelor în tactul de procesare respectiv, în timp ce elementele trasate cu linie întreruptă constituie al doilea strat şi realizează o anumită funcţie depinzând de cele două intrări alimentate de nivelul inferior în scopul sintezei şi trimiterii rezultatului în sus.

Un mod de a implementa fizic un circuit arborescent este sub forma de H- arbore este ilustrat în fig. 2. rãdãcinã Fig. 2. Plasarea pe un cip sub formă de H-arbore pentru N = 2 Arborele sistolic are ca atribut principal faptul că poate realiza emisia datelor (fan-out) către toate elementele de procesare cât şi colectarea lor (fan-in), presupunând că pe durata fiecărui tact toate procesoarele sunt active. În continuare se va presupune că procesoarele funcţionează în mod pipeline, adică fronturile de activitate se deplasează în jos prin nodurile marcate cu linie continuă şi respectiv în sus prin cele trasate cu linie discontinuă. Fiecare front corespunde unei comenzi care se adresează unui întreg nivel din arbore, adică procesoarele de pe aceeaşi linie orizontală execută aceeaşi comandă. Structura arborescentă este capabilă să execute orice comandă din setul permis de comenzi în O(logN) timp şi cu o perioadă constantă dacă numărul de elemente nu depăşeşte pe N. 4 2. Comenzile de bază Să examinăm modul în care un arbore sistolic implementează un dicţionar simplu, adică execută comenzile MEMBER/INSERT/DELETE asupra unei mulţimi de cel mult N elemente. Se va presupune că nu se admit copii ale cheilor în arborele sistolic, aşadar nu se va face o tentativă de a insera o cheie deja prezentă în arbore. Valorile sunt păstrate în celulele conectate cu nodurile terminale.

Arbori sistolici O. Brudaru 3 2.1.Comanda INSERT Pentru implementarea comenzii INSERT(k), căutarea unui registru liber se face prin includerea în fiecare nod de pe primul strat a unui contor care ţine evidenţa numărului de regiştri liberi din subarborele cu rădăcina în acel nod. Comanda de inserare este dirijată către un subarbore al cărui contor este nenul. Contoarele de pe drumul de deplasare a comenzii INSERT(k) sunt decrementate cu 1. tact: t=0 t=1 ins 7 4 2 2 ins 7 ins 3 3 2 2 1 1 1 1 1 1 1 1 tact: ins 3 ins 7 ins 5 t=2 2 1 2 1 1 1 1 ins 5 ins 3 0 1 1 1 7 ins 7 t=3 1 0 2 tact: t=4 t=5 ins 5 1 0 1 0 0 1 1 7 3 1 0 1 0 0 0 1 7 3 5 ins 3 Fig. 3. Trei comenzi de inserare consecutive ins 5

Când se întâlneşte un registru liber întru-un element de procesare de pe ultimul nivel, atunci k este memorat în acel registru (presupunem că acest lucru este asigurat prin faptul că adăugarea unei noi chei se face în limita capacităţii de memorare care este de N valori). Dacă există doi subarbori pentru care contoarele asociate rădăcinilor acestora sunt nenule, atunci se va alege doar unul pentru a evita inserarea multiplă a lui k. Este evident că operaţia de inserare cere O(logN) timp şi are perioadă constantă. Un exemplu de funcţionare a comenzii INSERT este arătat în fig. 3 pentru N = 4. 2.2.Comanda MEMBER Implementarea comenzii MEMBER se face trimiţând comanda MEMBER(k) către toate elementele de procesare. Fiecare element va răspunde afirmativ sau negativ după cum k este egal cu conţinutul registrului din acel element de procesare. Propagarea comenzii se face prin primul strat. Al doilea strat colectează răspunsurile realizând operaţia sau logic asupra intrărilor primite de la nivelul imediat inferior. În final, prin rădăcină se extrage disjuncţia logică a tuturor răspunsurilor. Timpul de răspuns este O(logN), egal cu timpul necesar propagării răspunsurilor de la elementele de pe nivelul terminal până la rădăcină. Datorită modului de lucru pipeline perioada este constantă. În fig. 4 este ilustrată acţiunea comenzii MEMBER(7), pe arborele binar aflat în starea finală din fig. 3. Comenzile INSERT şi MEMBER pot fi urmate după un tact de orice alta comanandă din cele trei. Din păcate, comanda INSERT nu poate fi lansată după DELETE înainte ca DELETE să fi terminat actualizarea contorilor de pe drumul menţionat anterior, adica mai devreme de 2 log 2 N tacte. Intr-adevăr, o astfel de problemă apare atunci când DELETE urmează să steargă un element când în arbore sunt exact N elemente. În acest caz, o comanda INSERT lansată mai devreme ca efecul lui DELETE să se fi propagat complet, adică să fi atins şi rădăcina în deplasarea pe al doilea strat, nu găseşte un loc liber chiar dacă un astfel de loc urmează a fi creat sau s-a creat deja.

Arbori sistolici O. Brudaru 5 tact: t=6 7? 1 0 1 0 0 0 1 7 3 5 t=7 1 0 7? 7? 1 0 0 0 1 7 3 5 7? tact: t=8 t=9 1 0 7? 7? 1 0 0 0 1 7 3 5 1 0 0 0 7? 7 3 5 tact: t=10 t=11 1 rãspuns 1 0 7 3 5 7 3 5 Fig. 4. Acţiunea comenzii MEMBER(7). 2.3.Comanda DELETE Execuţia unei comenzi DELETE(k) reclamă ştergerea valorii k urmată de actualizarea contorilor asociaţi nodurilor de pe unicul drum de la rădăcina arborelui la nodul al cărui registru îl conţine pe k (am presupus că valoarea k există în arbore). Acest lucru se poate face doar după localizarea acelui nod terminal corespunzător procesorului ce conţine pe k, în cadrul procesării ce se realizează în cel de al doilea strat. Timpul de răspuns este O(logN). Printr-un anumit amendament precizat în cele ce urmează, intervalul de timp intre două

lansări consecutive de comenzi identice sau diferite poate fi făcut constant. În consecinţă putem formula următorul rezultat: Propoziţia 1. Un arbore sistolic de mărime N poate executa comenzile MEMBER/INSERT/ DELETE cu un timp de răspuns O (log N) şi perioada constantă dacă numărul de elemente din mulţimea de chei nu depăşeşte N, în ipoteza că INSERT adaugă întotdeauna o cheie nouă iar DELETE elimină o valoare existentă în arbore. 3. Dicţionar VLSI bazat pe L-arbori 3.1. Maşini de tip dicţionar Fie S o mulţime ordonată de chei { k 1, k 2,..., k N } şi R = { r1, r2,..., rn } mulţimea de înregistrări. Un dicţionar este definit în mod formal ca o submulţime F a lui S R, unde dacă ( ki, ri ) F atunci r i este înregistrarea asociată cheii k i în F. 3.1.1. Cerinţe şi performanţe Mulţimea uzuală de instrucţiuni care sunt tratate de o maşină dicţionar este formată din: INSERT(k,r) inserează/actualizează înregistrarea asociată cheii k. DELETE(k) şterge din dicţionar înregistrarea şi cheia k şi ănregistrarea asociată. UPDATE(k,r)- modifică înregistrarea de cheie k. SEARCH(k) caută înregistrarea de cheie k. XMIN returnează înregistrarea asociată valorii minime a cheii. XMAX returnează înregistrarea asociată valorii maxime a cheii. NEAR(k) returnează înregistrarea pentru care valoarea cheii este cea mai apropiată de k.. COMPRESS(k) mută perechile (k,r) pentru care k >k către poziţiile ocupate de perechile precedente. NOP instrucţiunea nu realizează nimic (No Operation) şi este folosită pentru temporizarea instrucţiunilor. Acest set de instrucţiuni poate fi extins cu diverse variante de implementare. Astfel, o instrucţiune INSERT redundantă, adică pentru care valoarea cheii este deja prezentă în dicţionare, poate fi tratată ca o actualizare sau poate fi ignorată. De asemenea, instrucţiunile SEARCH, XMIN, XMAX, NEAR care returnează o înregistrare corespunzătoare valorii de interogare a cheii pot fi

Arbori sistolici O. Brudaru 7 implementate distructiv, ştergând înregistrările respective din dicţionar sau nedistructiv, păstrându-le intacte. Pe de altă parte, comenzi, cum ar fi PRED (k) şi SUCC (k) se pot obţine din instrucţiunea de bază NEAR prin specificaţii suplimentare. Performanţele unei maşini dicţionar se referă la următoarele: timpul de răspuns în tratarea unei comenzi; perioada de tratare a comenzilor cu excepţia instrucţiunilor COMPRESS şi NOP; capacitatea maşinii definită de numărul maxim N de elemente ce pot fi memorate în dicţionar şi numărul n de elemente prezente la un moment dat în structură; debitul definit ca numărul de comenzi executate în unitatea de timp. 3.1.2. Soluţii existente de dicţionare VLSI În continuare sunt trecute în revistă câteva soluţii remarcabile de dicţionare adecvate pentru implementarea VLSI. Reţea liniară de celule. O astfel de structură corespunde listei înlănţuite [Knu76]. fiecare celulă conţine valoarea cheii şi înregistrarea sau adresa acesteia. Conţinutul celulelor este sortat crescător după valorile cheii (v. fig. 1). Comenzile se deplasează în acelaşi sens. (k 1,r 1 ) (k 2,r 2 )... (k n,r n ) Fig. 5. Reţea liniară de tip listă înlănţuită Celulele sunt foarte simple, perioada este de un tact, toate comenzile pot fi executate inclusiv variantele lor redundante dar, din păcate, timpul de răspuns O (n) limitează drastic performanţa structurii pentru valori mari ale lui n. Dicţionarul Leiserson. În soluţia propusă în [Lei79], elementele de procesare sunt plasate pe nodurile terminale şi valorile cheilor sunt memorate în aceste elemente în ordine crescătoare. Arborele este folosit pentru emisia comenzilor, o comandă atingând simultan toate elementele de procesare (v. fig.6).

I/O (k 1,r 1 ) (k 2,r 2 ) (k 3,r 3 ) (k n,r n ) Fig. 6. Dicţionarul Leiserson Maşina poate executa comenzile INSERT(k,r), DELETE(k), SEARCH(k), Xmin. O instrucţiune INSERT(k,r) redundantă provoacă deplasarea către dreapta a conţinutului celulelor cu chei superioare lui k şi dacă astfel de instrucţiuni redundante sunt numeroase, performanţele structurii se degradează. De asemenea, DELETE(k) în varianta redundantă alterează înregistrarea având cheia imediat deasupra lui k. Deşi este destul de simplă şi are perioada egală cu unu, maşina nu suportă instrucţiuni redundante, timpul de răspuns este O (log N) şi pentru a păstra N itemi reţeaua are nevoie de 2N 1 celule. Dicţionarele Ottmann. În [ORS81] sunt prezentate două îmbunătăţiri ale dicţionarului lui Leiserson, prima referitoare la tratarea instrucţiunilor redundante iar a doua reducând timpul de răspuns. Faţă de maşina [Lei79], este introdusă comanda COMPRESS cu scopul de a gestiona golurile generate de instrucţiunile redundante INSERT(k,r), DELETE(k,r). Timpul de răspuns este O (log N) deşi maşina poate conţine puţine chei la un moment dat (adică n este mic) iar perioada este egală cu 3 pentru că fiecare instrucţiune DELETE trebuie urmată de două instrucţiuni COMPRESS. S 1 S 3 S2 S 4 S 5 S 6 S 7 S 15 S 14 S 13 S 12 S 11 S 10 S 9 S 8 Fig. 7. Arborele-X Această soluţie a suportat încă o ameliorare prin transformarea structurii de arbore binar într-un arbore-x, adică un arbore în care nodurile de pe acelaşi nivel (nu doar de pe cel terminal!) sunt conectate liniar (v. fig. 7).

Arbori sistolici O. Brudaru 9 În noua structură în toate celulele se memorează intrări ( k, r). Celulele posedă două feluri de conexiuni şi anume cele corespunzătoare arborelui binar utilizate pentru emisia instrucţiunilor şi cele pentru comunicaţiile între celulele aceluiaşi nivel, trasate în fig. 7 respectiv cu linii subţiri şi linii groase. Instrucţiunile sunt executate de toate celulele de pe un nivel dat pe durata aceluiaşi tact. Deoarece sunt plasate date şi în nodurile de pe nivelurile intermediare, dacă răspunsul ar fi trimis imediat înapoi către rădăcină, există riscul ca răspunsul la o comandă dat de o celulă de pe un nivel situat mai aproape de rădăcină să ajungă la rădăcină înaintea răspunsului la o comandă anterioară dat de la un nivel mai profund, ceea ce ar putea conduce la asocieri eronate de răspunsuri la comenzi. Soluţia utilizată în [ORS81] constă în transmiterea răspunsului către nodurile terminale, utilizând conceptul de frontieră efectivă care este formată din nodurile care sunt fie terminale, fie au ca descendenţi noduri fără înregistrări asociate (vide) fie descendenţii părintelui nu sunt noduri vide. Frontiera efectivă îşi schimbă configuraţia în timpul exploatării dicţionarului dar în orice moment ea cuprinde cel mult două niveluri succesive aşa cum este arătat în fig. 8 în care etichetele k marchează o cheie diferită de +. Frontiera efectivă joacă rolul de reflector al răspunsurilor venite de la nivelurile de deasupra. În timpul deplasării de la frontiera efectivă către rădăcină aceste răspunsuri sunt agregate pentru a forma răspunsul final la comanda respectivă. Cum răspunsurile reflectate pot proveni din noduri aflate pe straturi adiacente într-un acelaşi subarbore, rezultă că răspunsurile care trebuie agregate pot sosi într-un nod cu un decalaj de un tact. Aşadar agregării pe un nivel trebuie să i se rezerve două tacte. Datorită unor cerinţe referitoare la corecta funcţionare a instrucţiunilor de actualizare, inserare şi de eliminare a golurilor, perioada dicţionarului este de 9 tacte. Timpul de răspuns este O (log n). Dicţionarul poate procesa comenzile redundante, instrucţiunile nu au complexitate ridicată, dar structura necesită 2 N celule de memorie pentru a asigura o capacitate de N chei şi o gestiune corectă a golurilor. k frontiera efectivã k k k k k k oo oo oo oo oo k k k oo oo oo oo oo oo oo oo oo oo oo oo oo oo oo oo Fig. 8. Exemplu de frontieră efectivă a arborelui Dicţionarul Somani & Agarawa. Structura propusă în [SA85] se bazează pe un arbore binar dar elementele sunt memorate fără a fi ordonate iar frontiera efectivă este pe un singur nivel al arborelui. Un nod în arborele binar execută

instrucţiuni dar el poate şi modifica instrucţiunile pe care le transmite mai departe. Arborele dispune de un mecanism de echilibrare astfel că pentru fiecare nod subarborele stâng conţine aproape acelaşi număr de chei ca subarborele din dreapta. Instrucţiunile se propagă de la rădăcină către nivelul terminal. Un nod generează pentru descendenţii lui două copii, eventual modificate, ale instrucţiunii primite. După execuţia instrucţiunilor pe ultimul nivel, instrucţiunile sunt trimise înapoi către rădăcină, fiecare nod primind două instrucţiuni de la descendenţi, combinându-le într-o singură instrucţiune pe care o transmite mai departe în sus. Inserările redundante se fac prin inserarea noii înregistrări şi ştergerea celei vechi. Timpul de răspuns este O (log n). Capacitatea de N intrări este asigurată cu N celule de memorare, dar complexitatea unei celule de procesare este superioară celei din arborele binar din [Lei79]. Dicţionar pe grilă sistolică. În [SS85] este propusă o arhitectură cu o topologie neuzuală pentru un dicţionar, soluţia adoptată fiind justificată prin necesitatea ca celulele vecine funcţional să fie vecine şi fizic (v. fig. 9). Conexiunile îngroşate sunt pentru transmisia datelor în timp ce cele subţiri sunt pentru transmisia comenzilor şi pentru rezultate. Reţeaua are N intrări şi N ieşiri. Răspunsul apare pe ultima linie după N tacte. La o suprafaţa ocupată de O (N) complexitatea conexiunilor este inferioară soluţiilor bazate pe arbori. Intrările trebuie să primească aceeaşi comandă la un moment dat, iar ieşirile trebuie agregate cu un circuit suplimentar. Într-un modul VLSI în care timpii de propagare depind de lungimea conexiunilor, modelul este superior structurilor bazate pe arbori. S 1 S 2 S 3 S 4 S 8 S 7 S 6 S 5 S 9 S 10 S 11 S 12 S 16 S 15 S 14 S 13 Fig. 9. Reţea sistolică rectangulară pentru dicţionar Alte soluţii de dicţionare VLSI sunt discutate în [Gas93].

Arbori sistolici O. Brudaru 11 3.2. L-arbori 3.2.1. Coadă sistolică cu priorităţi O coadă sistolică cu priorităţi este o structură care execută operaţiile de inserare, extragere a valorii minime şi ştergerea unei valori date, respectiv comenzile INSERT/XMIN/DELETE, asupra unei mulţimi cu cel mult N elemente. Masivul este compus din N celule conectate liniar cu portul de intrare-ieşire al primei celule din stânga conectat la calculatorul gazdă ca în fig. 10. Fiecare celulă are doi regiştri, A şi B, fiecare registru putând memora un element din setul de intrare. Dacă un registru nu conţine nici o valoare, atunci considerăm că este încărcat cu, acest element desemnând o valoare mai mare decât oricare valoare posibilă din setul de date de intrare. Inaintea începerii funcţionării cozii, regiştrii de tip A şi B din toate celulele sunt încărcaţi cu. Scopul acestei structuri sistolice este de a menţine setul de n N valori în ordine crescătoare, cu toate valorile încărcate în regiştrii A situaţi în primele n celule din masiv. Regiştrii B sunt utilizaţi pentru transmiterea valorilor recent introduse şi plasarea acestora în poziţia corespunzătoare din şirul ordonat. Când o valoare ajunge în poziţia corectă ea înlocuieşte valoarea aflată în registrul A. Valoarea care a fost în A este transmisă spre celula imediat următoare din dreapta. Astfel, orice înserare provoacă o deplasare din aproape în aproape spre dreapta a tuturor elementelor. Sistemul va fi controlat astfel încât dacă o celulă este activă atunci celulele vecine sunt inactive. gazda A H A 1 A 2 A 3 A 4 A 5 B H B 1 B 2 B 3 B 4 B 5 Fig. 10. Tabloul sistolic ce implementează o coadă cu priorităţi O celulă va compara conţinutul registrului A propriu cu cel al registrului A al celulei din stânga. În acest moment, datorită temporizării, celula vecină din stânga este inactivă, deci conţinutul registrului A este stabilizat şi poate fi consultat. Gazda joacă rolul unui vecin din stânga ori de câte ori prima celulă este activă, iar în rest trimite sau primeşte valori spre şi dinspre prima celulă. De îndată ce valoarea înserată a fost mutată în celula următoare într-un pas, după încă un pas, se poate lansa o nouă comandă de inserare, deoarece prima celulă va fi disponibilă. Să notăm cu A L şi B L valorile regiştrilor celulei din stânga celei curente. Această pereche de celule este arătată în fig. 11. Celula curentă execută pe parcursul tactului activ t următoarele operaţii:

1. copiază conţinutul lui B L în B ; 2. rearanjează valorile din A L, A şi B astfel încât A L A B A L A celula inactiva B L B celula activa curenta Fig. 11. Celula curentă şi celula vecină din stânga Conexiunile între două celule vecine asigură transmiterea către dreapta a valorilor regiştrilor A L şi B L şi actualizarea conţinutului registrului A L după ordonarea din pasul 2. Se constată că valoarea din registrul B L se deplasează către dreapta când locul acestei valori nu este în celula din stânga celei curente şi ajunge în registrul A L al aceleiaşi celule dacă era în poziţia corectă. Remarcăm faptul că operaţia de copiere a registrului B L în registrul B se face astfel încât valoarea din registrul B L să nu fie distrusă. Dacă A L conţine valoarea, valoare care poate fi plasată în acest registru în vederea realizării unei comenzi XMIN, valorile din dreapta vor fi mutate cu o celulă spre stânga. Gazda, care după cum s-a menţionat joacă rolul vecinului din stânga pentru prima celulă, are şi ea doi regiştri A H şi B H, care au funcţia omonimilor lor plasaţi în celule şi sunt folosiţi pentru a asigura corecta funcţionare a primei celule. Operarea cu aceşti regiştri ai gazdei se face în funcţie de tipul de comandă lansată de gazdă, după cum urmează: 1. Pentru inserarea unei valori k, registrul A H este încărcat cu iar registrul BH este încărcat cu valoarea k. Această valorizare asigură mutarea lui k spre unul din regiştrii primei celule din coadă, atunci când, în tactul următor, aceasta devine activă. 2. Pentru extragerea minimului, ambii regiştri A H şi B H ai gazdei sunt încărcaţi cu. În următorul ciclu activ cea mai mică valoare se va fi mutat în registrul A H şi va putea fi extrasă de gazdă. Prima celulă va avea acum în registrul A 1, iar acest registru va fi încărcat în următorul pas cu o valoare sosită din dreapta. Pe durata tactelor următoare, valorile vor migra către dreapta şi se vor plasa după ultima celulă ce conţine date din setul de intrare. 3. Când gazda este inactivă, adică nu lansează comenzi către masivul sistolic, conţinutul lui A H este menţinut pe iar cel al lui B H pe valoarea. Celulele din tabloul sistolic îşi continuă activitatea curentă chiar dacă gazda nu emite noi comenzi spre prima celulă.

Arbori sistolici O. Brudaru 13 Conform punctului (2), operaţia XMIN se face încărcând regiştrii A H şi BH ai gazdei cu. Ca efect, prima celulă care se activează după exact un tact şi în care este întotdeauna valoarea minimă, transmite conţinutul registrului A1 spre stânga, către gazdă în registrul A H. Minimul extras dispare astfel din coadă. Dipariţia minimului duce la apariţia unui "gol" identificat prin faptul că în celula respectivă ambii regiştri conţin. Acest "gol" se deplasează la dreapta, câte o celulă pe tact, celulele care conţin efectiv date, compactânduse. Este de menţionat faptul că sistemul nu este prevăzut cu un mecanism de semnalizare a umplerii cozii aşa că introducerea unui număr de elemente mai mare decât lungimea cozii duce la pierderea acelor valori care depaşesc dimensiunea cozii. Operaţia DELETE se poate realiza printr-un semnal de control special care este trimis în prima celulă sistolică împreună cu elementul ce trebuie scos din coadă. Pentru a căuta şi şterge valoarea respectivă, acest semnal de ştergere însoţit de valoarea ce trebuie eliminată, se propagă de la stânga la dreapta prin toate celulele. Fiecare celulă care primeşte semnalul de ştergere, compară valoarea din registrul A cu valoarea ce trebuie ştearsă şi în caz de egalitate crează un gol încărcându-şi regiştrii proprii cu. Dacă valoarea ce trebuie ştearsă este diferită de cea din registrul A al celulei atinse de ştergere, atunci celula acţionează ca în lipsa semnalului de control ce indică ştergerea. În ambele cazuri, semnalul de ştergere şi valoarea de şters sunt transmise către celula din dreapta, eliminâdu-se astfel toate apariţiile cheii ce trebuie şterse. Toate valorile din dreapta celei şterse sunt mutate cu o celulă către stânga. Transferul golului se realizează prin câte o celulă pe tact şi orice altă comandă ce urmează celei de ştergere (care vine din stânga) nu poate întâlni golul creat de ştergere căci acesta se mişcă cu aceeaşi viteză către dreapta cu cel puţin un pas înaintea unei astfel de comenzi. Astfel, pentru instrucţiunile sosite de la gazdă ulterior operaţiei de ştergere, este asigurată integritatea secvenţei de valori din coadă. În concluzie, următoarea afirmaţie este adevărată: Propoziţia 1. În ipotezele de mai sus, tabloul sistolic liniar cu N celule poate executa fiecare dintre comenzile INSERT/XMIN/DELETE cu timp de răspuns constant, dacă numărul de valori introduse nu depăşeşte pe N. Ca o consecinţă, masivul sistolic liniar descris mai sus poate sorta în O(n) timp o secvenţă de n valori. După introducerea celor n valori în coadă, secvenţa ordonată crescător se extrage cu n comenzi XMIN succesive. 3.2.2. Cuplarea cozii cu un arbore În continuare se consideră o combinaţie între un arbore şi un tablou liniar, numită L-arbore, în care între procesoarele de pe ultimul nivel din arbore

există şi conexiuni orizontale, pe lângă conectarea lor de către arborele binar, conform exemplului din fig. 12. Celula din extremitatea stângă a structurii liniare poate realiza operaţii de intrare-ieşire. Structura de L-arbore combină avantajul emisiei instrucţiunilor într-un arbore cu posibilitatea masivului liniar de a face transferuri de date între celulele vecine. Se presupune, ca şi până acum, că elementele de pe acelaşi nivel sunt activate simultan şi un nivel este activat doar după ce toate elementele de pe nivelul anterior şi-au executat complet sarcinile de calcul. În continuare, structura de L-arbore este folosită pentru a implementa o structură de dicţionar extins pe care să se execute comenzile MEMBER / INSERT / DELETE / XMIN. În ipoteza că structura de L-arbore trebuie să realizeze o coadă cu priorităţi şi trebuie să asigure facilitatea suplimentară de a avea un timp de răspuns mic pentru comanda MEMBER, cea mai convenabilă combinaţie funcţională este să se folosească substructura de tip arbore pentru comanda MEMBER, iar structura de masiv liniar pentru celelalte comenzi. in out gazda A g B g A 1 A 2 A 3 A 4 A 5 A 6 A 7 A 8 B 1 B 2 B 3 B 4 B 5 B 6 B 7 B 8 Fig. 12. L-arbore cu 8 noduri terminale conectate liniar Folosirea arborelui şi pentru comanda DELETE poate cere o întârziere în emisia primei comenezi XMIN, deoarece poate fi vizat pentru ştergere un element din coadă care ar putea ajunge la cea mai din stănga celulă din coadă şi deci furnizat ca rezultat pentru XMIN, înainte ca DELETE să ajungă pe ultimul nivel pentru a-l şterge. O comandă INSERT lansată prin arbore ridică aceleaşi probleme dacă trebuie urmată imediat de o comandă XMIN. Pe de altă parte, o comandă MEMBER lansată prea devreme după o comandă DELETE, poate da un răspuns eronat dacă ambele comenzi se adresează aceleişi chei pentru că MEMBER poate atinge procesorul în care este cheia înaintea comenzii DELETE. Comanda MEMBER este executată în L-arbore exact ca în cazul arborelui. Procesoarele conectate în masivul liniar îşi deplasează cheile pe care le deţin

Arbori sistolici O. Brudaru 15 la dreapta sau la stânga, atunci când primesc o comandă INSERT respectiv o comandă DELETE sau MIN. Fiecare procesor decide sensul în care se face deplasarea cheilor comparând valoarea cheii k din comanda INSERT(k) sau DELETE(k) cu cea păstrată în registrul A propriu şi cea din registrul A al procesorului din stânga. Cu o temporizare adecvată, structura de L-arbore poate menţine toate cheile într-o zonă continuă aliniată la stânga masivului liniar. Un L-arbore cu N procesoare conectate liniar execută comenzile MEMBER / INSERT / DELETE / XMIN cu O (log N) timp de răspuns şi cu perioadă constantă dacă numărul de elemente memorate este mai mic sau egal cu N, presupunându-se că o comandă INSERT inserează o cheie nouă sau DELETE elimină o cheie existentă. Operaţia de inserare/ştergere a unei chei existente/inexistente în structură este numită redundanţă. O inserare redundantă face ca procesoarele să-şi deplaseze cheile la dreapta când de fapt acest lucru nu trebuie făcut. Pe de altă parte, o ştergere redundantă provoacă o deplasare la stânga provocând pierderea celei mai mici chei care depăşeşte valoarea ce trebuie ştearsă. Aceste probleme ar putea fi evitate dacă se admite că în masivul liniar să existe goluri adică unele procesoare aflate în stânga masivului să nu conţină valori, altfel spus secvenţa de chei să nu fie continuă. În acest caz, o comandă INSERT redundantă va fi acceptată şi cheia va colapsa cu valoarea deja existentă având ca rezultat crearea sau extinderea unui gol. Comanda DELETE va şterge pur şi simplu valoarea indicată cu acelaşi de apariţie/extindere a unui gol. Numărul mare de goluri ar putea însă mări timpul de răspuns al comenzilor XMIN. În continuare, un gol aflat în orice poziţie de la stânga ultimei chei păstrate în masivul liniar este notat cu *, iar un gol aflat în dreapta ultimei chei se marchează cu. Să presupunem că pe tot parcursul activităţii L-arborelui (i) primul procesor din masivul liniar nu este marcat cu * şi că (ii) pentru orice procesor marcat cu *, vecinul din dreapta nu este etichetat cu *. În esenţă, o inserare redundantă duce la marcarea cu * a două procesoare consecutiv (cele care păstrează cele două valori egale). O ştergere obişnuită (neredundantă) marchează cu * procesorul corespunzător cheii şterse. Fie comanda auxiliară COMPRESS care are ca efect ca un procesor să îşi deplaseze cheia către stânga dacă vecinul din stânga este marcat cu *. Pentru a păstra condiţiile (i)-(ii), procesorul aflat la dreapta locaţiei asupra căreia se presupune că s-a executat o actualizare/schimbare, va fi suficient să execute una sau două comenzi COMPRESS după ce a fost executată o comandă INSERT, respectiv DELETE. Comanda XMIN va furniza în mod corect cea mai mică cheie potrivită condiţiei (i) dar deplasarea la stânga a tuturor cheilor ar putea să păstreze marcajul * al primului procesor. Dar deoarece caracteristica (ii) se păstrează

când se face deplasare la stânga, rezultă că al doilea procesor nu este marcat cu *. Aşadar, (i) se păstrează dacă XMIN este urmată întotdeauna de comanda COMPRESS. Din condiţiile (i) şi (ii) rezultă că cel mult jumătate dintre procesoare sunt marcate la un moment dat cu * şi atunci capacitatea efectivă a masivului liniar este redusă la jumătate. Aşadar, un L-arbore de mărime N execută comenzile MEMBER / INSERT / DELETE / XMIN cu O (log N) timp de răspuns şi perioadă constantă dacă numărul de chei păstrate nu depăşeşte N / 2, inserţiile şi ştergerile redundante fiind permise. Bibliografie [Gas93] Gastaldo, M., Contribution à l algorithmique parallèle des structures de données et des structures discrètes: machines dictionnaire et algorithmes pour les graphes, ENLS, LIP-IMAG, 291/93, 1993. [Knu76] Knuth, D. E., The Art of Computer Programming - Seminumerical Algorithms, vol. 3. Sorting and Searching, Editura Tehnica, Bucuresti, 1976 (in Romanian). [Lei79] Leiserson, C.E., Systolic priority queues, Rep. CMU-CS-79-115, Dept. Comp. Sci, Carnegie-Mellon University, 1979. [ORS81] Ottman, Th., Rosenberg, A.L., Stockmeyer, L.J., A dictionary machine for VLSI, Rep. RC9060 39615, IBM TJ Watson Research Cntr., Zorktown, NY, 1981. [SS85] Schmeck, H., Schroeder, H., Dictionary machine for different models of VLSI, IEEE Trans. on Computers, C-34 (5), pp.472-475, 1985.