FILTRAREA NELINIARĂ BAZATĂ PE ORDONARE

Similar documents
Structura și Organizarea Calculatoarelor. Titular: BĂRBULESCU Lucian-Florentin

Procesarea Imaginilor

ISBN-13:

Reflexia şi refracţia luminii. Aplicaţii. Valerica Baban

Semnale şi sisteme. Facultatea de Electronică şi Telecomunicaţii Departamentul de Comunicaţii (TC)

Titlul lucrării propuse pentru participarea la concursul pe tema securității informatice

Metrici LPR interfatare cu Barix Barionet 50 -

Modalitǎţi de clasificare a datelor cantitative

Subiecte Clasa a VI-a

ARBORI AVL. (denumiti dupa Adelson-Velskii si Landis, 1962)

D în această ordine a.î. AB 4 cm, AC 10 cm, BD 15cm

10. Modelarea şi eliminarea zgomotelor din imaginile digitale

Reţele Neuronale Artificiale în MATLAB

GHID DE TERMENI MEDIA

Textul si imaginile din acest document sunt licentiate. Codul sursa din acest document este licentiat. Attribution-NonCommercial-NoDerivs CC BY-NC-ND

MS POWER POINT. s.l.dr.ing.ciprian-bogdan Chirila

2. Setări configurare acces la o cameră web conectată într-un router ZTE H218N sau H298N

Metoda BACKTRACKING. prof. Jiduc Gabriel

Dispozitive Electronice şi Electronică Analogică Suport curs 02 Metode de analiză a circuitelor electrice. Divizoare rezistive.

Auditul financiar la IMM-uri: de la limitare la oportunitate

Aspecte controversate în Procedura Insolvenţei şi posibile soluţii

Prelucrarea numerică a semnalelor

REVISTA NAŢIONALĂ DE INFORMATICĂ APLICATĂ INFO-PRACTIC

Grafuri bipartite. Lecție de probă, informatică clasa a XI-a. Mihai Bărbulescu Facultatea de Automatică și Calculatoare, UPB

Procesarea Imaginilor

Versionare - GIT ALIN ZAMFIROIU

Excel Advanced. Curriculum. Școala Informală de IT. Educație Informală S.A.

La fereastra de autentificare trebuie executati urmatorii pasi: 1. Introduceti urmatoarele date: Utilizator: - <numarul dvs de carnet> (ex: "9",

În continuare vom prezenta unele dintre problemele de calcul ale numerelor Fibonacci.

9. Filtrarea imaginilor în domeniul spaţial şi frecvenţial

Metoda de programare BACKTRACKING

Solutii avansate pentru testarea si diagnoza masinilor industriale.

Ghid identificare versiune AWP, instalare AWP şi verificare importare certificat în Store-ul de Windows

SISTEME INTELIGENTE DE SUPORT DECIZIONAL. Ș.l.dr.ing. Laura-Nicoleta IVANCIU. Curs 7 Sisteme inteligente de suport decizional bazate pe RNA

Olimpiad«Estonia, 2003

9. Filtrarea imaginilor în domeniul spaţial şi frecvenţial

COMPRESIA DE IMAGINI

Laborator 2. Definirea tablourilor şi a funcţiilor (în linia de comandă) în Matlab 7.0

Candlesticks. 14 Martie Lector : Alexandru Preda, CFTe

Caracterizarea texturilor color pentru segmentarea imaginilor de psoriazis Color texture characterization for psoriasis image segmentation

Class D Power Amplifiers

Updating the Nomographical Diagrams for Dimensioning the Concrete Slabs

CERERI SELECT PE O TABELA

ARHITECTURA SISTEMELOR DE CALCUL ŞI SISTEME DE OPERARE. LUCRĂRILE DE LABORATOR Nr. 6, 7 şi 8 REPREZENTAREA INFORMAŢIILOR NUMERICE ÎNTREGI ŞI REALE.

Mecanismul de decontare a cererilor de plata

Managementul Proiectelor Software Metode de dezvoltare

Metode de ierarhizare utilizate în analiza statistică a întreprinderilor mici şi mijlocii în profil regional

LIDER ÎN AMBALAJE EXPERT ÎN SISTEMUL BRAILLE

INTEROGĂRI ÎN SQL SERVER

Generarea şi validarea numerelor prime mari

Restaurarea frontierelor unei imagini: abordare genetica

CAIETUL DE SARCINI Organizare evenimente. VS/2014/0442 Euro network supporting innovation for green jobs GREENET

The First TST for the JBMO Satu Mare, April 6, 2018

Propuneri pentru teme de licență

Nume şi Apelativ prenume Adresa Număr telefon Tip cont Dobânda Monetar iniţial final

UNIVERSITATEA POLITEHNICA din TIMISOARA RAPORT DE CERCETARE IMBUNATATIREA PERFORMANTELOR DE COMUNICATIE IN CONDUCEREA PROCESELOR INDUSTRIALE

Lucrarea de laborator nr. 4

Baze de date distribuite și mobile

Mods euro truck simulator 2 harta romaniei by elyxir. Mods euro truck simulator 2 harta romaniei by elyxir.zip

Managementul referinţelor cu

Proiectarea Sistemelor Software Complexe

Utilizarea metodei Oreste în decizii multicriteriale în managementul turismului

Update firmware aparat foto

manivelă blocare a oglinzii ajustare înclinare

Implementation of a Temperature Control System using ARDUINO

5.3 OSCILATOARE SINUSOIDALE

9. Memoria. Procesorul are o memorie cu o arhitectură pe două niveluri pentru memoria de program și de date.

MODELUL UNUI COMUTATOR STATIC DE SURSE DE ENERGIE ELECTRICĂ FĂRĂ ÎNTRERUPEREA ALIMENTĂRII SARCINII

Arbori. Figura 1. struct ANOD { int val; ANOD* st; ANOD* dr; }; #include <stdio.h> #include <conio.h> struct ANOD { int val; ANOD* st; ANOD* dr; }

Statistică descriptivă Calculul parametrilor. Călinici Tudor 2015

CUANTIZARE BIBLIOGRAFIE OBIECTIVE

R O M Â N I A CURTEA CONSTITUŢIONALĂ

Evoluția pieței de capital din România. 09 iunie 2018

SINGULAR PERTURBATION DETECTION USING WAVELET FUNCTION REPRESENTATION

INFORMAȚII DESPRE PRODUS. FLEXIMARK Stainless steel FCC. Informații Included in FLEXIMARK sample bag (article no. M )

Scopul lucrării: a. Familiarizarea cu utilizarea osciloscopului;

Platformă de e-learning și curriculă e-content pentru învățământul superior tehnic

ACTA TECHNICA NAPOCENSIS

ALGORITMI DE OPTIMIZARE EVOLUTIVI UTILIZAȚI ÎN PROIECTAREA DISPOZITIVELOR DE ÎNCĂLZIRE PRIN INDUCȚIE

METODE EXPLORATORII MULTIDIMENSIONALE

9. Filtrarea imaginilor în domeniul spaţial şi frecvenţial

Metodologie de comparare a reţelelor 4G prin evaluarea QoS-ului total

Curs 3 Fizica sem. 2

Laborator 1. Programare declarativă. Programare logică. Prolog. SWI-Prolog

TRAJECTORIES GENERATED BY THE R-R-RRT MECHANISM TRAIECTORII GENERATE DE MECANISMUL R-R-RRT

Universitatea Lucian Blaga din Sibiu Facultatea de inginerie Hermann Oberth Catedra de Calculatoare şi automatizări

METODE DE EVALUARE A IMPACTULUI ASUPRA MEDIULUI ŞI IMPLEMENTAREA SISTEMULUI DE MANAGEMENT DE MEDIU

Laborator 2 - Statistică descriptivă

Normalizarea tăriei sonore şi nivelul maxim permis al semnalelor audio

CORELATII ÎNTRE PROPRIETATILE HÂRTIILOR COMPONENTE SI CALITATEA CARTONULUI ONDULAT. II

SUCCESSIVE POSITIONS OF THE R-R-RTR MECHANISM POZIŢII SUCCESIVE ALE MECANISMULUI R-R-RTR

LINEAR VOLTAGE-TO-CURRENT CONVERTER WITH SMALL AREA

Procesarea Imaginilor - Laborator 5: Etichetarea componentelor conexe 1

CERERI SELECT PE MAI MULTE TABELE

MANAGEMENTUL CALITĂȚII - MC. Proiect 5 Procedura documentată pentru procesul ales

METODE INTELIGENTE DE REZOLVARE A PROBLEMELOR REALE. Laura Dioşan Tema 4

Tema seminarului: Analiza evolutiei si structurii patrimoniului

PROGRAMA ANALITICĂ a disciplinei Procesarea digitala a semnalelor. Numărul de ore pe semestru C S L P finală C S L P Total 3 2 E

earning every day-ahead your trust stepping forward to the future opcom operatorul pie?ei de energie electricã și de gaze naturale din România Opcom

Evaluarea legaturilor dintre indicatorii proprietăţii utilizând metoda regresiei multiple

Transcription:

Capitolul 1 FILTRAREA NELINIARĂ BAZATĂ PE ORDONARE Ordonarea crescătoare a unui set de valori stă la baza operaţiilor de filtrare de ordine [33]. Valorile ordonate ale eşantioanelor din fereastra de filtrare, numite statistici de ordine, pot fi utilizate ca atare, sau pot fi combinate. Filtrul median [33], [48] este cel mai folosit filtru cu ordonare după rang; ieşirea acestuia este statistica de ordin central a setului de valori, permiţând astfel eliminarea valorilor extreme aberante (outliar) în acelaşi timp cu păstrarea detaliilor utile ale imaginii. Cea mai uzuală combinaţie a statisticilor de ordine este combinarea liniară; filtrul astfel obţinut se numeşte L-filtru [33], [48]. L-filtrele sunt extrem de flexibile, înglobând posibilitatea obţinerii atât a filtrelor simple de ordonare după rang (inclusiv filtrul median) cât şi a filtrelor liniare 1. Dacă în cazul imaginilor scalare ordonarea valorilor nu prezintă nici o problemă, extinderea claselor de filtre bazate pe ordonare în cazul imaginilor color (sau, în general, vectoriale) nu este o chestiune simplă. După cum se remarcă în [3], proprietăţile de ordonare există doar într-o singură dimensiune şi nu există nici o concepţie naturală de rang. Notaţia general acceptată este de a considera {x 1, x 2,..., x n } o populaţie de vectori p-dimensionali, realizări particulare ale variabilei aleatoare multivariate X. Componenta i a variabilei aleatoare multivariate este X i şi va fi reprezentată de mulţimea de realizări particulare {x 1i, x 2i,..., x ni }. Pentru cazul imaginilor color prelucrate prin filtre de vecinătate, n este dimensiunea ferestrei de filtrare, numărul de componente a vectorilor este p = 3, iar vectorii x i sunt triplete de componente de culoare ce descriu fiecare pixel. 1.1 Filtrări de ordine prin ordonare lexicografică O relaţie introdusă între elementele unui spaţiu vectorial se numeşte relaţie de ordine dacă verifică proprietăţile de reflexivitate (1.1), tranzitivitate (1.2) şi antisimetrie (1.3): x x, x (1.1) x y si y z = x z, x, y, z (1.2) 1 Filtrul liniar de mediere se obţine evident în condiţiile în care ponderile statisticilor de ordine sunt egale cu 1/n; pentru aplicarea unei filtrări liniare de mediere ponderată, trebuie introdusă noţiunea de L-filtru adaptiv, cu coeficienţi de ponderare diferiţi pentru fiecare pixel, ce sunt permutări ale coeficienţilor filtrului liniar (permutări generate în aceeaşi fel ca ordonarea valorilor din imagine). 1

x y si y x = x = y, x, y (1.3) Conform acestei definiţii, pentru date multivariate (vectoriale) se poate introduce o singură relaţie de ordine bine definită: ordinea lexicografică (numită şi ordine de dicţionar). Pentru vectorii p- dimensionali x şi y relaţia de ordine lexicografică este definită prin: { xi = y x y i, pentru i = 1, 2,..., k, cu k [0; p 1] (1.4) x i y i, pentru i = k + 1. Este evident că în cadrul ordonării complete, lexicografice (1.4), vectorii sunt ordonaţi după prima componentă, apoi după a doua componentă, şi aşa mai departe. Aceasta înseamnă că prima componentă trebuie să fie cea mai importantă sau semnificativă (sau, mai mult, componentele vectorului trebuie să fie ordonate în ordinea importanţei acestora). Această ordonare nu poate fi cunoscută apriori şi este puternic dependentă de problemă; mai mult, în cazul imaginilor, ordinea importanţei componentelor de culoare nu este invariantă spaţial. În plus (şi acesta este dezavantajul cel mai important), ordinea lexicografică nu păstrează topologia spaţiului. Aplicarea practică a ordonării lexicografice se bazează deci pe stabilirea unei ordini a importanţei componentelor de culoare (deci stabilirea unor ranguri pentru acestea). În această situaţie se disting două cazuri fundamentale: dacă reprezentarea culorilor este reprezentarea RGB primară este de presupus că, apriori, toate componentele au o aceeaşi importanţă şi distincţia dintre ele trebuie făcută adaptiv, pentru fiecare pixel al imaginii, după măsuri statistice locale; dacă culorile sunt reprezentate într-un spaţiu de culoare derivat, în care cele trei componente să aibă semnificaţii fizice sau perceptuale diferite, este de aşteptat să se poată stabili apriori o ordine a importanţei acestora. 1.1.1 Ordonarea lexicografică în spaţiul primar Pentru a realiza ordonarea unor vectori ale căror componente sunt valorile RGB ale culorilor trebuie, deci, deduse măsuri ale activităţii componentelor de culoare; asemenea măsuri sunt calculate pentru fiecare plan de culoare, în vecinătatea fiecărui pixel al imaginii. Asemenea măsuri de activitate a componentelor de culoare încearcă să stabilească în care componentă de culoare sunt sesizabile cele mai mari variaţii. Variaţiile puternice ale unei componente se presupune că sunt datorate prezenţei impulsurilor de zgomot în vecinătatea curentă. Ca măsuri de activitate (sau de disimilaritate) pot fi folosite varianţa, domeniul de variaţie (diferenţa între maximul şi minimul local), raportul de contrast [18] sau domeniul de variaţie normat la media componentei; cu cât disimilaritatea este mai mare, cu atât componenta este mai importantă, şi deci, local, pentru ordonare, componentele vectorilor de culoare sunt permutate. 1.1.2 Ordonarea lexicografică în spaţiul perceptual Dificultatea stabilirii unei ordini clare de importanţă a componentelor de culoare RGB a unei imagini sugerează folosirea unui spaţiu de reprezantare a culorilor în care, din modul de definire, importanţa componentelor să fie deja stabilită. Un astfel de spaţiu este spaţiul perceptual de reprezentare HSV. Reprezentarea se compune din componenta de nuanţă, ce indică tipul de culoare, componenta de saturaţie, ce exprimă puritatea culorii şi componenta de valoare, de tipul luminanţei sau intensităţii luminoase a culorii. Perceptual, cel mai uşor de sesizat sunt modificările nuanţei (deoarece schimbă natura culorilor) [8], urmate de modificările saturaţiei (care pot da un caracter nenatural imaginii). În acelaşi timp, prezenţa impulsurilor de zgomot este sesizabilă în toate componentele HSV. Aceasta sugerează că cel mai indicat este folosirea componentei V ca cea mai importantă componentă, în care să se detecteze prezenţa impulsurilor de zgomot. Atunci, înainte de ordonare, vectorii reprezentării HSV a culorilor vor avea permutate componentele H şi V. 2

1.2 Filtrări de ordine prin principii de pre-ordonare Acceptând inutilitatea căutării oricărei ordonări totale, simple, ne-ambigue şi universale a n eşantioane multivariate, interesul practic a fost limitat la modurile în care se pot construi relaţii restrânse de ordonare vectorială, fezabile şi avantajoase. Rezultatul oricărui principiu de ordonare parţială (sau sub-ordonare, sau pre-ordonare, ce nu respectă principiul de antisimetrie (1.3)) este o ordonare (sau plasare după rang) a uneia sau mai multor caracteristici ale observaţiei, considerată individual sau în combinaţie cu alte observaţii. Proprietăţile dorite pentru ordonarea după rang a datelor vectoriale se pot extrapola din proprietăţile ordonării scalare: eşantioanele monoton ne-descrescătoare pe toate componentele sunt vectori proprii, invarianţi la ordonare; relaţia înglobează posibilitatea determinării unui estimator robust al locaţiei (medianul [33], [2]), ce poate fi determinat prin selecţia statisticii cu un anume rang; este omogenă faţă de scalarea cu factori pozitivi a componentelor individuale; se reduce la ordonarea scalară dacă componentele sunt identice; produce statistici de ordine ce sunt observaţii ale mulţimii ordonate; sortează valorile extreme aberante în regiuni consistente ale spaţiului rangurilor. În [3] se propun patru pricipii de bază de ordonare parţială (pre-ordonare) a datelor vectoriale: ordonarea marginală (descrisă în secţiunea 1.2.1) ordonarea condiţională (descrisă în secţiunea 1.2.2) ordonarea parţială (descrisă în secţiunea 1.2.3) ordonarea redusă (descrisă în secţiunea 1.2.4) 1.2.1 Ordonarea marginală Ordinea marginală [3], [33] este, după cum sugerează şi numele, o ordonare care se face după unul sau mai multe din eşantioanele marginale ale vectorilor consideraţi. Din punctul de vedere al prelucrării semnalelor, ordonarea marginală revine la a ordona în mod independent valorile eşantioanelor din fiecare canal al semnalului; modelul asociat semnalului vectorial (sau multicanal) este în acest caz o stivă de semnale scalare, ce pot fi ordonate şi prelucrate în mod separat. Prin această prelucrare independentă a componentelor semnalelor nu se ia în considerare intercorelaţia existentă între canale, aceasta fiind principala sursă de erori a metodei (în [2] se arată de exemplu cum o prelucrare de tip median marginal a unui semnal de culoare produce culori false în anumite zone cu culori puternic saturate). Spre deosebire de cazul scalar, statisticile vectoriale marginale de ordine nu mai sunt observaţii ale semnalului, ci valori noi. În cazul imaginilor color, în mod paradoxal, filtrarea marginală produce rezultate excelente, atât vizual (deci caracterizate conform unor măsuri subiective) cât şi ca măsuri de calitate. Filtrul median marginal MMF (Median Marginal Filter) elimină în mod eficient zgomotul impulsiv din imagini, chiar prezent în proporţii foarte mari (până la 25%-30% din pixeli degradaţi). Filtrul median marginal este utilizat şi la derivarea unor structuri de filtrare adaptive (de exemplu prin comutarea între un filtru median şi un filtru trece tot, condiţionat de varianţa locală a componentelor). Din punct de vedere teoretic, există două metode de luare în considerare a corelaţiei ce există între componentele imaginii vectoriale: în primul rând, corelaţia poate fi eliminată prin decorelarea componentelor imaginii, sau corelaţia dintre canale (componente) poate fi înglobată în proiectarea structurii filtrului. 3

Filtre mediane marginale cu decorelare Abordarea cu decorelare propune realizarea filtrării mediane a fiecărei componente de culoare după decorelarea acestora. Decorelarea se face prin utilizarea transformării Karhunen-Loève (KL); recorelarea componentelor se face după filtrarea fiecărui plan de culoare. Această abordare prezintă avantajul unei performanţe independente de sistemul de reprezentare folosit pentru culorile imaginii (fie în spaţiul primar RGB, fie un spaţiu perceptual). După cum se poate uşor constata, presupunerea statistică esenţială pe care se bazează folosirea transformării KL la decorelare este aceea că valorile (vectoriale) ale pixelilor imaginii sunt realizări particulare ale unui câmp aleator, identic distribuite. Dacă această distribuţie a valorilor pixelilor (presupusă deci invariantă pentru întreaga imagine) ar fi normală (gaussiană), în urma decorelării, componentele vectorilor observaţie ar deveni şi independente, nu numai decorelate [31], [43]. Aşa numita abordare cu independentizare a filtrării marginale a imaginilor color: înaintea etapei de decorelare, distribuţia valorilor pixelilor este transformată într-o distribuţie aproape normală folosind teorema limită centrală [31], [43] suma unui număr de câteva variabile aleatoare identic distribuite, din care nici una nu este dominantă, tinde la o distribuţie normală. Pentru a realiza această distribuţie aproape normală, s-a propus realizarea de sume locale a vecinilor fiecărui pixel. După sumare se poate face decorelarea, filtrarea marginală, recorelarea şi apoi transformarea inversă independentizării (rezultând o operaţie de filtrare numită IDMMF (Independent Decorrelated Marginal Median Filter) sau se poate renunţa la etape de decorelare (rezultând o operaţie de filtrare numită IMMF (Independent Marginal Median Filter). L-filtre vectoriale bazate pe ordonare marginală Corelaţia dintre componentele observaţiilor vectoriale poate fi luată în considerare prin modificarea structurii filtrelor de ordine ce se folosesc; acestea nu mai sunt identice cu analoagele lor din cazul scalar. Cazul L-filtrelor este tipic pentru această abordare. Un L-filtru scalar aplicat unui set de valori X = {x 1, x 2,..., x n } produce ca ieşire o combinaţie liniară a statisticilor de ordine ale acestora [33], [48]: y = w i x (i) = W i1 x (i1 ) (1.5) unde scalarii w i, respectiv W i1 sunt cei n coeficienţi ai filtrului. Pentru cazul valorilor vectoriale, fiecare observaţie este un vector cu p componente, x i = (x 1i, x 2i,..., x ni ), iar statisticile de ordine marginale sunt vectori formaţi din statisticile de ordine marginale (calculate pentru fiecare componentă a observaţiilor vectoriale, x (i) = (x 1(i), x 2(i),..., x n(i) ). Utilizarea acestor statistici vectoriale conduce la redefinirea L-filtrului vectorial ca: i 1 =1 y =... W i1 i 2...i p x (i) (1.6) i 1 =1 i 2 =1 i p=1 unde W i1 i 2...i p sunt cele N p matrici p p de coeficienţi ai filtrului. Forma din (1.6) poate fi rearanjată în funcţie de vectorii statisticilor de ordine marginale din fiecare canal (componentă) a vectorilor observaţie: p y = W j x (j) (1.7) j=1 Determinarea matricilor de coeficienţi W j se poate face prin optimizarea în sensul erorii pătratice medii minime a unui L-filtru a cărui ieşire să fie un estimator nedeplasat al poziţiei centrale (şi deci să elimine zgomotul impulsiv, singular sau în mixtură cu zgomotul gaussian). Determinarea coeficienţilor necesită cunoaşterea funcţiilor de densitate de probabilitate a statisticilor de ordine marginale ale semnalului de intrare, precum şi a valorilor acestuia. Cum rareori semnalul de intrare nedegradat este 4

cunoscut, acesta trebuie estimat din valorile corecte deja calculate, prin ipoteze asupra staţionarităţii şi proprietăţilor sale de corelaţie. 1.2.2 Ordonarea condiţională Ordonarea condiţională este un mod de a stabili ranguri, sau o ordine, sau o modalitate de selecţie [3], [33] pentru vectorii unui set de date, condiţionată de ordonarea unei componente marginale a acestora. Deci ordinea unei singure componente marginale decide ordinea vectorilor; din acest punct de vedere, ordonarea condiţională poate fi interpretată ca o ordonare lexicografică trunchiată la o singură componentă 2. Acestă trunchiere înseamnă că orice prelucrare se va face relativ la o singură componentă, păstrândule pe celelalte nemodificate. Componenta ce se prelucrează trebuie, desigur, să fie cea mai coruptă (degradată de zgomot), sau componenta în care influenţa zgomotului se resimte cel mai puternic. Ca şi în cazul definirii ordinii lexicografice (secţiunea 1.1) este necesară determinarea componentei ce se va prelucra. Se pot distinge şi aici două cazuri: dacă există o componentă intrinsec dominantă (aşa cum este componenta de valoare de la reprezentarea perceptuală HSV a imaginilor color), atunci aceasta este cea care se va prelucra. Dacă toate componentele au, apriori, o aceeaşi importanţă (ca în cazul reprezentării imaginilor color în spaţiul primar RGB), este evident că prelucrarea unui aceluiaşi întreg plan de culoare (sau a unei aceleiaşi componente) nu poate produce rezultate. Ca şi în cazul ordonării lexicografice, soluţia se află în alegerea adaptivă a componentei de prelucrat (componenta după care se face ordonarea condiţională) pentru fiecare poziţie a ferestrei de filtrare (deci pentru fiecare pixel al imaginii). Componenta cea mai activă este definită printr-o valoare mare a unei măsuri de neuniformitate: interval de variaţie, interval de variaţie normat la medie, varianţă, raport de contrast, chiar valori proprii. 1.2.3 Ordonarea parţială Ceea ce Barnett [3] numeşte ordonare parţială a unui set de date multivariate (a unui set de vectori) se bazează pe distincţia între grupuri de observaţii (vectori) şi nu pe distincţia între fiecare vector în parte. Deci, pentru această variantă de sub-ordonare, accentul se mută de la considerarea eşantioanelor marginale sau a observaţiilor multivariate individuale la luarea în considerare a proprietăţilor globale, relaţionale, din întregul set al eşantioanelor. Pentru a face o distincţie între diferitele grupuri de observaţii (având în vedere ordinea, extremele, rangul) se urmăreşte modul în care observaţiile se situază în diferite regiuni ale spaţiului eşantioanelor. Metoda de partiţionare folosită (bazată pe unul dintre mai multe principii posibile) poate implica proprietăţi marginale ale datelor; scopul principal este de a oferi o distincţie limitată între diferitele eşantioane (vectori) ai populaţiei. Ordonarea parţială produce o bază de împărţire a eşantioanelor în grupuri distincte de diferite ordine, fără a face distincţii în interiorul unui aceluiaşi grup. Ordonarea parţială implică construirea anvelopei convexe a setului de observaţii (setul convex minim ce conţine toate observaţiile iniţiale). Punctele (vectorii) ce se află pe înfăşurătoarea anvelopei convexe sunt numite grupul 1, şi apoi eliminate; se formează apoi anvelopa convexă a reziduului, punctele de pe noua înfăşurătoare formează grupul 2 (a se vedea figura 1.2.3). Procedeul este repetat, formând astfel o metodă bazată pe divizarea datelor în grupuri de ordine (sau de rang). Cu cât numărul (ordinul) 2 Anticipând definirea ordonării reduse, putem spune că ordonarea condiţională poate fi obţinută şi din aceasta dacă scalarul asociat fiecărui vector (a se vedea descrierea completă a metodei în secţiunea 1.2.4) este o singură componentă a acestuia. 5

Fig. 1.1: Partiţionarea unui set de vectori bidimensionali după anvelopa convexă. grupului este mai mic, cu atât observaţia (eşantionul, vectorul) este mai extremal. Este evident că, în aceste condiţii, vectorii setului de ordin maxim sunt situaţi în centrul clusterului de puncte, şi deci sunt candidaţi pentru medianul acestora. O asemenea metodă de ordonare este analoagă cu ceea ce a fost numit în statistică cojirea unei populaţii multivariate [27] (potato peeling sau orange peeling). O asemenea operaţie are însă un analog pentru cazul scalar: aşa numitul filtru tobogan 3 de îmbunătăţire a uniformităţii unei regiuni [55]. Esenţa metodei se bazează deci pe implementarea unor algoritmi de calcul al anvelopei convexe pentru date p dimensionale, cu p > 1, deci pe algoritmi de geometrie computaţională [30]. Teorema McMullen- Shepard [30] arată că anvelopa convexă a oricărei mulţimi de puncte din spaţiul Euclidian p dimensional este un politop 4 convex (reciproc, orice politop convex fiind anvelopa convexă a cel puţin unui set de puncte). Pentru cazul plan (p = 2) există alte seturi de teoreme ce dau descrieri ale anvelopei convexe a unui set de puncte, ce sunt direct implementabile; algoritmi deja clasici sunt algoritmii Jarvis (Jarvis march) [42] şi algoritmul Graham (Graham scan) [42]. Pe măsură ce dimensiunea spaţiului creşte problema de determinare a anvelopei convexe devine din ce în ce mai complicată; în cazul general, rezolvarea acesteia se poate face printr-o abordare de tip package-wrapping (sau gift-wrapping) [30]. Fiecare pas al acestei metode găseşte o nouă faţă a politopului anvelopă convexă îndoind (pliind) 3 Filtrul tobogan înlocuieşte extremele valorilor selectate de o fereastră de filtrare cu statisticile imediat următoare (superioară sau inferioară, depinzând dacă extremul este un minim sau un maxim), cu condiţia ca acestea să aibă valori diferite de valoarea extremului. 4 Un politop este o mulţime poliedrală, rezultată ca intersecţia unui număr finit de semispaţii închise; un semispaţiu este regiunea spaţiului p dimensional aflată de aceeaşi parte a unui hiperplan. 6

un hiperplan în jurul unei muchii a anvelopei convexe deja determinate, până în momentul în care acesta întâlneşte primul punct al mulţimii de puncte iniţiale. Analiza complexităţii algoritmice a unei asemenea abordări a condus la deducerea unei comportări O(n 2 ), unde n este numărul de puncte al setului pentru care se calculează anvelopa convexă. Abordările cele mai rapide pornesc de la principiul divide et impera şi de la o teoremă ce demonstrează echivalenţa dintre problemele sortării unui şir de numere şi de calculare a anvelopei convexe [30]; aceste abordări rapide conduc la o complexitate O(n log n). O problemă suplimentară apare în momentul considerării spaţiilor discrete, în care trebuie definit conceptul de convexitate discretă [9]. O componentă conexă discretă C este convexă dacă pentru orice pereche de puncte P, Q C şi orice scalar α [0; 1] există un punct R C pentru care discul de centru R şi rază h/2, construit conform distanţei chessboard, include punctul de pe segmentul P Q, dat de αp + (1 α)q. O consecinţă a acestei definiţii a convexităţii este aceea că mulţimea de puncte ce formează anvelopa convexă discretă nu coincide, ci include mulţimea de puncte de coordonate discrete din anvelopa convexă continuă construită pe baza aceleiaşi mulţimi de puncte discrete iniţiale. Pentru cazul planului discret, în [9] se identifică două tipuri esenţiale de configuraţii de neconvexitate, ce trebuiesc identificate în mulţimea dată de puncte şi eliminate (eliminarea presupune inserarea unui punct suplimentar): configuraţiile U şi L. Dar acestă operaţie nu este altceva decât o operaţie morfologică de tip totul sau nimic (Hit or Miss) [48], realizată cu măşti corespunzătoare configuraţiilor U, L şi a rotitelor acestora. Cu toată bogăţia de metode şi algoritmi existenţi pentru calculul anvelopelor convexe, literatura de specialitate nu consemnează nici o realizare de filtre de ordine de tip median bazate pe ordonarea parţială a datelor extrase de fereastra de filtrare din imagine. Putem găsi mai multe argumente pentru justificarea lipsei totale de interes pentru utilizarea acestei tehnici: în primul rând ordonarea se referă la un set mic de valori (vectorii dintr-o vecinătate a pixelului curent), ceea ce poate duce la imposibilitatea găsirii a mai multe rânduri de anvelope convexe; apoi vectorii au dimensiune mai mare ca 2 (cel puţin 3, pentru imaginile color), ceea ce face ca algoritmii eficienţi de calcul al anvelopei convexe să fie din ce în ce mai greu de descris; în fine, este posibil ca mulţimea de rang maxim (cea mai centrală să conţină mai mult de un singur vector, ceea ce face ca să fie necesară o nouă procedură de selecţie). 1.2.4 Ordonarea redusă Ordonarea redusă [3] se bazează pe reducerea fiecărei observaţii vectoriale (multivariate) la o unică valoare (scalar) printr-o combinaţie a valorilor componentelor observaţiilor. Scalarii obţinuţi sunt apoi ordonaţi (conform ordinii comune din mulţimea numerelor reale); ordinea scalarilor determină ordinea vectorilor. Ordonare bazată pe distanţe De cele mai multe ori, scalarii s i asociaţi vectorilor x i sunt deduşi pe baza unei distanţe generalizate la un punct fix specificat x fix, rezultând astfel o formă pătratică: s i = (x i x fix ) T A 1 (x i x fix ) (1.8) Matricea pătrată p p A poate fi orice matrice pozitiv semidefinită; în general este preferată alegerea matricii unitare, ce generează metrica Euclidiană, dar este posibilă şi alegerea matricii de covarianţă a observaţiilor (rezultând distanţa Mahalanobis) sau a unei matrici diagonale, ce va genera distanţe Euclidiene ponderate. Punctele fixe de interes sunt în general vectori obţinuţi prin prelucrări marginale: 7

fie medie (x fix = x i = x medie ), fie median (x fix = medianx i = x med ). O asemenea ordonare este interesantă atâta vreme cât vectorul al cărui scalar asociat are valoarea minimă este cel mai bun candidat, dintre vectorii observaţiilor, pentru punctul fix (central) faţă de care s-a făcut ordonarea. S-a propus de asemenea folosirea unor distanţe ponderate de la fiecare vector de culoare din fereastra de filtrare la medianul marginal local m; ponderarea se face prin utilizarea unor matrici diagonale: 1/w R 0 0 s i = (x i m) T 0 1/w G 0 (x i m) 0 0 1/w B adică s i = (x i1 m 1 ) 2 + (x i2 m 2 ) 2 + (x i3 m 3 ) 2 w R w G w B Ponderile w R, w G, w B sunt astfel alese încât să reflecte importanţa fiecărei componente a vectorilor; la fel ca şi pentru ordonarea lexicografică, aceste ponderi sunt măsuri de activitate locale, ca: intervalul de variaţie, varianţa, intervalul de variaţie normat la medie sau raportul de contrast (varianţa normată la medie). O altă variantă de scalar construit pe baza unor distanţe este scalarul obţinut ca sumă a distanţelor de la vectorul dat la toţi ceilalţi vectori ai setului de ordonat (distanţă agregată [3]): s i = (x j x i ) T A 1 (x j x i ) (1.9) j=1 După cum se arată în [2], [33] medianul setului de date este caracterizat de o distanţă agregată minimă, indiferent dacă ne aflăm în cazul scalar sau vectorial: x V MF = arg min {s i } (1.10),n Filtrul care funcţionează după acest principiu a fost denumit median vectorial VMF (Vector Median Filter) [2]; introducerea acestui filtru a constituit începutul erei de adevărată prelucrare multicanal a semnalelor vectoriale, fiind primul filtru construit special pentru date multivariate ce utilizează în mod intrinsec corelaţia dintre canalele semnalului. De fapt, vector medianul [2] nu este decât o redescoperire inginerească a ceea ce statistica multivariată numea punct de distanţă agregată minimă, punct care îi intersase pe economişti şi planificatori (pentru care determinarea acestuia este cunoscută ca problema generalizată a lui Weber [3], de plasare optimală a unui depozit de materiale ce deserveşte mai multe uzine). Principalul dezavantaj al VMF este volumul mare de calcule: pentru a calcula medianul vectorial al unui set de N valori, este necesară calcularea distanţelor dintre toate observaţiile mulţimii, deci N(N 1)/2 distanţe. Acesta duce la o complexitate O(pN 2 ) a numărului de înmulţiri. O diminuarea a complexităţii calculului VMF se poate realiza prin construirea unei aproximări rapide a distanţei Euclidiene. Această aproximare se bazează pe o combinaţie liniară a statisticilor de ordine a componentelor vectorului pentru care se calculează norma, după formula: cu p x 2 = a ( i i 1) x (i) 2 a = p 1 + ( i i 1) 2 8

Pentru cazul vectorilor de culoare, p = 3, a = 0.9398 şi norma vectorului de culoare x este dată cu o eroare de 1 a (6.019 %) de aproximarea: x 2 = 0.9398 x (1) + 0.3893 x (2) + 0.2987 x (3). După cum se demonstrează în [2], distanţa Euclidiană (normă L 2 ) este folosită ca bază a VMF datorită optimalităţii sale pentru un zgomot modelat de o distribuţie normală; dacă distribuţia devine biexponenţială, distanţa trebuie calculată ca o normă L 1 [2]. Ideea de modificare a metricii folosite în calculul distanţei a fost folosită şi în alte implementări (de exemplu metrici din familia de norme L β ). Ideea a fost extinşă prin propunerea de a folosi o combinare după două norme: fiecare distanţă între observaţii este calculată pe baza unei norme L β, iar agregarea distanţelor se face după o normă L α, producând un scalar de forma: ( p ) 1/β s i = (x jk x ik ) α 1/α β j=1 k=1 (1.11) Evident, pentru α = β = 1 se obţine medianul vectorial clasic [2]; pentru α, β > 1 se obţine un efect echivalent de netezire şi de reducere a zgomotului, iar pentru α < 1, β > 1 filtrul se comportă ca un filtru de ordonare după rang, favorizând diferite statistici de ordine. Slaba performanţă a filtrului VMF (indiferent de norma care generează distanţa folosită la calculul scalarului s i ) în prezenţa zgomotului gaussian a dus la ideea combinării acestuia cu un filtru de mediere; ieşirea unui asemenea filtru compozit, denumit EVMF (Extended Vector Median Filter) [2] este identică fie cu medianul vectorial VMF, fie cu media marginală, după cum aceste puncte sunt cele mai centrate (în sensul distanţei agregate minime la observaţiile din fereastra de filtrare). Este de asemnea posibilă utilizarea a mai multe ferestre de filtrare, parţial suprapuse, pentru fiecare pixel al imaginii; în fiecare asemenea fereastră se calculează un median vectorial, iar valoarea filtrată este obţinută printr-o serie de comparaţii ca una dintre valorile mediane astfel calculate, obţinând efecte de eliminare a zgomotului impulsiv sau de accentuare a contururilor în imagini nedegradate de zgomot. Ordonare bazată pe orientare unghiulară Criteriile de ordonare a observaţiilor vectoriale folosite până în acest moment au ilustrat doar componenta modul a vectorilor; componenta de tip orientare (unghi) a rămas neexplorată până în momentul introducerii noţiunii de filtru [median, în principiu] direcţional. Acest tip de filtre, introduse în [45] se bazează pe folosirea ca scalar s i pentru ordonarea redusă, a distanţei agregate unghiulare a observaţiilor vectoriale, deci suma unghiurilor de la fiecare vector la toţi ceilalţi. Ca şi pentru filtrul median vectorial VMF [2], filtrul direcţional de bază BVDF (Basic Vector Directional Filter) produce ca ieşire vectorul a cărui distanţă unghiulară agregată este minimă. Pentru un asemenea filtru, scalarul de ordonare este deci ( ) xi, x j s i = x i x j = arccos (1.12) x i x j j=1 şi medianul direcţional se defineşte ca: j=1 x V DF = arg min {s i } (1.13),n Una dintre motivaţiile principale ale considerării prelucrărilor direcţionale este legată de natura particulară a unor clase de imagini (sau semnale) multidimensionale, mai precis imaginile color. Pentru culori reprezentate în spaţiul RGB primar, intersecţia vectorului de culoare cu planul (triunghiul) Maxwell prezintă o importanţă deosebită. Pe de o parte, una dintre măsurile de bază de calitate a 9

prelucrărilor imaginilor color este definită ca o eroare pătratică medie normalizată a valorilor în planul Maxwell (aceasta este MCRE, Mean Chromaticity Error); pe de altă parte, după cum se arată şi în [8], cromaticitatea unei culori (nuanţa şi saturaţia culorii) este determinată de distanţele de la intersecţia vectorului de culoare cu planul Maxwell la culorile primare maxim saturate (roşu, verde şi albastru pur). Este evident că acest punct de intersecţie depinde numai de orientarea vectorului de culoare şi nu de modulul acestuia. Filtrarea direcţională generalizată GVDF (Generalized Vector Directional Filter) [45], este o extindere a BVDF ce selecţionează mai multe observaţii ca ieşire posibilă a filtrului, observaţii ce au cele mai mici distanţe unghiulare agregate[47]; în esenţă, această selecţie multiplă permite ca să se realizeze o a doua selecţie a unui singure observaţii de ieşire, prin operaţii de distanţă (modul). Abordarea direcţională a fost folosită şi pentru detectarea contururilor în imagini color şi pentru realizarea segmentării pe regiuni a imaginilor color prin încorporarea informaţiei de orientare (unghi faţă de vecini) la descrierea pixelilor. Ordonare bazată pe distanţe şi orientare unghiulară Comportările relativ complementare ale celor două tipuri esenţiale de filtre vectoriale (cu ordonare după distanţe şi cu ordonare după direcţie) în ceea ce priveşte eficienţa în zgomotele principale (impulsiv şi gaussian) a condus la ideea combinării celor două tipuri de prelucrări, într-o abordare mixtă modul-direcţie. O primă etapă a combinării celor două principii a fost introdusă prin aplicarea secvenţială a unei preselectări după direcţie a vectorilor (GVDF) urmată de o prelucrare după modul a acestora (fie scalară, după componenta de luminanţă, fie ca VMF). Un alt mod de a lua în calcul distantele în valoare şi unghiulare constă sin construirea unui scalar s i care să integreze atât informaţia direcţională cât şi informaţia de modul a vectorilor ce se prelucrează. Modelul cel mai general folosit este o combinaţie exponenţial convexă a distanţelor agregate unghiulare şi Euclidiene între vectorii setului: s i = j=1 x i x j p 1 p x i x j j=1 (1.14) Filtrul realizat prin ordonarea vectorilor după scalarul (1.14) a fost numit DDF(Distance Directional Filter) şi este generalizarea unui filtru simplu definit anterior cu p = 0.5. Valoarea parametrului p care asigură rezultate optimale pentru o gamă largă de distribuţii de zgomot este p = 0.75, deci atribuind o pondere mai mare caracterului direcţional. O altă modalitate de a integra prelucrările direcţionale şi de distanţă este de a comuta între ieşirea filtrului VDF şi VMF. O posibilitate este de a construi ieşirea filtrului pe direcţia vectorului VDF şi cu modulul vectorului VMF: x out = x V DF x V MF x V DF În plus, se poate introduce un grad suplimentar de fineţe a comparaţiei, luând în calcul şi media marginală a observaţiilor, vectorul de ieşire fiind pe direcţia VDF şi cu modulul vectorului VMF sau mediei marginale, după cum unul dintre aceşti vectori este cel mai central situat, în sensul distanţei agregate minime la observaţiile setului de prelucrat. 10

Ordonare bazată pe proiecţii Metodele de ordonare redusă prezentate până în prezent s-au bazat esenţial pe considerarea poziţiilor relative a vectorilor de ordonat în spaţiul original de reprezentare a acestora (spaţiul eşantioanelor), fie prin măsurarea distanţelor, fie prin măsurarea unghiurilor, fie prin considerarea ambelor. O variantă nouă de determinare a unor scalari s i de ordonare a vectorilor pleacă de la ideea modificării spaţiului de reprezentare a acestora; o reprezentare echivalentă într-un spaţiu de dimensiune mai mică va duce la reducerea dimensiunii vectorului, iar, prin repetare, se poate ajunge la un scalar. O asemenea metodă a fost numită metodă proiectivă. Observaţia iniţială se raportează la utilizarea triunghiului (planului) Maxwell în spaţiul RGB primar. Dar acest punct de intersecţie este definit de numai două coordonate independente, şi nu de trei, precum culoarea din care provine, şi poate fi considerat ca proiecţia vectorului de culoare pe planul Maxwell. Repetarea acestei proiecţii în plan, pe dreapta Maxwell (definită de ecuaţia x 1 + x 2 = 1) va reduce încă o dată dimensiunea vectorului, până la un scalar. În cazul general, pentru un vector p dimensional, x = (x 1, x 2,..., x p ), vom defini x k, vectorul după a k-a proiecţie (compusă dintr-o rotaţie şi o translaţie, deci o transformare afină); proiecţia se defineşte astfel încât primele k componente ale vectorului x k să fie nule, deci x 1 = (0, x 11,..., x 1p 1 ), x k = (0, 0,..., x k1,..., x kp k ). Ultima proiecţie va produce vectorul x p 1 = (0,..., 0, x p1 ) ce are o unică componentă nenulă. Această unică componentă nenulă este scalarul după care se face ordonarea; vectorul al cărui scalar este medianul tuturor scalarilor este definit ca medianul vectorial. Revenind în cazul particular al vectorilor de culoare (cu trei componente, pe care le vom considera (R, G, B)), proiecţiile vor produce scalarii s R = (1 + 1 3 )(G + B 1) + 2 3 R (1 + 1 3 )(G + B 1) 2 3 R s G = (1 + 1 3 )(R + B 1) + 2 3 G (1 + 1 3 )(R + B 1) 2 3 G s B = (1 + 1 3 )(R + G 1) + 2 3 B (1 + 1 3 )(R + G 1) 2 3 B după cum prima rotaţie este după axa R, G, sau B. Alegerea unui anume scalar se face adaptiv, conform criteriilor locale de activitate a fiecărei componente. Filtrul median prin proiecţii iterative pe planul Maxwell se comportă mai bine decât filtrul VMF clasic în condiţii de zgomot mic (impulsiv şi mixtură); în plus, şi volumul de calcule necesare pentru a calcula scalarul este extrem de mic filtrul cu proiecţii iterative necesită 27 înmulţiri pentru fiecare pixel (considerând o fereastră pătrată de 3 x 3 pixeli) iar filtrul VMF necesită 144 înmulţiri (şi un număr mult mai mare de adunări). Ordonare bazată pe curbe de umplere a spaţiului În prelucrarea imaginilor, problema reducerii unor obiecte vectoriale la scalari nu este nouă, şi a apărut odată cu considerarea primelor metode de codare a imaginilor, ca aplicaţii directe ale metodelor existente pentru semnalele unidimensionale. Aplicarea unei asemenea metode necesita transformarea semnalului bidimensional imagine într-un semnal unidimensional prin parcurgerea corespunzătoare a tuturor pixelilor. Parcurgerea (sau baleierea imaginii) înseamnă de fapt stabilirea unei ordini de 11

Fig. 1.2: Curbe de umplere a spaţiului - cazul bidimensional. vizitare a fiecărui punct a grilei rectangulare de reprezentare a imaginii, deci ordonarea unor vectori bidimensionali (ale căror componente sunt coordonatele pixelilor). O asemenea parcurgere a fost formalizată matematic ca o curbă de umplere a spaţiului [9]. O curbă de umplere a spaţiului T este o aplicaţie bijectivă ce asociază fiecărui punct din Z 2 (punctul din plan) un număr natural (numărul de ordine): T : K Z 2 N, T (x k ) = n k Curba de umplere a spaţiului va trece prin fiecare punct al mulţimii baleiate o singură dată (nu se va autointersecta). O clasă particulară a acestor curbe are proprietăţile suplimentare de autosimilaritate (sunt fractali) şi de păstrare a corelaţiei spaţiale (puncte care sunt vecine pe curbă, sunt vecine în plan). Exemplul cel mai cunoscut de astfel de curbă este curba Hilbert, cunoscută în două variante: curba Peano (sau curba Hilbert în U) şi curba Morton (sau curba Hilbert în Z) [9], [48]. Denumirea celor două curbe provine de la forma celulei de bază (reprezentate în figura 1.2.4). Proprietăţile de bijectivitate a curbelor Hilbert (şi în general a curbelor de umplere a spaţiului) au fost propuse pentru ordonarea redusă a vectorilor [40]: fiecărui vector i se asociază indicele punctului de pe curba de umplere a spaţiului corespunzător. Scalarii (indicii de pe curbă) sunt ordonaţi, iar vectorul al cărui indice este medianul valorilor indicelor extrase este ales ca median a setului de vectori. Problema esenţială legată de utilizarea unor curbe de tip Hilbert pentru calcularea scalarilor de ordonare redusă este aceea a modificării structurii de vecinătate a spaţiului indicilor faţă de spaţiul iniţial: puncte vecine din spaţiul iniţial nu mai sunt vecine în spaţiul indicilor, şi reciproc [40]. Aceasta duce la apariţia de artefacte pe imaginile prelucrate, chiar la nivele mici de zgomot. Pentru a evita asemenea efecte trebuiesc folosite curbe care să păstreze cât mai bine structura de vecinătate a spaţiului vectorial iniţial, şi deci corelaţia dintre vectori. Este evident că curba Hilbert în U (Peano) este mult mai potrivită din acest punct de vedere decât curba Hilbert în Z (Morton). Aceeaşi observaţie conduce la definirea a unor curbe cu aspect spiralat [40]. 12

Esenţial, problema care va decide eficienţa practică a unei curbe (pentru probleme de filtrare a imaginilor color, de exemplu) este însă problema calculului indicelui pe curbă al unui anume vector. Trebuie să remarcăm că soluţia de implementare cu un LUT nu este realizabilă: pentru vectori p dimensionali exprimaţi cu b biţi pe fiecare componentă, tabelul de echivalenţă ar trebui să conţină 2 pb numere de pb biţi (pentru imagini color obişnuite acesta înseamnă 2 24 numere de 3 octeţi, deci 12 MB). Atât pentru curba Peano, cât şi pentru curba definită de [40], trecerea de la cazul plan de definire la vectori de dimensiune superioară implică o procedură recursivă, cu decizii multiple. Spre deosebire de acesta, pentru curba Morton, indicii se calculează extrem de simplu: forma binară a indicelui pe curbă a unui vector se obţine prin întreţeserea formelor binare a componentelor vectorului; dacă componenta x i a vectorului p dimensional este exprimată în formă binară ca x i,b 1 x i,b 2...x i,1 x i,0, atunci forma binară a indicelui este [9]: x 1,b 1 x 2,b 1...x p,b 1 x 1,b 2 x 2,b 2...x p,b 2...x 1,0 x 2,0...x p,0 Diversitatea de metode de ordonare prezentate în acest capitol oferă o perspectivă asupra posibilităţilor de implementare a filtrelor de ordonare (şi în particular filtrul median) pentru imaginile vectoriale (color). Eficienţa acestor filtre este asemănătoare analoagelor lor scalare şi îşi arată limitele în cazul filtrării unor zgomote de tip mixtură. Ceea ce se impune este deci modificarea structurii de filtrare prin considerarea tuturor vectorilor din fereastra de filtrare. 13

Capitolul 2 FILTRAREA NELINIARĂ FĂRĂ PRINCIPII DE ORDONARE După cum am mai amintit, filtrarea neliniară poate apare ca o consecinţă a mai multor procedee de prelucrare: fie prelucrări intrinsec neliniare (aşa cum este ordonarea valorilor extrase de fereastra de filtrare, ca în cazul filtrelor cu ordonare după rang sau a L-filtrelor), fie adaptarea unei structuri de prelucrare care, intrinsec, nu este neliniară. Adaptarea se referă la modificarea parametrilor de definiţie a unui filtru în funcţie de caracteristicile locale ale semnalului (imaginii) de prelucrat. În mod uzual, un filtru, interpretat ca o operaţie locală (de vecinătate), este definit de o fereastră de filtrare (mulţime de puncte ce defineşte vecinătatea punctului curent de prelucrat) şi de o mulţime de coeficienţi (sau ponderi), ataşaţi poziţiilor ferestrei de filtrare. Adaptarea se poate referi fie la modificarea coeficienţilor de definiţie a filtrului, fie la modificarea formei ferestrei de filtrare. În cele ce urmează vom considera filtrele neliniare obţinute ca urmare a adaptării unei filtrări liniare; dacă {x j } este mulţimea celor n vectori (valori ale pixelilor) din fereastra de filtrare curentă, atunci ieşirea filtrului pentru poziţia dată este combinaţia liniară ponderată a acestor valori: y = Card(W ) j=1 w j x j, x j W (2.1) Pentru o filtrare de netezire (deci de reducere a zgomotului), coeficienţii w j trebuie să satisfacă [8], [18] condiţia de normare (care asigură invarianţa pentru zone uniforme): Card(W ) j=1 w j = 1 (2.2) Adaptarea semnifică că mulţimea coeficienţilor filtrului este diferită, de la un punct la altul al imaginii şi în funcţie de conţinutul acesteia, şi deci w j = w j (m, n, x(m, n)), sau că vecinătatea se modifică, dependent de punctul curent de prelucrare, W = W (m, n). Ceea ce trebuie însă remarcat este faptul că cele două aspecte ale adaptării nu sunt independente: un coeficient de ponderare extrem de mic (la limită nul) semnifică neluarea în calculul ieşirii y a filtrului a valorii respective, deci, echivalent, eliminarea poziţiei corespunzătoare din fereastra de filtrare. Problema determinării adaptive a ponderilor asociate unei ferestre de filtrare de formă impusă poate fi abordată din mai multe puncte de vedere: coeficienţii pot fi dependenţi (în mod explicit) de distanţele dintre vectorii selectaţi de fereastra de filtrare, prin ceea ce a fost denumit DDMF - Distance Dependent Multichannel Filter; deducerea coeficienţilor se poate face prin abordări de clustering sau de estimare statistică; coeficienţii pot fi deduşi printr-o abordare bazată pe integrarea logicii vagi (fuzzy) 14

în abordările clasice. De asemenea, se pot avea în vedere şi metode bazate pe calculul unei ferestre de filtrare adaptive. 2.1 Filtre dependente de distanţă Prelucrările cunoscute sub numele de filtrări cu coeficienţi dependenţi de distanţă, şi denumite DDMF - Distance Dependent Multichannel Filter [16] sau MDF - Multichannel Distance Filter [14] reprezintă o clasă de filtre adaptive, bazate pe (2.1), în care coeficienţii de ponderare a vectorilor sunt deduşi în funcţie de distanţele relative dintre aceştia (deci conform distribuţiei lor în spaţiul de reprezentare). Spaţiul de reprezentare a vectorilor (pentru cazul imaginilor color) este spaţiul RGB primar, chiar dacă distanţele euclidiene dintre vectori nu sunt în concordanţă cu diferenţele perceptuale de percepere a culorilor reprezentate de aceştia. În general, ceea ce se deduce direct pentru fiecare vector este o pondere a contribuţiei sale la ieşirea filtrului, a j, ponderi care, pentru setul de n vectori ai ferestrei de filtrare, nu respectă condiţia de normare a coeficienţilor, impusă de (2.2). Îndeplinirea condiţiei de normare este asigurată prin construirea ponderilor de filtrare ca raportul dintre coeficienţii de ponderare şi suma acestora: w j = a j (2.3) a j 2.1.1 Folosirea distanţei euclidiene dintre vectori Modul de construcţie a coeficienţilor de ponderare a vectorilor este în principiu inspirat din modalităţile de ordonare redusă a respectivilor vectori, deja discutate în capitolul anterior. În general, coeficientul de ponderare este o funcţie dependentă de un scalar d j, de tip scalar de ordonare (s j ). Funcţiile de tip polinomial au fost folosite cu succes de majoritatea cercetătorilor. Cea mai simplă funcţie propusă este puterea r a scalarului: a j = 1 d r j Această abordare a fost introdusă în [14] (ANL1 - Adaptive Non-Linear), [7] (MDF1) şi [16] (DDMF2). Scalarul de tip distanţă d j trebuie să exprime situarea vectorului curent x j, căruia îi este ataşat, faţă de ieşirea dorită a filtrului, şi deci trebuie să fie cu atât mai mare cu cât vectorul curent este mai depărtat de valoarea corectă (deci mai afectat de zgomot). Pentru a satisface această cerinţă, în [14] şi [7] se foloseşte distanţa euclidiană agregată (suma distanţelor de la vectorul curent la toţi ceilalţi vectori ai ferestrei de filtrare); în [15] este folosit acelaşi model pentru prelucrarea semnalelor unidimensionale multicanal (semnale seismice): d j = x i x j (2.5) În [16] se propune folosirea distanţei de la vectorul curent la un punct fix, ce este în general un estimator marginal al ieşirii dorite (în general, medianul marginal multicanal, dar şi vectorul ce corespunde poziţiei în care se face filtrarea, deci vectorul din originea ferestrei de filtrare): (2.4) d j = x fix x j (2.6) Pentru a evita cazurile de nedeterminare în evaluarea lui a j (ce pot apare când d j = 0), în [7] şi [16] s-a propus modificarea distanţei prin adunarea unei constante ε, care este fie unitară (ε = 1) [7] pentru MDF2, fie este foarte mică (ε 0) [16] pentru DDMF2: d j = x fix x j + ε (2.7) 15

Testele efectuate asupra comportării acestui tip de filtre în prezenţa a diferite distribuţii de zgomot au condus la concluziile folosirii unor valori specifice ale puterii r: r = 1 pentru zgomot uniform, r = 0 pentru zgomot gaussian (ceea ce înseamnă de fapt că ponderile tuturor vectorilor sunt egale, şi filtrul obţinut este de fapt filtrul de mediere marginală), r = 2 pentru zgomot de tip laplacian sau cu alte distribuţii de tip long tail (cu coadă lungă). Adaptarea propriu-zisă a puterii r în funcţie de caracteristicile locale ale imaginii (semnalului) - deci în interiorul ferestrei de filtrare - se poate face conform caracteristicilor statistice locale de ordinul doi ale semnalului [6]. Filtrul propus, AMDF - Adaptive Multichannel Distance Filter, se bazează pe o extindere multicanal a unui algoritm clasic de estimare a varianţei locale a semnalului util şi a zgomotului [28], [55]. Pe fiecare canal (deci pe fiecare plan de culoare a imaginii color) se face o estimare a varianţei locale de pe canalul j, în poziţia curentă de filtrare, σxj 2, prin: ( ) 2 x 2 σxj 2 ij 1 n x ij = n 1 Pentru fiecare canal, se stabileşte un coeficient de importanţă a efectului zgomotului faţă de variaţiile proprii ale semnalului: c j = 1 σ2 xj σ 2 nj iar pe baza acestui coeficient se alege puterea r corespunzătoare: r = { 0, dacă min{cj } 0 min{c j }, în rest. (2.8) Plecând de la ideea folosirii de distanţe la puncte fixe (2.6), în [16] s-a reluat ideea din [44], de a suma distanţele la mai multe puncte fixe reprezentative, ca medianul marginal, media marginală şi punctul central (din originea ferestrei de filtrare), rezultând un filtru numit DDMF3, cu o distanţă: d j = x medie x j + x median x j + x centru x j (2.9) Scalarul de distanţă d j asociat fiecărui vector exprimă calitatea sa (deci măsura în care valoarea sa este neafectată de zgomot); exprimarea unei asemenea măsuri trebui însă să ţină seama şi de ceilalţi vectori din fereastra de filtrare; în acest context scalarul propus în [14] pentru filtrul MDF2 este construit ca suma distanţelor dintre toţi vectorii ferestrei de filtrare, mai puţin vectorul curent: a j = 1 d i d j 2 unde d j este distanţa euclidiană agregată din (2.5). O altă funcţie propusă pentru transformarea distanţelor dintre vectorii ferestrei de filtrare în ponderi relative individuale este o funcţie de tip exponenţial [16], determinată de parametrii α > 1 şi 0 < β < 1: ( a j = exp d ) j ln α βd max Constanta d max este determinată ca fiind distanţa maxim posibilă dintre vectori pentru semnalul studiat (în cazul imaginilor color reprezentate cu 8 biţi pentru fiecare plan de culoare, aceasta este d max = 8 255 3). Acestă relaţie exprimă principiul general conform căruia vectorii ce au asociate distanţe mici trebuie să aibă asociate ponderi mai mari (mai ales în cazul în care se doreşte eliminarea impulsurilor de zgomot şi păstrarea clarităţii tranziţiilor din imagine). Testele experimentale au arătat că o combinaţie eficientă de parametri este α = 2 şi β = 0.05 [16]. 16

2.1.2 Folosirea distanţei unghiulare dintre vectori După cum am arătat şi în secţiunea privind filtrarea bazată pe ordonare directă a vectorilor, în cazul imaginilor color, informaţia de culoare (crominanţă, saturaţie) este mai importantă decât informaţia de intensitate luminoasă, şi deci pare naturală folosirea unor criterii de comparaţie (ordonare, ponderare) a vectorilor care să ia în considerare această informaţie direcţională. Aceasta este abordarea numită Vector Directional [46], în care distanţa dintre vectori este înlocuită cu unghiul dintre respectivii vectori. O asemenea abordare a fost adoptată în [38]; pe baza distanţei agregate unghiulare d j (1.12) sau (2.10) dintre vectori se derivă coeficienţi a j ce exprimă ponderea cu care vectorul x j participă la ieşirea filtrului. ( ) xi, x j d j = x i x j = arccos (2.10) x i x j În [38] se propune FVDF - Fuzzy Vector Directional Filter, pentru care fiecare coeficient de ponderare a vectorilor este dat de o formulă ce grupează abordările polinomială şi exponenţială : a j = 1 1 + exp(d r j ) Pentru rezultate optime, parametrul de control r are valorile 1 sau 2. Această construcţie impune două comentarii: în primul rând, filtrul vector direcţional de bază (BVDF) se poate obţine selectând doar vectorul a cărui coeficient a j este maxim; în al doilea rând, termenul de fuzzy ce apare în denumirea filtrului nu exprimă neapărat existenţa unor inferenţe logice a unui set de reguli, ci se justifică prin normarea (2.3) care produce numere subunitare pozitive, ce pot fi interpretate ca grade de apartenenţă ale fiecărui vector din fereastra de filtrare la clasa valoare corectă. O altă abordare bazată de distanţa agregată unghiulară d j este prezentată în [34] şi se bazează pe construcţia unor coeficienţi de ponderare daţi de: a j = max{d i } d j max{d i } min{d i } Acest filtru a fost denumit ANNMF - Adaptive Nearest Neighbor Multichannel Filter. O modificare a sa se poate obţine dacă în locul distanţei unghiulare agregate se foloseşte doar unghiul dintre vectorul curent şi un vector de referinţă (2.11) (deci acelaşi principiu ca şi în cazul folosirii distanţei euclidiene). Vectorul de referinţă (dacă nu este chiar centrul ferestrei de filtrare) se calculează în general într-o altă fereastră de filtrare (de dimensiune mai mică decât fereastra de filtrare curentă); de aceea filtrul astfel construit se numeşte DWANNMF - Double Window Adaptive Nearest Neighbor Multichannel Filter [34]: d j = x fix x j (2.11) În fine, ca şi în cazul ordonării vectorilor, se pot considera abordări mixte, distanţă - unghi, deci integrarea într-un singur scalar (printr-un produs) a distanţelor agregate unghiulare şi euclidiene [19], [20]. O asemenea variantă este propusă în [16] ca DDMF4: sau ca d j = ( n x i x j ) d j = ( n ) ( n ) x i x j x i x j ( x medie x j + x median x j + x centru x j ) 17