TEZĂ DE DOCTORAT Metode nucleu pentru date structurate

Size: px
Start display at page:

Download "TEZĂ DE DOCTORAT Metode nucleu pentru date structurate"

Transcription

1 Universitatea din Bucureşti Facultatea de Matematică şi Informatică Şcoala Doctorală de Informatică TEZĂ DE DOCTORAT Metode nucleu pentru date structurate Rezumat Coordonator ştiinţific: Prof. Dr. Denis Enăchescu Doctorand: Bianca Roman (Mogoş) Bucureşti, Septembrie 2012

2 Cuprins Introducere Învăţarea din date în spaţii nucleu O sinteză asupra metodelor nucleu pentru date structurate Paradigma învăţării din date Noţiuni preliminare privind metodele nucleu Algoritmi de învăţare în spaţii nucleu Metode de detectare a valorilor discordante Definirea noţiunii de valoare discordantă Algoritmi de detectare a valorilor discordante Metode de clasificare nesupervizată Principalele categorii de metode de clasificare nesupervizată Clasificare nesupervizată folosind tehnica Particle Swarm Optimization Discuţie Metode de detectare a valorilor discordante bazate pe abordarea funcţiilor nucleu Utilizarea tehnicilor de analiză exploratorie a datelor în identificarea indivizilor suspecţi în site-urile de licitaţie Tehnica de analiză exploratorie a datelor - Curbele Andrews Descrierea metodei de detectare a valorilor aberante Rezultate experimentale Metodă de detectare a valorilor discordante în studiile de bioechivalenţă bazată pe o extindere a curbelor Andrews (Metoda EAC) Descrierea modelului Testul statistic distanţa estimaţiilor Prezentarea metodei EAC Evaluarea performanţelor metodei EAC pe baza unui studiu de simulare Setarea parametrilor modelului Rezultate experimentale O generalizare a metodei EAC. Aplicaţii în detectarea valorilor discordante în domeniul farmaceutic Descrierea metodei Rezultate experimentale Formalizarea abordării bazate pe curbele Andrews în contextul funcţiilor nucleu

3 2.6 Discuţie Metode nucleu pentru clasificarea nesupervizată a datelor liniar neseparabile Funcţii de decizie în spaţii nucleu Învăţarea supervizată a datelor folosind funcţii de decizie Algoritmul de clasificare nesupervizată bazat pe funcţii nucleu Reprezentarea particulei O prezentare succintă a algoritmului Detalii tehnice referitoare la algoritm Indici de validare a clasificării Indicele Dunn Indice de validare a clasificării bazat pe simetria datelor Indicele de validare a clasificării propus de mine - Indicele de discontinuitate Rezultate experimentale O comparaţie între reprezentarea particulei prin centre şi reprezentarea particulei prin funcţii de decizie folosind un set de date generat artificial Evaluarea acurateţei de clasificare a metodei propuse Discuţie Concluzii şi dezvoltări ulterioare Bibliografie

4 Introducere Metodele nucleu au ca obiect de studiu învăţarea din date. Importanţa abordării propuse de acestea poate fi motivată prin următoarele particularităţi: deţine un fundament teoretic riguros: definirea funcţiilor nucleu şi a spaţiului nucleu, teoreme de caracterizare a funcţiilor nucleu, teoreme privind stabilitatea statistică a metodelor etc.; reprezintă un instrument puternic în diverse domenii practice: datorită capacităţii de a învăţa atât date reprezentate vectorial, cât şi ne-vectorial (cazul string-urilor, grafurilor sau imaginilor) a furnizat soluţii eficiente în domenii ca bioinformatica, clasificarea documentelor, regăsirea informaţiei şi procesarea imaginilor; prezintă o caracteristică definitorie: abilitatea de analiză a tiparelor neliniare din cadrul unui set de date. Obiectivul tezei constă în dezvoltarea şi analiza unor noi metode de învăţare din date care, beneficiind de abilităţile abordării metodelor nucleu, pot conduce la crearea unor modele eficiente în domenii cum ar fi detectarea valorilor discordante şi clasificarea nesupervizată. În Capitolul 1 realizez o sinteză asupra metodelor nucleu pentru date structurate având ca scop identificarea demersurilor bazate pe funcţii nucleu utilizate în detectarea valorilor discordante şi în clasificarea nesupervizată a datelor. În acest sens, ilustrez principalele caracteristici şi direcţii ale metodelor nucleu şi, mai mult, prezint o clasificare a tehnicilor de detectare a valorilor discordante şi respectiv a metodelor de clasificare nesupervizată. De asemenea, o atenţie deosebită acord tehnicii Particle Swarm Optimization - o nouă abordare utilizată în ultimii ani în rezolvarea unor probleme de clasificare nesupervizată. Tehnicile exploratorii de analiză a datelor sunt recunoscute ca instrumente utile în detectarea vizuală a valorilor discordante. O limitare a acestei abordări constă în lipsa studiilor privind coeficientul de încredere al interpretării vizuale. În acest sens, în Capitolul 2 propun două metode de detectare automată a valorilor discordante, bazate pe tehnica exploratorie de analiză a datelor, curbele Andrews, pe care le aplic în identificarea subiecţilor discordanţi în studiile de bioechivalenţă şi în descoperirea indivizilor suspecţi în site-urile de licitaţie. În acest scop am introdus o variantă modificată a curbelor Andrews cu proprietăţi superioare celor iniţiale. 3

5 Pe de o parte, detectarea valorilor discordante reprezintă o analiză preliminară necesară pentru estimarea bioechivalenţei medii dintre o formulare de test T şi o formulare de referinţă R a unui medicament. Acceptarea sau excluderea unui subiect discordant din datele de selecţie poate să ducă la o concluzie eronată în studiile de bioechivalenţă [Chow, Tse (1990)]. Având în vedere motivaţia indicată, propun o metodă automată de clasificare a datelor care combină metoda curbelelor Andrews extinse, cu un demers statistic. Folosind o procedură de simulare, arăt că rezultatele furnizate de abordarea bazată pe curbe Andrews sunt superioare testului distanţa estimaţiilor (metoda considerată în literatură ca fiind cea mai bună în detectarea valorilor discordante) pentru modelul de bioechivalenţă crossover. De asemenea, folosind o variantă modificată a abordării amintite anterior, analizez două seturi de date reale din domeniul farmaceutic, obţinând rezultate pozitive privind identificarea subiecţilor anormali, în concordanţă cu viziunea farmacocinetică. Pe de altă parte, tentativele de fraudă ale vânzătorilor reprezintă un fenomen care se repetă în site-urile de licitaţie. Ţinând cont că numărul de schimburi comerciale care utilizează e-commerce este în creştere, problema asigurării onestităţii acestor interacţiuni este de mare actualitate. În acest sens, am realizat o formalizare a unei probleme de detectare a profilelor vânzătorilor suspecţi considerând un model de învăţare supervizată pentru identificarea acestora. Am aplicat această metodă pe un set de date real, extras de pe un site de licitaţie din Brazilia, MercadoLivre şi am obţinut rezultate pozitive privind detectarea comportamentului suspect de fraudă. În finalul capitolului propun o formalizare a spaţiilor de curbe Andrews şi curbe Andrews extinse (acestea din urmă fiind propuse de mine) în contextul abordării funcţiilor nucleu. Pornind de la acest model teoretic se pot analiza proprietăţile spaţiului de curbe Andrews şi ale spaţiului de curbe Andrews extinse. Învăţarea nesupervizată este unul dintre domeniile majore de cercetare în învăţarea automată, în timp ce metodele nucleu oferă soluţii eficiente pentru o gamă largă de probleme de învăţare statistică. În Capitolul 3 propun un algoritm de clasificare nesupervizată bazat pe metode nucleu, care foloseşte tehnica Particle Swarm Optimization şi funcţii de decizie. Metoda propusă reprezintă un cadru general pentru rezolvarea problemei de clasificare nesupervizată: dacă a fost ales un indice de validare a clasificării adecvat, metoda furnizează performanţe foarte bune în rezolvarea problemei. Mai mult, metoda dezvoltată detectează în mod automat grupările dintr-un set de date şi de asemenea, estimează în mod automat numărul de grupări. Datorită utilizării funcţiilor nucleu, abordarea mea poate fi aplicată atât pentru grupări liniar separabile cât şi pentru grupări liniar neseparabile. Întrucât algoritmul se bazează pe tehnica Particle Swarm Optimization, dacă este necesar, se poate folosi calculul paralel pentru implementarea şi rularea lui. Performanţele metodei sunt testate pe mai multe seturi de date artificiale. Totodată sunt discutate calităţile abordării propuse. 4

6 Rezultatele de cercetare prezentate în această teză de doctorat au fost diseminate în patru lucrări ştiinţifice: 1. Articol publicat în IEEE Proceedings SYNASC 2011, Conferinţă ISI C [Almendra, Roman (Mogoş) (2011b)] 2. Articol acceptat spre publicare în revista Biocybernetics and Biomedical Engineering (BBE), Poland, Revistă ISI [Mogoş (Roman) (2012)] 3. Articol acceptat spre publicare în revista Farmacia, Revistă ISI [Mogoş (Roman), Sandulovici (2012)] 4. Articol acceptat spre prezentare la NCA 2012 Workshop - on Natural Computing and Applications, SYNASC 2012 [Mogoş (Roman), Mogoş (2012)] De asemenea am susţinut două comunicări la Conferinţa Societăţii de Probabilităţi şi Statistică din România (SPSR): 1. Comunicare susţinută la SPSR 2010, prezentare pe bază de abstract, fără publicare [Roman (Mogoş) (2010)] 2. Comunicare susţinută la SPSR 2011, prezentare pe bază de abstract, fără publicare [Almendra, Roman (Mogoş) (2011a)]. 5

7 Capitolul 1 Învăţarea din date în spaţii nucleu Metodele nucleu furnizează soluţii eficiente pentru diverse probleme de învăţare pornind de la date reprezentate vectorial, dar şi ne-vectorial, cum ar fi string-urile sau grafurile. Particularitatea acestor metode constă în abilitatea lor de analiză a tiparelor neliniare din cadrul unui set de date [Shawe-Taylor, Cristianini (2004)]. Pe de altă parte, detectarea valorilor discordante şi clasificarea nesupervizată a unui set de date reprezintă două dintre domeniile de mare actualitate în învăţarea nesupervizată. Capitolul de faţă studiază cele trei subiecte amintite anterior şi îşi propune, pe baza rezultatelor din literatură, să identifice modalităţi de a utiliza funcţiile nucleu în detectarea valorilor discordante şi în clasificarea nesupervizată a datelor. 1.1 O sinteză asupra metodelor nucleu pentru date structurate Metodele nucleu sunt foarte cunoscute ca metode de învăţare din exemple. Mai mult, acestea au un fundament teoretic riguros şi reprezintă un instrument puternic în diferite aplicaţii reale [Sánchez (2003)]. Datele structurate reprezintă acele date obţinute prin combinarea unor elemente mai simple în ansamble mai complexe. De multe ori, necesită o utilizare recursivă a unor obiecte mai simple de acelaşi tip [Shawe-Taylor, Cristianini (2004)]. Printre exemplele de date structurate se numără atât structurile mai simple cum ar fi vectorii, string-urile şi secvenţele, cât şi obiecte mai complexe precum arborii, imaginile sau grafurile Paradigma învăţării din date Ştiinţa învăţării are un rol important în statistică, data mining şi inteligenţă artificială [Hastie et al. (2009)]. Scenariul general al învăţării din date presupune existenţa unei măsurători (de ieşire), de obicei, cantitativă (de exemplu, bursa de valori) sau nominală (cum ar fi, pacient sănătos/pacient bolnav), pe care vrem să o prezicem pe baza unei mulţimi de caracteristici (spre exemplu, o serie de măsurători clinice) [Hastie et al. (2009)]. 6

8 1.1.2 Noţiuni preliminare privind metodele nucleu Folosind referinţele [Shawe-Taylor, Cristianini (2004)] şi [Hofmann et al. (2008)] definesc metodele nucleu şi prezint principalele caracteristici ale abordării bazate pe funcţii nucleu. Definirea metodelor nucleu Metodele nucleu sunt definite prin două componente [Shawe-Taylor, Cristianini (2004)]: 1. O funcţie φ care scufundă spaţiul de intrare X într-un spaţiu eventual de dimensiune mai mare (posibil infinit dimensional) cu produs scalar, notat F şi denumit spaţiul caracteristicilor şi 2. Un algoritm de detectare a funcţiilor tipar liniare în spaţiul caracteristicilor F (reprezentate ca produse scalare dintre puncte ale spaţiului caracteristicilor); de exemplu, algoritmi de clasificare, de regresie. Conform [Shawe-Taylor, Cristianini (2004)] introduc următoarele definiţii. Definiţia (Funcţie nucleu) Un nucleu este o funcţie k, care pentru orice x, z X satisface relaţia k(x, z) = φ(x), φ(z) în care φ este o aplicaţie de la spaţiul X la spaţiul caracteristicilor F (cu produs scalar) Caracteristici ale metodelor nucleu φ : x φ(x) F. Există două proprietăţi de bază pe care o funcţie nucleu trebuie să le satisfacă pentru a fi considerată adecvată în rezolvarea unei aplicaţii [Shawe-Taylor, Cristianini (2004)]: trebuie să reprezinte o măsură de similaritate adecvată problemei şi domeniului; evaluarea sa trebuie să necesite un timp computaţional semnificativ mai scăzut decât calculul explicit al produselor scalare dintre vectorii de caracteristici definiţi de φ Algoritmi de învăţare în spaţii nucleu În această subsecţiune prezint o taxonomie a principalelor clase de metode nucleu. O caracteristică comună a acestor metode este capacitatea de analiză a datelor întrun spaţiu (spatiul caracteristicilor definit de o funcţie nucleu) de complexitate mai ridicată comparativ cu spaţiul iniţial al datelor, pornind numai de la informaţii legate de produsele scalare dintre datele iniţiale (furnizate prin matricea nucleu). 7

9 Principalele clase de metode nucleu sunt: 1. Metode nucleu bazate pe descompunerea în valori proprii 2. Metode nucleu folosind optimizare convexă 3. Metode nucleu bazate pe învăţare online 4. Metode de clasificare nesupervizată 5. Metode de învăţare bazate pe dezvoltarea unor funcţii nucleu speciale. 1.2 Metode de detectare a valorilor discordante Definirea noţiunii de valoare discordantă Detectarea valorilor aberante (în engleză, outliers ) reprezintă o problemă de interes în numeroase domenii ca urmare a efectelor cauzate de luarea în consideraţie sau de excluderea acestor observaţii. O valoare aberantă (sau o grupare de valori aberante) este o observaţie discordantă (sau o grupare de observaţii discordante) în raport cu restul observaţiilor [Barnett, Lewis (1994)], [Grubbs (1969)] Algoritmi de detectare a valorilor discordante Principalele abordări privind detectarea valorilor aberante folosesc metode de clasificare supervizată şi nesupervizată, algoritmi extinşi având la bază metoda celor mai apropiaţi vecini, tehnici statistice şi spectrale şi de asemenea metode bazate pe reţele neurale [Chandola et al. (2009)], [Hodge, Austin (2004)], [Markou, Singh (2003a)], [Markou, Singh (2003b)]. Un demers propus în literatură [Andrews (1972)], [Barnett, Lewis (1994)], dar mai puţin studiat este cel care introduce ca metode de detectare a valorilor discordante tehnicile de analiză exploratorie a datelor. Multe dintre aceste tehnici sunt bazate pe metode de vizualizare a datelor multidimensionale [Martinez, Martinez (2002)], care permit descoperirea vizuală a structurilor din cadrul seturilor de date multidimensionale. 1.3 Metode de clasificare nesupervizată Această secţiune conţine o prezentare a principalelor categorii de metode de clasificare nesupervizată, o descriere a tehnicii K-means şi o analiză comparativă a metodelor de clasificare nesupervizată bazate pe tehnica PSO Principalele categorii de metode de clasificare nesupervizată Clasificarea nesupervizată reprezintă unul dintre cele mai importante şi actuale subiecte din domeniul învăţării nesupervizate şi constă în partiţionarea datelor în clase (grupări) nesimilare, formate din tipare similare (observaţii, vectori de caracteristici) [Jain et al. (1999)] şi [Shawe-Taylor, Cristianini (2004)]. 8

10 Această subsecţiune conţine categoriile cele mai importante de metode de clasificare nesupervizată, aşa cum sunt prezentate în ([Enăchescu (2004)], pp ). Conform autorului, există cinci categorii principale de metode pentru problema clasificării nesupervizate: 1. Metode de partiţionare 2. Metode ierarhice 3. Metode bazate pe densitate 4. Metode bazate pe grid 5. Metode bazate pe modele Clasificare nesupervizată folosind tehnica Particle Swarm Optimization În această subsecţiune prezint şase abordări din literatură referitoare la clasificarea nesupervizată folosind tehnica PSO. Particle Swarm Optimization este o tehnică euristică de explorare a spaţiului de căutare al unei probleme, bazată pe o populaţie de particule [Eberhart, Kennedy (1995)], [Kennedy, Eberhart (1995)]. Fiecare particulă îşi modifică poziţia şi viteza prin intermediul unor reguli predefinite. De asemenea, fiecare particulă îşi pastrează cea mai bună valoare atinsă. La nivelul întregii populaţii, se reţine cea mai bună valoare atinsă de un membru al populaţiei. În ultimii ani, datorită flexibilităţii şi eficienţei sale, această tehnică a fost folosită în multe domenii, printre care şi în clasificarea nesupervizată. O analiză comparativă În primul rând, se observă că toate metodele propuse folosesc în mod implicit sau explicit abordarea din metoda K-means referitoare la calcularea distanţelor dintre puncte şi centrele claselor şi la regula de asignare a punctelor claselor corespunzătoare. Un alt element comun al tuturor rezultatelor prezentate este utilizarea centrelor claselor pentru reprezentarea particulelor; un singur rezultat este puţin diferit, în această privintă, şi anume [Das et al. (2008)], deoarece acesta adaugă în reprezentarea particulelor, alături de centrele claselor, şi informaţii despre starea unei clase într-un anumit moment (activă sau inactivă). O primă diferenţă între metodele analizate se referă la tipul de PSO utilizat: unele metode folosesc PSO standard, altele, PSO cu pondere a inerţiei (varianta liniară sau exponenţială), PSO cu modificarea variabilelor aleatoare din formula vitezei sau PSO cu modificarea modalităţii de actualizare a particulei gbest. O altă diferenţă se referă la tipurile de experimente efectuate: în unele cazuri se compară doar algoritmi bazaţi pe tehnica PSO, în alte cazuri sunt implicate în comparaţii şi alte metode; de cele mai multe ori, este luată în consideraţie, în cadrul comparaţiei, metoda K-means, care se află la baza tuturor rezultatelor analizate. O diferenţă esenţială între [Das et al. (2008)] şi celelalte rezultate prezentate este aceea că în [Das et al. (2008)] sunt utilizate metode nucleu. Din acest motiv, această metodă poate să clasifice şi date liniar neseparabile. 9

11 1.4 Discuţie Analiza efectuată în acest capitol reprezintă un prim pas în construcţia metodelor propuse în Capitolele 2 şi 3. Metodele de detectare a valorilor discordante împreună cu abordarea funcţiilor nucleu stau la baza metodelor dezvoltate în Capitolul 2, în timp ce tehnica PSO combinată cu metodele nucleu aplicată pentru clasificarea nesupervizată a datelor este specifică Capitolului 3. După cum se observă din Secţiunile 1.2 şi Secţiunile 1.3, detectarea valorilor discordante şi clasificarea nesupervizată reprezintă două subiecte intens studiate în ultimii ani. Cu toate acestea, abordările bazate pe metode nucleu sunt relativ puţine. În acest context, metodele propuse de mine în următoarele două capitole se situează într-o zonă mai puţin explorată, dar foarte promiţătoare a învăţării nesupervizate. 10

12 Capitolul 2 Metode de detectare a valorilor discordante bazate pe abordarea funcţiilor nucleu Problema detectării valorilor discordante este de mare actualitate în numeroase domenii printre care detectarea fraudei în site-urile de licitaţie şi identificarea subiecţilor discordanţi în studiile de bioechivalenţă. Capitolul este organizat în şase secţiuni. În Secţiunea 2.1 descriu metoda de detectare a valorilor discordante pe care am propus-o pentru identificarea comportamentului de fraudă în site-urile de licitaţie. În Secţiunea 2.2 propun o nouă metodă de detectare a valorilor discordante bazată pe o extindere a curbelor Andrews, numită metoda EAC, în contextul studiilor de bioechivalenţă. De asemenea, în Secţiunea 2.3 realizez un studiu de simulare având ca scop analiza performanţelor metodei propuse în Secţiunea 2.2. În Secţiunea 2.4 propun o generalizare a metodei EAC şi prezint câteva rezultate experimentale obţinute pe seturi de date reale din domeniul farmaceutic. În Secţiunea 2.5, studiez proprietăţile spaţiului funcţiilor Andrews şi respectiv ale spaţiului funcţiilor Andrews extinse folosind abordarea funcţiilor nucleu. Ultima secţiune conţine o discuţie referitoare la metodele prezentate în acest capitol. Rezultatele prezentate în acest capitol au fost diseminate în lucrările [Almendra, Roman (Mogoş) (2011b)] (Secţiunea 2.1), [Mogoş (Roman) (2012)] (Secţiunile 2.2 şi 2.3) şi [Mogoş (Roman), Sandulovici (2012)] (Secţiunea 2.4). 11

13 2.1 Utilizarea tehnicilor de analiză exploratorie a datelor în identificarea indivizilor suspecţi în site-urile de licitaţie Problema studiată poate fi formulată precum urmează: pornind de la o mulţime de învăţare (formată dintr-o mulţime de antrenare asociată datelor normale şi o mulţime de test conţinând date discordante în raport cu datele mulţimii de antrenare) ne propunem să determinăm structura datelor de antrenare pe baza căreia să clasificăm datele din setul de test. Mai exact, vrem să decidem dacă datele din setul de test prezintă aceeaşi structură ca datele de antrenare sau nu. Cadrul ilustrat anterior reprezintă o formalizare a unei probleme de detectare a profilelor vânzătorilor suspecţi, suspendaţi din site-ul de licitaţie MercadoLivre. Din datele publice de pe acest site s-a extras un eşantion de de vânzători care aveau conturile suspendate şi dintre aceştia au fost selectaţi în mod aleator 119 pentru o verificare şi etichetare manuală pe baza a 22 de caracteristici privind comportamentul fraudulos al vânzătorilor, conform [Almendra, Roman (Mogoş) (2011b)]. Metoda pe care o propun, pentru rezolvarea acestei probleme, extinde demersul tehnicilor de analiză exploratorie a datelor prin investigarea utilizării curbelor Andrews în detectarea automată a valorilor discordante. Abordarea mea poate fi sintetizată astfel: se translatează un model vizual - un tub - într-o reprezentare matematică, care poate fi folosită în identificarea algoritmică a observaţiilor discordante. Studiul urmează paradigma clasificării într-o singură clasă în care indivizii normali sunt folosiţi pentru antrenarea clasificatorului, care ulterior va fi testat pe datele discordante. Am tratat această problemă în contextul clasificării într-o singură clasă, în detrimentul cadrului clasificării binare, deoarece identificarea unor exemple de indivizi suspecţi reprezentative este dificilă. S-a stabilit că numărul indivizilor suspecţi este foarte mic comparativ cu cel al indivizilor normali (indivizii suspecţi reprezintă mai puţin de 2% în cazul studiat) Tehnica de analiză exploratorie a datelor - Curbele Andrews Pentru a evidenţia structurile existente în date prin reprezăntări grafice putem translata datele multidimensionale iniţiale într-un spaţiu de funcţii, numite curbe Andrews [Andrews (1972)]. Astfel, fiecărui punct de forma x = (x 1, x 1,, x n ) i se asociază o curbă definită prin seria Fourier: f x (t) = x 1 / 2 + x 2 sin t + x 3 cos t + x 4 sin 2t + x 5 cos 2t + (2.1.1) unde t aparţine intervalului [ π, π]. 12

14 2.1.2 Descrierea metodei de detectare a valorilor aberante Descriere succintă a procedurii Procedura propusă poate fi descrisă prin următorii paşi: 1. Se estimează structura curbelor Andrews de antrenare definind tubul minim obţinut astfel încât majoritatea curbelor de antrenare să aparţină tubului. Pentru o vizualizare grafică poate fi consultată Figura Se consideră că o curbă este discordantă dacă aceasta nu respectă structura obţinută la Pasul 1, în sensul că o curbă este discordantă dacă şi numai dacă curba conţine puncte situate în exteriorul marginilor care delimitează tubul a) b) Figura 2.1: Reprezentarea tubului: a) culoarea roşie frontierele tubului şi culoarea neagră curbele normale; b) culoarea roşie frontierele tubului şi culoarea neagră exemplu de curbă discordantă. După aceea, voi clasifica curbele Andrews de test, în concordanţă cu algoritmul propus mai sus şi în funcţie de definiţia noţiunii de valoare aberantă indicată în subsecţiunea următoare, şi voi estima precizia algoritmului de detectare a valorilor aberante prin frecvenţa relativă a curbelor de testare discordante detectate. O vizualizare grafică a metodei este furnizată în Figura 2.2. Metoda empirică pentru detectarea curbelor Andrews discordante În cele ce urmează voi detalia metoda de identificare a valorilor aberante pe care am denumit-o metoda empirică pentru detectarea curbelor Andrews discordante. 13

15 Andrews curve t Figura 2.2: Reprezentarea datelor folosind curbele Andrews. Notaţii: culoarea neagră indivizii normali, culoarea albastră indivizii suspecţi, culoarea roşie frontierele tubului. Fie x o observaţie arbitrar fixată din mulţimea de învăţare (formată din mulţimea de antrenare şi mulţimea de testare), notată cu S. Consider ca mulţime de antrenare, S train (respectiv, mulţime de test, S test ), mulţimea punctelor curbelor asociate datelor din mulţimea de antrenare (respectiv, mulţimea de test). Algoritmul conţine doi paşi: 1. Definirea tubului: pentru fiecare t aparţinând intervalului curbelor {C x } x Strain, se calculează valoarea minimă şi respectiv maximă a şirului depinzând de punctele x ale mulţimii de antrenare, {f x (t)} x Strain. Astfel, se vor obţine curbele de frontieră care delimitează curbele de antrenare. Cele două curbe de frontieră (curba superioară şi curba inferioară) determină tubul definit de setul de antrenare. Curba de frontieră superioară este dată prin: iar cea inferioară prin f xj (t) = max x {f x(t) x S train } (2.1.2) f xi (t) = min x {f x (t) x S train } (2.1.3) unde prin S train am notat mulţimea de antrenare. 2. Se obţine eticheta datelor de test pe baza următoarei definiţii a noţiunii de 14

16 valoare aberantă: Spunem că o curbă C x corespunzătoare datei iniţiale x este discordantă dacă există t 0 [ π, π] astfel încât punctul f x (t 0 ) al curbei nu aparţine tubului definit la Pasul Rezultate experimentale Am testat metoda propusă pe un set de date real din domeniul detectării fraudei în site-urile de licitaţie. şi am obţinut rezultate pozitive privind acurateţea de detectare a vânzătorilor suspecţi de fraudă. De asemenea, am demonstrat stabilitatea scorului de detectare a fraudei de 79.37%, în sensul independenţei de dimensiunea tubului, considerând abordarea validării încrucişate pornind de la toate curbele de antrenare. 2.2 Metodă de detectare a valorilor discordante în studiile de bioechivalenţă bazată pe o extindere a curbelor Andrews (Metoda EAC) În contextul studiilor de bioechivalenţă, o valoare discordantă este definită ca fiind un subiect (pacient) cu o observaţie extremă ( având o valoare foarte ridicată sau foarte scăzută) pentru o anumită formulare [Chow, Tse (1990)]. Cel mai utilizat model statistic pentru compararea bioechivalenţei dintre două formulări ale unui medicament pare a fi modelul crossover cu g secvenţe de formulări administrate în p intervale diferite de timp. Acest model este cunoscut sub numele de modelul crossover g p. În studiile de bioechivalenţă, procedurile de detectare a valorilor discordante se bazează în general pe teste statistice. Din [Ramsay, Elkum (2005)] deducem că testul statistic numit distanţa estimaţiilor propus în [Chow, Tse (1990)], furnizează cele mai bune rezultate referitoare la detectarea valorilor discordante în studiile de bioechivalenţă în ipoteza că efectul perioadei şi efectul formulării sunt nule în modelul crossover. O abordare mai puţin studiată pentru detectarea valorilor discordante în studiile clinice este utilizarea tehnicilor de analiză exploratorie a datelor (AED). Pentru rezolvarea problemei detectării valorilor discordante, propun folosirea tehnicii curbelor Andrews [Andrews (1972)]. Studii similare privind acest subiect pot fi consultate în [Enăchescu, Enăchescu (2009)] şi [Rasheed et al. (2011)]. În această secţiune voi extinde abordarea bazată pe curbe Andrews pentru detectarea valorilor discordante, propunând, alături de posibilitatea de interpretare vizuală a rezultatelor, o justificare matematică (din punct de vedere statistic) a regulii de decizie. În plus, această nouă abordare poate fi utilizată pentru detectarea automată a observaţiilor discordante. 15

17 2.2.1 Descrierea modelului Fie Y ijk variabila răspuns a subiectului i în perioada k pentru formularea j (de exemplu, aria de sub curba concentraţiei de sânge). Consider cazul special al modelului de bioechivalenţă crossover în care se presupune că nu există efectele de perioadă şi de formulare: unde µ este media totală; Y ij = µ + S i + e ij, j = 1,..., f; i = 1,..., N (2.2.1) S i este efectul aleator al subiectului i, iar e ijk reprezintă eroarea aleatoare (intra-subiect) a observaţiei Y ijk. Modelul prezintă următoarele ipoteze: 1. Variabilele aleatoare {S i } sunt independente şi distribuite normal cu media 0 şi dispersia σ 2 s. 2. Variabilele aleatoare {e ijk } sunt independente şi distribuite normal cu media 0 şi dispersia σ 2 e. 3. Variabilele aleatoare {S i } si {e ijk } sunt mutual independente Testul statistic distanţa estimaţiilor Testul distanţa estimaţiilor (ED) reprezintă o metodă bazată pe un test statistic dezvoltat în [Chow, Tse (1990)] pentru detectarea valorilor discordante în seturi de date care verifică ipotezele modelului crossover Prezentarea metodei EAC Metoda propusă în această subsecţiune combină tehnica curbelor Andrews cu o abordare statistică pentru clasificarea automată a datelor, pornind de la modelul de bioechivalenţă (2.2.1). Curbele Andrews extinse Pornind de la definiţia curbelor Andrews, pentru a mai bună învăţare a ratei de schimbare a curbei, consider funcţia de scufundare definită astfel: φ : x = (x 1, x 2,..., x n ) R n φ (x) = g x ( ) (2.2.2) unde funcţia g x ( ) : [ π, π] R dată de expresia g x (t) = x 1 cos t x 2 sin t + 2x 3 cos 2t 2x 4 sin 2t +... (2.2.3) 16

18 reprezintă o formă modificată a derivatei curbei Andrews. Descrierea metodei Presupun că datele Y i = (Y i1, Y i2,..., Y if ) T, i = 1,..., N sunt generate folosind o distribuţie normală, conform modelului (2.2.1). Paşii algoritmului de detectare a valorilor discordante sunt descrişi în cele ce urmează: Pasul 1: Pentru a elimina zgomotul nedorit din date şi pentru a obţine o mulţime de antrenare care să poată fi folosită pentru estimarea parametrilor modelului (precum media şi dispersia), consider o procedură iniţială de detectare a valorilor discordante: 1a) Mai întâi, se elimină corelaţia dintre variabile folosind următoarea transformare introdusă în metoda projection pursuit [Martinez, Martinez (2002)]. Consider tranformarea definită prin: φ 1 : Y i = (Y i1, Y i2,..., Y if ) T φ 1 (Y i ) =Λ 1/2 Q T (Y i µ1 f ), i = 1,..., N (2.2.4) unde coloanele matricei ortonormale Q sunt vectorii proprii ai matricei Σ şi Λ este matricea diagonală a valorilor proprii corespunzătoare. Notez Z i = Λ 1/2 Q T (Y i µ1 f ). Din [Văduva (1970)] şi faptul că Σ este pozitiv definită rezultă că vectorul aleator multidimensional Z i = (Z i1, Z i2,..., Z if ) T, pentru orice i = 1,..., N, este distribuit normal cu media 0 f (vectorul f 1 - dimensional ce conţine doar valoarea 0) şi matricea de covarianţă este matricea identitate f f - dimensională I f. Înlocuiesc în formulele anterioare media µ1 f şi matricea de covarianţă Σ cu estimatorii EVM. 1b) Pasul 1a) are scopul de a normaliza observaţia Y i = (Y i1, Y i2,..., Y if ) T. De aceea, se poate introduce următoarea definiţie a unei date discordante în funcţie de acelaşi prag. Definiţia este corectă pentru f = 2 (cazul pe care îl voi testa). Dacă se lucrează cu date multidimensionale (f > 2), mai întâi trebuie proiectate datele întrun spaţiu 2 - dimensional, folosind, spre exemplu, abordarea metodei projection pursuit [Martinez, Martinez (2002)] şi apoi se poate aplica regula prezentată mai jos. Definiţia Spunem că o dată Z i este o observaţie discordantă dacă şi numai dacă Z i 2 > (2 log (20)) 1/2, unde 2 reprezintă norma euclidiană şi pragul R = (2 log (20)) 1/2 este ales astfel încât, cu o probabilitate de 0.95, un punct dintr-o distribuţie gaussiană să aparţină bilei centrate în origine şi de rază R. Am considerat această metodă ca o procedură iniţială pentru detectarea valorilor discordante pentru că am observat că nu reuşeşte să discrimineze cu exactitate între 17

19 datele afectate de zgomot normal distribuite şi alte date extreme. De aceea, în această primă fază, am exclus toate datele discordante (distribuite normal sau nu). Pasul 2: Normalizez datele iniţiale prin aplicarea transformării de la Pasul 1a), dar de această dată folosind estimatorii pentru medie şi matrice de covarianţă calculaţi pe multimea de selecţie obţinută prin eliminarea observaţiilor discordante conform cu regula prezentată la Pasul 1b). Pasul 3: Fie X i = (X i1, X i2,..., X if ) T, i = 1,..., N datele obţinute după transformarea aplicată la Pasul 2). Translatez aceste date folosind scufundarea φ : X i = (X i1, X i2,..., X if ) T R n φ (X i ) = g Xi ( ), i = 1,..., N (2.2.5) Pasul 4: Acest pas descrie metoda automată pe care o propun pentru detectarea valorilor discordante, pornind de la reprezentarea datelor prin curbe discretizate. Algoritmul utilizează o abordare statistică pentru detectarea valorilor discordante bazată pe următoarea presupunere [Chandola et al. (2009)]: Datele reprezentate normal apar în regiunile cele mai probabile ale unui model statistic, în timp ce valorile discordante apar în regiunile cele mai puţin probabile ale modelului statistic. Mai departe, arăt cum se poate aplica tehnica de vizualizare box plots pentru detectarea curbelor Andrews discordante. Din Pasul 2 rezultă că datele X i = (X i1, X i2,..., X if ) T, i = 1,..., N sunt distribuite normal cu media 0 f şi matricea de covarianţă I f. Aceasta implică faptul că variabilele {X ij } j=1,...,f sunt identic şi independent distribuite pentru orice i = 1,..., N. De aici rezultă că pentru orice t apartinând intervalului curbei C Xi pentru orice i = 1,..., N, mulţimea de selecţie {g Xi (t)} i=1,...,n este formată din date având aceeaşi distribuţie normală. Rezultă că, pentru fiecare t se pot estima cuartila inferioară Q lo (t), cuartile superioară Q up (t) şi intervalul inter-cuartilic definit prin IQR (t) = Q up (t) Q lo (t) folosind inversa unei funcţii de distribuţie normală. Estimez parametrii distribuţiei normale folosind observaţiile de selecţie {g Xi (t)} i=1,...,n dintre care au fost eliminate cele corespunzătoare datelor iniţiale clasificate ca discordante la Pasul 1b). În continuare, definesc noţiunea de valoare discordantă după cum urmează: Definiţia Spunem că o curbă C X, care corespunde datelor iniţiale X, este discordantă dacă există t 0 [ π, π] astfel încât punctul g X (t 0 ) al curbei nu aparţine intervalului I(t 0 ) = [Q lo (t 0 ) 1.5 IQR (t 0 ), Q up (t 0 ) IQR (t 0 )]. Coeficientul intervalului inter-cuartilic IQR de 1.5 este ales astfel încât, o dată generată conform reparţiei normale, cu o probabilitate de 0.993, să nu aparţină 18

20 intervalului I = [Q lo 1.5 IQR, Q up IQR], unde Q lo, Q up şi IQR = Q up Q lo sunt cuartila inferioară teoretică, cuartila superioară teoretică şi respectiv intervalul inter-cuartilic asociat distribuţiei. 2.3 Evaluarea performanţelor metodei EAC pe baza unui studiu de simulare Pentru a evalua performanţa metodei propuse de mine în Subsecţiunea 2.2.3, prin comparaţie cu performanţa testului statistic distanţa estimaţiilor, realizez un studiu de simulare inspirat din [Ramsay, Elkum (2005)]. În acest sens, pentru fiecare metodă estimez abilitatea acesteia de detectare a valorilor discordante şi eroarea ei de misclasificare pentru mai multe seturi de date generate aleator. În plus, extind studiul iniţial care consta în analiza unor seturi de date care conţin o singură o valoare discordantă la analiza unor seturi de date conţinând mai multe valori discordante (am considerat două valori discordante într-un set de date). În cel de al doilea caz, analizez două categorii de seturi de date: cu valori discordante având acelaşi grad de discrepanţă şi cu valori discordante de magnitudini diferite Setarea parametrilor modelului Parametrii modelului folosit pentru generarea mulţimii de selecţie sunt următorii: 1) Coeficientul de varianţă intra-subiect, notat cu CV 2) Raportul dintre dispersia inter - subiecţi şi dispersia intra-subiect. 3) Dimensiunea mulţimii de selecţie. 4) Coeficientul de discrepanţă a valorilor discordante, Q. Procedura de simulare poate fi descrisă precum urmează. Pentru fiecare combinaţie a celor patru parametri introduşi anterior, generez 100 de seturi de date independente. Apoi, aplic metodele (testul distanţei estimaţiilor şi metoda EAC) pe aceste seturi de date şi verific dacă procedurile clasifică un subiect cu adevărat discordant ca fiind un individ discordant, iar un subiect obişnuit ca fiind un individ normal. După aceea, estimez acurateţea detectării valorilor discordante folosind ca măsuri frecvenţa relativă a subiecţilor discordanţi detectaţi ca fiind discordanţi şi procentul de subiecţi misclasificaţi (subiecţi normali, detectaţi ca fiind discordanţi) Rezultate experimentale În această secţiune sunt prezentate resultatele experimentale obţinute de metoda EAC (prezentată în Subsecţiunea 2.2.3) şi de testul statistic distanţa estimaţiilor, folosind studiul de simulare descris mai sus. Fiecare dintre aceste metode utilizează o abordare statistică care depinde de un prag care corespunde nivelului de semnificaţie a testului sau probabilităţii de a obţine o eroare de Tip I. Scopul nivelului de semnificaţie este de a furniza o măsură a încrederii în rezultatele indicate de 19

21 testele statistice şi indirect controlează numărul de instanţe clasificate ca discordante [Chandola et al. (2009)]. Compar aceste metode pentru mai multe nivele de semnificaţie α: 0.007, şi respectiv Am ales aceste nivele de semnificaţie astfel încât să se obţină erori mici de misclasificare empirică. Astfel, în metoda bazată pe curbele Andrews (EAC) pragurile asociate acestor nivele de semnificaţie sunt deduse considerând coeficientul intervalului inter - cuartilic IQR cu valorile 1.5, 1.7 şi respectiv 2. Clasificatorul bazat pe distanţa estimaţiilor (ED) depinde de cuantila nivelului de semnificaţie α, χ 2 3 (α). Consider cuantilele corespunzătoare nivelele de semnificaţie α indicate mai sus. Introduc următoarele notaţii: Q: coeficientul de discrepanţă a valorilor discordante definit la Pasul 4 în studiul de simulare (Q = 0 corespunde unor date care nu sunt influenţate de zgomot). P M: Q = 0: estimatorul probabilităţii de misclasificare (definit ca frecvenţa relativă a datelor normale reale prezise ca date discordante, calculată pe 900 de seturi de date, obţinută pentru Q = 0). P D: Q = i (i = 3, 5 şi 10): estimatorul probabilităţii de detectare a valorilor discordante cu coeficientul de discrepanţă Q = i (definit ca frecvenţa relativă a datelor discordante reale prezise ca date discordante pentru fiecare coeficient de discrepanţă Q = 3, 5 şi 10). Analiza rezultatelor obţinute pentru fiecare dintre situaţiile studiate (o valoare discordantă în setul de date sau două valori discordante în setul de date) şi pentru fiecare dintre nivelele de semnificaţie sunt prezentate în cele ce urmează. 1. Seturi de date care conţin o singură dată discordantă Din rezultatele referitoare la detectarea valorilor discordante pentru seturi de date care conţin o singură dată discordantă se constată că ambele metode obţin performanţe foarte bune în detectarea valorilor discordante (chiar şi pentru date discordante cu un coeficient de discrepanţă mic, Q = 3) cu o eroare mică de misclasificare. După o analiză detaliată a acestor rezultate se poate concluziona că metoda EAC propusă de mine are performanţe mai bune decât metoda ED pentru fiecare coeficient de discrepanţă. De asemenea, eroarea de misclasificare pentru metoda EAC este mai mică decat eroarea de misclasificare obţinută de metoda ED. O observaţie interesantă este aceea că rezultatele celor două metode nu sunt semnificativ diferite în cazul în care dimensiunea mulţimii de selecţie este mare. De aici putem deduce că cele două metode sunt adecvate pentru detectarea valorilor discordante atât pentru mulţimi de selectie de dimensiuni mari, cât şi pentru mulţimi de selecţie de dimensiuni mici. 2. Seturi de date care conţin două valori discordante Uneori, prezenţa unei valori discordante într-un set de date poate ascunde prezenţa altor valori discordante. Acest fapt este numit efectul de mascare al metodei. Ţinând cont de acest lucru, studiez această situaţie, prin introducerea a două valori discordante în seturile de date. La subpunctele 2.1 şi 2.2 sunt analizate două tipuri 20

22 de valori discordante: cu acelaşi coeficient de discrepanţă, respectiv cu coeficienţi diferiţi de discrepanţă Valori discordante cu acelaşi coeficient de discrepanţă Rezultatele obţinute arată că metoda EAC furnizează rezultate foarte bune şi superioare celor obţinute de metoda ED. De aici, se poate deduce că metoda propusă de mine este adecvată şi pentru detectarea a mai mult de o valoare discordantă Valori discordante cu coeficienţi diferiţi de discrepanţă Analizez toate combinaţiile de coeficienţi de discrepanţă diferiţi pentru mulţimi de selecţie cu dimensiunile 12, 24 şi 36 şi nivelul de semnificaţie α = În Tabelul 2.1 se notează cu Q 1 coeficientul de discrepanţă a uneia dintre valorile discordante şi cu Q 2 coeficientul de discrepanţă a celeilalte valori discordante. Tabela 2.1: Rezultatele referitoare la detectarea valorilor discordante pentru seturi de date care conţin două valori discordante cu coeficienţi de discrepanţă diferiţi Coeficientul Metoda PM: PD: PD: PD: de discrepanţă Q1 = 0 Q1 = 3 Q1 = 5 Q1 = 10 Q2 = 3 ED EAC Q2 = 5 ED EAC Q2 = 10 ED EAC Similar cu studiul prezentat la subpunctul 2.1, Tabelul 2.1 arată că metoda EAC obţine rezultate bune şi pentru detectarea valorilor discordante cu coeficienţi de discrepanţă diferiţi. Pe de altă parte, rezultatele arată că metoda ED nu este adecvată pentru acest tip de problemă. Am considerat că valorile discordante apar în formularea de test. De asemenea, am studiat situaţia în care valoarea de discrepanţă este adăugată răspunsului formulării de referinţă a unui subiect şi răspunsului formularii de test a celuilalt subiect din acelaşi set de date. Am obţinut că rezultatele se menţin şi în acest caz. În Figura 2.3 prezint abilitatea de detectare vizuală oferită de metoda mea prin intermediul unei imagini grafice. Aceste curbe reprezentate prin linie întreruptă arată limitele curbelor normale, calculate în Pasul 4 al algoritmului meu pe baza intervalului inter - cuartilic. Se poate observa din figură că setul de date ilustrat conţine două valori discordante. Una dintre valorile discordante are coeficientul de discrepanţă Q = 10, iar cealaltă valoare discordantă are coeficientul de discrepanţă Q = 5. 21

23 150 a) 6 b) Curbele Andrews extinse Curbele Andrews extinse t t Figura 2.3: Reprezentarea datelor prin curbele Andrews extinse: a) pentru datele iniţiale; b) pentru datele normalizate (folosind Pasul 2 din Subsecţiunea 2.2.3) 2.4 O generalizare a metodei EAC. Aplicaţii în detectarea valorilor discordante în domeniul farmaceutic Principala caracteristică a generalizării propuse în această secţiune (metoda GenEAC) este aceea că nu necesită informaţie apriori referitoare la distribuţia datelor. Ilustrez abilitatea metodei pe două seturi de date din domeniul farmaceutic Descrierea metodei În general, nu există informaţii privind distribuţia datelor. De aceea, pornind de la metoda EAC prezentată în Subsecţiunea 2.2.3, propun o generalizare a acesteia prin eliminarea ipotezei de normalitate a datelor. Utilizând notaţiile din Secţiunea 2.2, noua metodă are următoarea formă: Pasul 1 - Pasul 3: Aceşti paşi sunt identici cu cei ai metodei EAC; Pasul 4: În acest pas este descrisă abordarea statistică pe care o propun pentru detectarea automată a subiecţilor discordanţi, pornind de la reprezentarea datelor prin curbe discretizate: Definiţia Spunem că un punct X ce are asociată curba C X este un subiect discordant dacă există t 0 [ π, π] astfel încât punctul g X (t 0 ) al curbei nu aparţine intervalului I(ɛ) = [ µ (t 0 ) σ (t 0 ) / ɛ, µ (t 0 ) + σ (t 0 ) / ɛ ], (2.4.1) unde µ ( ) reprezintă curba medie a curbelor corespunzătoare datelor de selecţie, σ ( ) curba deviaţiei standard a curbelor asociate datelor de selecţie (calculată pe 22

24 mulţimea de selecţie din Pasul 2) şi ɛ este un prag setat cu o valoare suficient de mică Rezultate experimentale Generalizarea propusă în această secţiune (metoda GenEAC) este aplicată în domeniul farmaceutic. FDA (Food and Drug Administration) menţionează că o definiţie statistică pentru noţiunea de valoare discordantă este într-un anumit fel arbitrară, depinzând de studiul clinic specific [FDA (1999)]. Identificarea clară a unei valori particulare ca valoare discordantă este mai convingătoare atunci când este justificată atât medical cât şi statistic, iar atunci contextul medical va defini în general acţiunea potrivită [FDA (1998)]. Metoda GenEAC este aplicată pentru detectarea subiecţilor discordanţi în seturi de date asociate formulărilor pentru pentoxifilină şi rifampicină. Rezultatele obţinute sunt pozitive în concordanţă cu viziunea farmacocinetică. Am realizat, de asemenea, un studiu comparativ între rezultatele obţinute pentru seturile de date pentoxifilină şi rifampicină folosind reprezentarea datelor bazată pe curbe Andrews şi respectiv pe curbele Andrews extinse propuse de mine. Pentru setul de date rifampicină, algoritmul arată că, în cazul utilizării curbelor Andrews extinse, coeficientul de încredere, de forma 1 ɛ, este mai mare de 99% şi este mai bun decât cel obţinut de curbele Andrews (o valoare mai mică de 99%). Coeficientul de încredere exprimă gradul de încredere în rezultatele referitoare la detectarea valorilor discordante. De asemenea, pentru setul de date pentoxifilină, ambele modalităţi de reprezentare a datelor au acelaşi coeficient de încredere de 97%. 2.5 Formalizarea abordării bazate pe curbele Andrews în contextul funcţiilor nucleu Consider aplicaţiile de scufundare, definite prin: φ : x R n φ(x) = f x ( ) C n, (2.5.1) unde f x ( ) : [ π, π] R reprezintă curba Andrews asociată punctului x R n, iar prin C n am notat mulţimea curbelor Andrews corespunzătoare vectorilor de dimensiune n şi φ e : x R n φ e (x) = g x ( ) C n e, (2.5.2) unde g x ( ) : [ π, π] R reprezintă curba Andrews extinsă asociată punctului x R n, propusă în ecuaţia (2.2.3) a Secţiunii 2.2.3, iar Ce n este mulţimea curbelor Andrews extinse corespunzătoare vectorilor de dimensiune n. Consider spaţiul vectorial L 2 ([ π, π]) al funcţiilor de pătrat integrabile pe mulţimea 23

25 compactă [ π, π]: L 2 ([ π, π]) = {f f(x) 2 dx < }. (2.5.3) [ π,π] cu definiţiile de aditivitate şi multiplicativitate induse de spaţiul de funcţii şi produsul scalar definit prin f, g = [ π,π] f(x)g(x)dx, f, g L 2 ([ π, π]). (2.5.4) Se arată cu uşurinţă că C n şi Ce n sunt subspaţii vectoriale ale spaţiului vectorial L 2 ([ π, π]). Mai mult, în spaţiul vectorial de funcţii Andrews cu produsul scalar definit în ecuaţia (2.5.4), produsul scalar dintre două funcţii Andrews se poate scrie ca produsul scalar uzual al datelor iniţiale corespunzătoare (modulo constanta π), adică: f x, f z = π x, z x, z R n. (2.5.5) Deducem de aici faptul că spaţiul de funcţii Andrews poate fi introdus în abordarea funcţiilor nucleu ca fiind un spaţiu de caracteristici definit de funcţia nucleu: k(x, z) = φ(x), φ(z) = π x, z x, z R n. (2.5.6) Având în vedere proprietăţile funcţiilor sinus şi cosinus: π π π π π π π π π π sin αt cos βt = 0, α, β N sin αt sin βt = 0, α, β N, α β cos αt cos βt = 0, α, β N, α β (sin αt) 2 = 0, α N (cos βt) 2 = 0, β N 24

26 produsul scalar dintre două funcţii Andrews extinse devine g x ( ), g z ( ) = π π g x (t)g z (t)dt = = π π (x 1 cos t x 2 sin t + 2x 3 cos 2t 2x 4 sin 2t +...) (2.5.7) (z 1 cos t z 2 sin t + 2z 3 cos 2t 2z 4 sin 2t +...) dt = = π (x 1 z 1 + x 2 z x 3 z x 4 z x 5 z x 6 z ) Mai mult, ecuaţia (2.5.7) se poate scrie g x ( ), g z ( ) = π x, z A (2.5.8) unde x, z A = xaz T este un produs scalar pe spaţiul iniţial definit de matricea simetrică şi pozitiv definită, A, dată prin A = n/2 2 (2.5.9) unde n/2 reprezintă partea întreagă superioară a valorii n/2. Astfel, am arătat că spaţiul de funcţii Andrews extinse poate fi descris ca un spaţiu de caracteristici definit de funcţia nucleu: k e (x, z) = φ e (x), φ e (z) = π x, z A x, z R n (2.5.10) unde matricea A a fost definită în ecuaţia (2.5.9). 2.6 Discuţie Metodele din acest capitol propun soluţii automate pentru detectarea indivizilor suspecţi de fraudă în site-urile de licitaţie şi respectiv, a subiecţilor discordanţi din studiile de bioechivalenţă. Metodele dezvoltate au fost testate pe seturi de date reale şi s-au obţinut rezultate pozitive. Pentru metoda din Secţiunea 2.1, rezultatele indică faptul că procedura bazată pe curbele Andrews este adecvată rezolvării problemei de identificare a fraudei, furnizând o precizie de aproximativ 80%. 25

Titlul lucrării propuse pentru participarea la concursul pe tema securității informatice

Titlul lucrării propuse pentru participarea la concursul pe tema securității informatice Titlul lucrării propuse pentru participarea la concursul pe tema securității informatice "Îmbunătăţirea proceselor şi activităţilor educaţionale în cadrul programelor de licenţă şi masterat în domeniul

More information

ISBN-13:

ISBN-13: Regresii liniare 2.Liniarizarea expresiilor neliniare (Steven C. Chapra, Applied Numerical Methods with MATLAB for Engineers and Scientists, 3rd ed, ISBN-13:978-0-07-340110-2 ) Există cazuri în care aproximarea

More information

Reţele Neuronale Artificiale în MATLAB

Reţele Neuronale Artificiale în MATLAB Reţele Neuronale Artificiale în MATLAB Programul MATLAB dispune de o colecţie de funcţii şi interfeţe grafice, destinate lucrului cu Reţele Neuronale Artificiale, grupate sub numele de Neural Network Toolbox.

More information

Reflexia şi refracţia luminii. Aplicaţii. Valerica Baban

Reflexia şi refracţia luminii. Aplicaţii. Valerica Baban Reflexia şi refracţia luminii. Aplicaţii. Sumar 1. Indicele de refracţie al unui mediu 2. Reflexia şi refracţia luminii. Legi. 3. Reflexia totală 4. Oglinda plană 5. Reflexia şi refracţia luminii în natură

More information

Semnale şi sisteme. Facultatea de Electronică şi Telecomunicaţii Departamentul de Comunicaţii (TC)

Semnale şi sisteme. Facultatea de Electronică şi Telecomunicaţii Departamentul de Comunicaţii (TC) Semnale şi sisteme Facultatea de Electronică şi Telecomunicaţii Departamentul de Comunicaţii (TC) http://shannon.etc.upt.ro/teaching/ssist/ 1 OBIECTIVELE CURSULUI Disciplina îşi propune să familiarizeze

More information

Modalitǎţi de clasificare a datelor cantitative

Modalitǎţi de clasificare a datelor cantitative Modalitǎţi de clasificare a datelor cantitative Modul de stabilire a claselor determinarea pragurilor minime şi maxime ale fiecǎrei clase - determinǎ modul în care sunt atribuite valorile fiecǎrei clase

More information

Structura și Organizarea Calculatoarelor. Titular: BĂRBULESCU Lucian-Florentin

Structura și Organizarea Calculatoarelor. Titular: BĂRBULESCU Lucian-Florentin Structura și Organizarea Calculatoarelor Titular: BĂRBULESCU Lucian-Florentin Chapter 3 ADUNAREA ȘI SCĂDEREA NUMERELOR BINARE CU SEMN CONȚINUT Adunarea FXP în cod direct Sumator FXP în cod direct Scăderea

More information

Procesarea Imaginilor

Procesarea Imaginilor Procesarea Imaginilor Curs 11 Extragerea informańiei 3D prin stereoviziune Principiile Stereoviziunii Pentru observarea lumii reale avem nevoie de informańie 3D Într-o imagine avem doar două dimensiuni

More information

GHID DE TERMENI MEDIA

GHID DE TERMENI MEDIA GHID DE TERMENI MEDIA Definitii si explicatii 1. Target Group si Universe Target Group - grupul demografic care a fost identificat ca fiind grupul cheie de consumatori ai unui brand. Toate activitatile

More information

MS POWER POINT. s.l.dr.ing.ciprian-bogdan Chirila

MS POWER POINT. s.l.dr.ing.ciprian-bogdan Chirila MS POWER POINT s.l.dr.ing.ciprian-bogdan Chirila chirila@cs.upt.ro http://www.cs.upt.ro/~chirila Pornire PowerPoint Pentru accesarea programului PowerPoint se parcurg următorii paşi: Clic pe butonul de

More information

Subiecte Clasa a VI-a

Subiecte Clasa a VI-a (40 de intrebari) Puteti folosi spatiile goale ca ciorna. Nu este de ajuns sa alegeti raspunsul corect pe brosura de subiecte, ele trebuie completate pe foaia de raspuns in dreptul numarului intrebarii

More information

ARBORI AVL. (denumiti dupa Adelson-Velskii si Landis, 1962)

ARBORI AVL. (denumiti dupa Adelson-Velskii si Landis, 1962) ARBORI AVL (denumiti dupa Adelson-Velskii si Landis, 1962) Georgy Maximovich Adelson-Velsky (Russian: Гео ргий Макси мович Адельсо н- Ве льский; name is sometimes transliterated as Georgii Adelson-Velskii)

More information

Metrici LPR interfatare cu Barix Barionet 50 -

Metrici LPR interfatare cu Barix Barionet 50 - Metrici LPR interfatare cu Barix Barionet 50 - Barionet 50 este un lan controller produs de Barix, care poate fi folosit in combinatie cu Metrici LPR, pentru a deschide bariera atunci cand un numar de

More information

Auditul financiar la IMM-uri: de la limitare la oportunitate

Auditul financiar la IMM-uri: de la limitare la oportunitate Auditul financiar la IMM-uri: de la limitare la oportunitate 3 noiembrie 2017 Clemente Kiss KPMG in Romania Agenda Ce este un audit la un IMM? Comparatie: audit/revizuire/compilare Diferente: audit/revizuire/compilare

More information

Metoda BACKTRACKING. prof. Jiduc Gabriel

Metoda BACKTRACKING. prof. Jiduc Gabriel Metoda BACKTRACKING prof. Jiduc Gabriel Un algoritm backtracking este un algoritm de căutare sistematică și exhausivă a tuturor soluțiilor posibile, dintre care se poate alege apoi soluția optimă. Problemele

More information

2. Setări configurare acces la o cameră web conectată într-un router ZTE H218N sau H298N

2. Setări configurare acces la o cameră web conectată într-un router ZTE H218N sau H298N Pentru a putea vizualiza imaginile unei camere web IP conectată într-un router ZTE H218N sau H298N, este necesară activarea serviciului Dinamic DNS oferit de RCS&RDS, precum și efectuarea unor setări pe

More information

REVISTA NAŢIONALĂ DE INFORMATICĂ APLICATĂ INFO-PRACTIC

REVISTA NAŢIONALĂ DE INFORMATICĂ APLICATĂ INFO-PRACTIC REVISTA NAŢIONALĂ DE INFORMATICĂ APLICATĂ INFO-PRACTIC Anul II Nr. 7 aprilie 2013 ISSN 2285 6560 Referent ştiinţific Lector univ. dr. Claudiu Ionuţ Popîrlan Facultatea de Ştiinţe Exacte Universitatea din

More information

Versionare - GIT ALIN ZAMFIROIU

Versionare - GIT ALIN ZAMFIROIU Versionare - GIT ALIN ZAMFIROIU Controlul versiunilor - necesitate Caracterul colaborativ al proiectelor; Backup pentru codul scris Istoricul modificarilor Terminologie și concepte VCS Version Control

More information

Textul si imaginile din acest document sunt licentiate. Codul sursa din acest document este licentiat. Attribution-NonCommercial-NoDerivs CC BY-NC-ND

Textul si imaginile din acest document sunt licentiate. Codul sursa din acest document este licentiat. Attribution-NonCommercial-NoDerivs CC BY-NC-ND Textul si imaginile din acest document sunt licentiate Attribution-NonCommercial-NoDerivs CC BY-NC-ND Codul sursa din acest document este licentiat Public-Domain Esti liber sa distribui acest document

More information

La fereastra de autentificare trebuie executati urmatorii pasi: 1. Introduceti urmatoarele date: Utilizator: - <numarul dvs de carnet> (ex: "9",

La fereastra de autentificare trebuie executati urmatorii pasi: 1. Introduceti urmatoarele date: Utilizator: - <numarul dvs de carnet> (ex: 9, La fereastra de autentificare trebuie executati urmatorii pasi: 1. Introduceti urmatoarele date: Utilizator: - (ex: "9", "125", 1573" - se va scrie fara ghilimele) Parola: -

More information

Ghid identificare versiune AWP, instalare AWP şi verificare importare certificat în Store-ul de Windows

Ghid identificare versiune AWP, instalare AWP şi verificare importare certificat în Store-ul de Windows Ghid identificare versiune AWP, instalare AWP 4.5.4 şi verificare importare certificat în Store-ul de Windows Data: 28.11.14 Versiune: V1.1 Nume fişiser: Ghid identificare versiune AWP, instalare AWP 4-5-4

More information

INSTRUMENTE DE MARKETING ÎN PRACTICĂ:

INSTRUMENTE DE MARKETING ÎN PRACTICĂ: INSTRUMENTE DE MARKETING ÎN PRACTICĂ: Marketing prin Google CUM VĂ AJUTĂ ACEST CURS? Este un curs util tuturor celor implicați în coordonarea sau dezvoltarea de campanii de marketingși comunicare online.

More information

Aspecte controversate în Procedura Insolvenţei şi posibile soluţii

Aspecte controversate în Procedura Insolvenţei şi posibile soluţii www.pwc.com/ro Aspecte controversate în Procedura Insolvenţei şi posibile soluţii 1 Perioada de observaţie - Vânzarea de stocuri aduse în garanţie, în cursul normal al activității - Tratamentul leasingului

More information

Metoda de programare BACKTRACKING

Metoda de programare BACKTRACKING Metoda de programare BACKTRACKING Sumar 1. Competenţe............................................ 3 2. Descrierea generală a metodei............................. 4 3......................... 7 4. Probleme..............................................

More information

Excel Advanced. Curriculum. Școala Informală de IT. Educație Informală S.A.

Excel Advanced. Curriculum. Școala Informală de IT. Educație Informală S.A. Excel Advanced Curriculum Școala Informală de IT Tel: +4.0744.679.530 Web: www.scoalainformala.ro / www.informalschool.com E-mail: info@scoalainformala.ro Cuprins 1. Funcții Excel pentru avansați 2. Alte

More information

D în această ordine a.î. AB 4 cm, AC 10 cm, BD 15cm

D în această ordine a.î. AB 4 cm, AC 10 cm, BD 15cm Preparatory Problems 1Se dau punctele coliniare A, B, C, D în această ordine aî AB 4 cm, AC cm, BD 15cm a) calculați lungimile segmentelor BC, CD, AD b) determinați distanța dintre mijloacele segmentelor

More information

INFORMAȚII DESPRE PRODUS. FLEXIMARK Stainless steel FCC. Informații Included in FLEXIMARK sample bag (article no. M )

INFORMAȚII DESPRE PRODUS. FLEXIMARK Stainless steel FCC. Informații Included in FLEXIMARK sample bag (article no. M ) FLEXIMARK FCC din oțel inoxidabil este un sistem de marcare personalizată în relief pentru cabluri și componente, pentru medii dure, fiind rezistent la acizi și la coroziune. Informații Included in FLEXIMARK

More information

Dispozitive Electronice şi Electronică Analogică Suport curs 02 Metode de analiză a circuitelor electrice. Divizoare rezistive.

Dispozitive Electronice şi Electronică Analogică Suport curs 02 Metode de analiză a circuitelor electrice. Divizoare rezistive. . egimul de curent continuu de funcţionare al sistemelor electronice În acest regim de funcţionare, valorile mărimilor electrice ale sistemului electronic sunt constante în timp. Aşadar, funcţionarea sistemului

More information

Universitatea Lucian Blaga din Sibiu Facultatea de inginerie Hermann Oberth Catedra de Calculatoare şi automatizări

Universitatea Lucian Blaga din Sibiu Facultatea de inginerie Hermann Oberth Catedra de Calculatoare şi automatizări Universitatea Lucian Blaga din Sibiu Facultatea de inginerie Hermann Oberth Catedra de Calculatoare şi automatizări Dezvoltarea unei ontologii de domeniu (Support Vector Machine versus Bayes Naive) Referat

More information

NOTE PRIVIND MODELAREA MATEMETICĂ ÎN REGIM CVASI-DINAMIC A UNEI CLASE DE MICROTURBINE HIDRAULICE

NOTE PRIVIND MODELAREA MATEMETICĂ ÎN REGIM CVASI-DINAMIC A UNEI CLASE DE MICROTURBINE HIDRAULICE NOTE PRIVIND MODELAREA MATEMETICĂ ÎN REGIM CVASI-DINAMIC A UNEI CLASE DE MICROTURBINE HIDRAULICE Eugen DOBÂNDĂ NOTES ON THE MATHEMATICAL MODELING IN QUASI-DYNAMIC REGIME OF A CLASSES OF MICROHYDROTURBINE

More information

SISTEME INTELIGENTE DE SUPORT DECIZIONAL. Ș.l.dr.ing. Laura-Nicoleta IVANCIU. Curs 7 Sisteme inteligente de suport decizional bazate pe RNA

SISTEME INTELIGENTE DE SUPORT DECIZIONAL. Ș.l.dr.ing. Laura-Nicoleta IVANCIU. Curs 7 Sisteme inteligente de suport decizional bazate pe RNA SISTEME INTELIGENTE DE SUPORT DECIZIONAL Ș.l.dr.ing. Laura-Nicoleta IVANCIU Curs 7 Sisteme inteligente de suport decizional bazate pe RNA Cuprins RNA pentru aproximare de funcții Clasificatori cu RNA Studii

More information

Managementul Proiectelor Software Metode de dezvoltare

Managementul Proiectelor Software Metode de dezvoltare Platformă de e-learning și curriculă e-content pentru învățământul superior tehnic Managementul Proiectelor Software Metode de dezvoltare 2 Metode structurate (inclusiv metodele OO) O mulțime de pași și

More information

Candlesticks. 14 Martie Lector : Alexandru Preda, CFTe

Candlesticks. 14 Martie Lector : Alexandru Preda, CFTe Candlesticks 14 Martie 2013 Lector : Alexandru Preda, CFTe Istorie Munehisa Homma - (1724-1803) Ojima Rice Market in Osaka 1710 devine si piata futures Parintele candlesticks Samurai In 1755 a scris The

More information

Mecanismul de decontare a cererilor de plata

Mecanismul de decontare a cererilor de plata Mecanismul de decontare a cererilor de plata Autoritatea de Management pentru Programul Operaţional Sectorial Creşterea Competitivităţii Economice (POS CCE) Ministerul Fondurilor Europene - Iunie - iulie

More information

ANTICOLLISION ALGORITHM FOR V2V AUTONOMUOS AGRICULTURAL MACHINES ALGORITM ANTICOLIZIUNE PENTRU MASINI AGRICOLE AUTONOME TIP V2V (VEHICLE-TO-VEHICLE)

ANTICOLLISION ALGORITHM FOR V2V AUTONOMUOS AGRICULTURAL MACHINES ALGORITM ANTICOLIZIUNE PENTRU MASINI AGRICOLE AUTONOME TIP V2V (VEHICLE-TO-VEHICLE) ANTICOLLISION ALGORITHM FOR VV AUTONOMUOS AGRICULTURAL MACHINES ALGORITM ANTICOLIZIUNE PENTRU MASINI AGRICOLE AUTONOME TIP VV (VEHICLE-TO-VEHICLE) 457 Florin MARIAŞIU*, T. EAC* *The Technical University

More information

Transmiterea datelor prin reteaua electrica

Transmiterea datelor prin reteaua electrica PLC - Power Line Communications dr. ing. Eugen COCA Universitatea Stefan cel Mare din Suceava Facultatea de Inginerie Electrica PLC - Power Line Communications dr. ing. Eugen COCA Universitatea Stefan

More information

SINGULAR PERTURBATION DETECTION USING WAVELET FUNCTION REPRESENTATION

SINGULAR PERTURBATION DETECTION USING WAVELET FUNCTION REPRESENTATION U.P.B. Sci. Bull., Series C, Vol. 7, No., 8 ISSN 454-34x SINGULAR PERTURBATION DETECTION USING WAVELET FUNCTION REPRESENTATION Dan OLARU, Mihai Octavian POPESCU Calitatea distribuţiei energiei electrice

More information

Documentaţie Tehnică

Documentaţie Tehnică Documentaţie Tehnică Verificare TVA API Ultima actualizare: 27 Aprilie 2018 www.verificaretva.ro 021-310.67.91 / 92 info@verificaretva.ro Cuprins 1. Cum funcţionează?... 3 2. Fluxul de date... 3 3. Metoda

More information

Prelucrarea numerică a semnalelor

Prelucrarea numerică a semnalelor Prelucrarea numerică a semnalelor Assoc.Prof. Lăcrimioara GRAMA, Ph.D. http://sp.utcluj.ro/teaching_iiiea.html 27 februarie 2017 Lăcrimioara GRAMA (sp.utcluj.ro) Prelucrarea numerică a semnalelor 27 februarie

More information

Grafuri bipartite. Lecție de probă, informatică clasa a XI-a. Mihai Bărbulescu Facultatea de Automatică și Calculatoare, UPB

Grafuri bipartite. Lecție de probă, informatică clasa a XI-a. Mihai Bărbulescu Facultatea de Automatică și Calculatoare, UPB Grafuri bipartite Lecție de probă, informatică clasa a XI-a Mihai Bărbulescu b12mihai@gmail.com Facultatea de Automatică și Calculatoare, UPB Colegiul Național de Informatică Tudor Vianu București 27 februarie

More information

Updating the Nomographical Diagrams for Dimensioning the Concrete Slabs

Updating the Nomographical Diagrams for Dimensioning the Concrete Slabs Acta Technica Napocensis: Civil Engineering & Architecture Vol. 57, No. 1 (2014) Journal homepage: http://constructii.utcluj.ro/actacivileng Updating the Nomographical Diagrams for Dimensioning the Concrete

More information

Olimpiad«Estonia, 2003

Olimpiad«Estonia, 2003 Problema s«pt«m nii 128 a) Dintr-o tabl«p«trat«(2n + 1) (2n + 1) se ndep«rteaz«p«tr«telul din centru. Pentru ce valori ale lui n se poate pava suprafata r«mas«cu dale L precum cele din figura de mai jos?

More information

Laborator 1. Programare declarativă. Programare logică. Prolog. SWI-Prolog

Laborator 1. Programare declarativă. Programare logică. Prolog. SWI-Prolog Laborator 1 Programare declarativă O paradigmă de programare în care controlul fluxului de execuție este lăsat la latitudinea implementării limbajului, spre deosebire de programarea imperativă în care

More information

INTEROGĂRI ÎN SQL SERVER

INTEROGĂRI ÎN SQL SERVER INTEROGĂRI ÎN SQL SERVER Principala operaţie efectuată într-o bază de date este operaţia de extragere a datelor, care se realizează cu ajutorul unei clauze SELECT. SELECT Clauza SELECT are o sintaxă foarte

More information

Drd. Ionela-Cătălina (ZAMFIR) TUDORACHE Scoala Doctorală de Cibernetică si Statistică Economică Academia de Studii Economice din Bucuresti

Drd. Ionela-Cătălina (ZAMFIR) TUDORACHE Scoala Doctorală de Cibernetică si Statistică Economică Academia de Studii Economice din Bucuresti Drd. Ionela-Cătălina (ZAMFIR) TUDORACHE Scoala Doctorală de Cibernetică si Statistică Economică Academia de Studii Economice din Bucuresti POT MODELELE ALTMAN SI KIDA IDENTIFICA STAREA DE FALIMENT PENTRU

More information

LINEAR VOLTAGE-TO-CURRENT CONVERTER WITH SMALL AREA

LINEAR VOLTAGE-TO-CURRENT CONVERTER WITH SMALL AREA BULETINUL INSTITUTULUI POLITEHNIC DIN IAŞI Publicat de Universitatea Tehnică Gheorghe Asachi din Iaşi Tomul LXI (LXV), Fasc. 1, 2015 Secţia ELECTROTEHNICĂ. ENERGETICĂ. ELECTRONICĂ LINEAR VOLTAGE-TO-CURRENT

More information

Propuneri pentru teme de licență

Propuneri pentru teme de licență Propuneri pentru teme de licență Departament Automatizări Eaton România Instalație de pompare cu rotire în funcție de timpul de funcționare Tablou electric cu 1 pompă pilot + 3 pompe mari, cu rotirea lor

More information

Mods euro truck simulator 2 harta romaniei by elyxir. Mods euro truck simulator 2 harta romaniei by elyxir.zip

Mods euro truck simulator 2 harta romaniei by elyxir. Mods euro truck simulator 2 harta romaniei by elyxir.zip Mods euro truck simulator 2 harta romaniei by elyxir Mods euro truck simulator 2 harta romaniei by elyxir.zip 26/07/2015 Download mods euro truck simulator 2 harta Harta Romaniei pentru Euro Truck Simulator

More information

Laborator 2 - Statistică descriptivă

Laborator 2 - Statistică descriptivă Laborator 2 - Statistică descriptivă Statistica descriptivă are rolul de a descrie trăsăturile principale ale unor eşantioane şi constă în determinarea unor măsuri simple şi analize grafice ale datelor

More information

Laborator 2. Definirea tablourilor şi a funcţiilor (în linia de comandă) în Matlab 7.0

Laborator 2. Definirea tablourilor şi a funcţiilor (în linia de comandă) în Matlab 7.0 Laborator Definirea tablourilor şi a funcţiilor (în linia de comandă) în Matlab 70 Bibliografie 1 NH Bingham, John M Fry, Regression Linear Models in Statistics, Springer, New York, 010 M Ghinea, V Fireţeanu,

More information

METODE FIZICE DE MĂSURĂ ŞI CONTROL NEDISTRUCTIV. Inspecţia vizuală este, de departe, cea mai utilizată MCN, fiind de obicei primul pas într-o

METODE FIZICE DE MĂSURĂ ŞI CONTROL NEDISTRUCTIV. Inspecţia vizuală este, de departe, cea mai utilizată MCN, fiind de obicei primul pas într-o Cuprins: 1. Introducere 2. Inspecţia vizuală 6. Testarea ultrasonică 7. Radiografia 3. Metoda lichidului penetrant 4. Inspecţia cu particule magnetice 5. Testarea folosind curenţii Eddy 1 Inspecţia vizuală

More information

Lucrare clarificatoare nr. 10 ELABORAREA ANALIZEI DE RISC ÎN CADRUL ANALIZEI COST-BENEFICIU A PROIECTELOR FINANŢATE DIN FEDR ŞI FC

Lucrare clarificatoare nr. 10 ELABORAREA ANALIZEI DE RISC ÎN CADRUL ANALIZEI COST-BENEFICIU A PROIECTELOR FINANŢATE DIN FEDR ŞI FC Lucrare clarificatoare nr. 10 ELABORAREA ANALIZEI DE RISC ÎN CADRUL ANALIZEI COST-BENEFICIU A PROIECTELOR FINANŢATE DIN FEDR ŞI FC Ianuarie 2012 Documentul a fost realizat de experţi care au participat

More information

10. Modelarea şi eliminarea zgomotelor din imaginile digitale

10. Modelarea şi eliminarea zgomotelor din imaginile digitale Procesarea Imaginilor - Laborator 0: Modelarea şi eliminarea zgomotelor din imagini 0. Modelarea şi eliminarea zgomotelor din imaginile digitale 0.. Introducere Zgomotul este o informaţie nedorită care

More information

PACHETE DE PROMOVARE

PACHETE DE PROMOVARE PACHETE DE PROMOVARE Școala de Vară Neurodiab are drept scop creșterea informării despre neuropatie diabetică și picior diabetic în rândul tinerilor medici care sunt direct implicați în îngrijirea și tratamentul

More information

9. Memoria. Procesorul are o memorie cu o arhitectură pe două niveluri pentru memoria de program și de date.

9. Memoria. Procesorul are o memorie cu o arhitectură pe două niveluri pentru memoria de program și de date. 9. Memoria Procesorul are o memorie cu o arhitectură pe două niveluri pentru memoria de program și de date. Primul nivel conține memorie de program cache (L1P) și memorie de date cache (L1D). Al doilea

More information

INFLUENŢA CÂMPULUI MAGNETIC ASUPRA DINAMICII DE CREŞTERE"IN VITRO" LA PLANTE FURAJERE

INFLUENŢA CÂMPULUI MAGNETIC ASUPRA DINAMICII DE CREŞTEREIN VITRO LA PLANTE FURAJERE INFLUENŢA CÂMPULUI MAGNETIC ASUPRA DINAMICII DE CREŞTERE"IN VITRO" LA PLANTE FURAJERE T.Simplăceanu, C.Bindea, Dorina Brătfălean*, St.Popescu, D.Pamfil Institutul Naţional de Cercetere-Dezvoltare pentru

More information

O abordare Data Mining pentru detectarea accesului neautorizat la baza de date.

O abordare Data Mining pentru detectarea accesului neautorizat la baza de date. O abordare Data Mining pentru detectarea accesului neautorizat la baza de date. 1. Introducere 2. Lucrări asemănătoare 3. Modelul de clasificare 4. Dependenţele intre date 4.1 Terminologia dependenţei

More information

CONSISTENŢA INTERNĂ A UNUI INSTRUMENT. O DECIZIE DIFICILĂ.

CONSISTENŢA INTERNĂ A UNUI INSTRUMENT. O DECIZIE DIFICILĂ. CONSISTENŢA INTERNĂ A UNUI INSTRUMENT. O DECIZIE DIFICILĂ. George Marian URSACHI Universitatea Alexandru Ioan Cuza din Iaşi Iaşi, România ursachi83@yahoo.com Ioana Alexandra URSACHI căs. HORODNIC Universitatea

More information

TEMĂ SPD 2017 MODEL 1

TEMĂ SPD 2017 MODEL 1 MODEL 1 Pe parcursul realizarii unui model de simulare a functionarii unui sistem de productie, se urmareste determinarea functiei de repartitie a numarului de piese prelucrate de catre o masina pe parcursul

More information

Evaluarea legaturilor dintre indicatorii proprietăţii utilizând metoda regresiei multiple

Evaluarea legaturilor dintre indicatorii proprietăţii utilizând metoda regresiei multiple Evaluarea legaturilor dintre indicatorii proprietăţii utilizând metoda regresiei multiple Prof.univ.dr. Constantin ANGHELACHE Conf.univ.dr. Elena BUGUDUI Lect.univ.dr. Florin Paul Costel LILEA Universitatea

More information

Tehnici nealeatoare de esantionare utilizate în practica statistica

Tehnici nealeatoare de esantionare utilizate în practica statistica 82 Revista Informatica Economica, nr. 2 (8)/200 Tehnici nealeatoare de esantionare utilizate în practica statistica Conf.dr. Tudorel ANDREI Catedra de Statistica si Previziune Economica, A.S.E. Bucuresti

More information

Proiectarea Sistemelor Software Complexe

Proiectarea Sistemelor Software Complexe Proiectarea Sistemelor Software Complexe Curs 3 Principii de Proiectare Orientată pe Obiecte Principiile de proiectare orientată pe obiecte au fost formulate pentru a servi ca reguli pentru evitarea proiectării

More information

În continuare vom prezenta unele dintre problemele de calcul ale numerelor Fibonacci.

În continuare vom prezenta unele dintre problemele de calcul ale numerelor Fibonacci. O condiţie necesară şi suficientă ca un număr să fie număr Fibonacci Autor: prof. Staicu Ovidiu Ninel Colegiul Economic Petre S. Aurelian Slatina, jud. Olt 1. Introducere Propuse de Leonardo Pisa în 1202,

More information

Platformă de e-learning și curriculă e-content pentru învățământul superior tehnic

Platformă de e-learning și curriculă e-content pentru învățământul superior tehnic Platformă de e-learning și curriculă e-content pentru învățământul superior tehnic Proiect nr. 154/323 cod SMIS 4428 cofinanțat de prin Fondul European de Dezvoltare Regională Investiții pentru viitorul

More information

R O M Â N I A CURTEA CONSTITUŢIONALĂ

R O M Â N I A CURTEA CONSTITUŢIONALĂ R O M Â N I A CURTEA CONSTITUŢIONALĂ Palatul Parlamentului Calea 13 Septembrie nr. 2, Intrarea B1, Sectorul 5, 050725 Bucureşti, România Telefon: (+40-21) 312 34 84; 335 62 09 Fax: (+40-21) 312 43 59;

More information

MODELUL UNUI COMUTATOR STATIC DE SURSE DE ENERGIE ELECTRICĂ FĂRĂ ÎNTRERUPEREA ALIMENTĂRII SARCINII

MODELUL UNUI COMUTATOR STATIC DE SURSE DE ENERGIE ELECTRICĂ FĂRĂ ÎNTRERUPEREA ALIMENTĂRII SARCINII MODELUL UNUI COMUTATOR STATIC DE SURSE DE ENERGIE ELECTRICĂ FĂRĂ ÎNTRERUPEREA ALIMENTĂRII SARCINII Adrian Mugur SIMIONESCU MODEL OF A STATIC SWITCH FOR ELECTRICAL SOURCES WITHOUT INTERRUPTIONS IN LOAD

More information

ACTA TECHNICA NAPOCENSIS

ACTA TECHNICA NAPOCENSIS 273 TECHNICAL UNIVERSITY OF CLUJ-NAPOCA ACTA TECHNICA NAPOCENSIS Series: Applied Mathematics, Mechanics, and Engineering Vol. 58, Issue II, June, 2015 SOUND POLLUTION EVALUATION IN INDUSTRAL ACTIVITY Lavinia

More information

CORELATII ÎNTRE PROPRIETATILE HÂRTIILOR COMPONENTE SI CALITATEA CARTONULUI ONDULAT. II

CORELATII ÎNTRE PROPRIETATILE HÂRTIILOR COMPONENTE SI CALITATEA CARTONULUI ONDULAT. II CORELATII ÎNTRE PROPRIETATILE HÂRTIILOR COMPONENTE SI CALITATEA CARTONULUI ONDULAT. II. INFLUENTA CALITATII CARTONULUI ONDULAT ASUPRA UNOR CARACTERISTICI ALE CUTIILOR CORRELATIONS BETWEEN PAPERS CHARACTERISTICS

More information

MANAGEMENTUL CALITĂȚII - MC. Proiect 5 Procedura documentată pentru procesul ales

MANAGEMENTUL CALITĂȚII - MC. Proiect 5 Procedura documentată pentru procesul ales MANAGEMENTUL CALITĂȚII - MC Proiect 5 Procedura documentată pentru procesul ales CUPRINS Procedura documentată Generalități Exemple de proceduri documentate Alegerea procesului pentru realizarea procedurii

More information

INPUT MODELLING USING STATISTICAL DISTRIBUTIONS AND ARENA SOFTWARE

INPUT MODELLING USING STATISTICAL DISTRIBUTIONS AND ARENA SOFTWARE Annals of the Academy of Romanian Scientists Online Edition Series on Engineering Sciences ISSN 2066 8570 Volume 7, Number 1/2015 63 INPUT MODELLING USING STATISTICAL DISTRIBUTIONS AND ARENA SOFTWARE Elena

More information

ARE THE STATIC POWER CONVERTERS ENERGY EFFICIENT?

ARE THE STATIC POWER CONVERTERS ENERGY EFFICIENT? ARE THE STATIC POWER CONVERTERS ENERGY EFFICIENT? Ion POTÂRNICHE 1,, Cornelia POPESC, Mina GHEAMALINGA 1 Corresponding member of the Academy of Technical Sciences of Romania ICPE ACTEL S.A. Abstract: The

More information

EXTRAGEREA INFORMAȚIEI DE PRIM- PLAN ÎN VIDEO- CONFERINȚE UTILIZÂND ANALIZA FLUXURILOR DE MIȘCARE

EXTRAGEREA INFORMAȚIEI DE PRIM- PLAN ÎN VIDEO- CONFERINȚE UTILIZÂND ANALIZA FLUXURILOR DE MIȘCARE EXTRAGEREA INFORMAȚIEI DE PRIM- PLAN ÎN VIDEO- CONFERINȚE UTILIZÂND ANALIZA FLUXURILOR DE MIȘCARE ( FOREGROUND EXTRACTION IN VIDEO CONFERENCES USING MOTION FLOW ANALYSIS ) Rezumatul tezei elaborată de

More information

earning every day-ahead your trust stepping forward to the future opcom operatorul pie?ei de energie electricã și de gaze naturale din România Opcom

earning every day-ahead your trust stepping forward to the future opcom operatorul pie?ei de energie electricã și de gaze naturale din România Opcom earning every day-ahead your trust stepping forward to the future opcom operatorul pie?ei de energie electricã și de gaze naturale din România Opcom RAPORT DE PIA?Ã LUNAR MARTIE 218 Piaţa pentru Ziua Următoare

More information

Generarea şi validarea numerelor prime mari

Generarea şi validarea numerelor prime mari Generarea şi validarea numerelor prime mari 1 Modalităţi de generare a numerelor prime mari Metoda cea mai naturală este de a genera aleator un număr n de mărime adecvată şi de a verifica dacă acesta este

More information

Spectral Graph Matching, Learning, and Inference for Computer Vision

Spectral Graph Matching, Learning, and Inference for Computer Vision Scurt rezumat al tezei de doctorat cu titlul (in limba engleza): Spectral Graph Matching, Learning, and Inference for Computer Vision Marius Dan Leordeanu Numar de Raport Tehnic: CMU-RI-TR-09-27 Conferita

More information

Lucrarea de laborator nr. 4

Lucrarea de laborator nr. 4 Metode merice - Lucrarea de laborator 4 Lucrarea de laborator nr. 4 I. Scopul lucrării Elemente de programare în MAPLE II. III. Conţinutul lucrării 1. Atribuirea. Decizia. Structuri repetitive. 2. Proceduri

More information

Restaurarea frontierelor unei imagini: abordare genetica

Restaurarea frontierelor unei imagini: abordare genetica 8 Revista Informatica Economica, nr./999 Restaurarea frontierelor unei imagini: abordare genetica Prof.dr. Luminita STATE, Universitatea Pitesti Conf.dr. Doina FUSARU, Universitatea Spiru Haret Bucuresti

More information

PROCEDURA PRIVIND DECONTURILE. 2. Domeniu de aplicare Procedura se aplică în cadrul Universităţii Tehnice Cluj-Napoca

PROCEDURA PRIVIND DECONTURILE. 2. Domeniu de aplicare Procedura se aplică în cadrul Universităţii Tehnice Cluj-Napoca PROCEDURA PRIVIND DECONTURILE 1. Scpul: Descrie structura si mdul de elabrare si prezentare a prcedurii privind dcumentele care trebuie intcmite si cursul acestra, atunci cind persana efectueaza un decnt.

More information

Generatorul cu flux axial cu stator interior nemagnetic-model de laborator.

Generatorul cu flux axial cu stator interior nemagnetic-model de laborator. Generatorul cu flux axial cu stator interior nemagnetic-model de laborator. Pentru identificarea performanţelor la funţionarea în sarcină la diferite trepte de turaţii ale generatorului cu flux axial fară

More information

DECLARAȚIE DE PERFORMANȚĂ Nr. 101 conform Regulamentului produselor pentru construcții UE 305/2011/UE

DECLARAȚIE DE PERFORMANȚĂ Nr. 101 conform Regulamentului produselor pentru construcții UE 305/2011/UE S.C. SWING TRADE S.R.L. Sediu social: Sovata, str. Principala, nr. 72, judetul Mures C.U.I. RO 9866443 Nr.Reg.Com.: J 26/690/1997 Capital social: 460,200 lei DECLARAȚIE DE PERFORMANȚĂ Nr. 101 conform Regulamentului

More information

METODE INTELIGENTE DE REZOLVARE A PROBLEMELOR REALE. Laura Dioşan Tema 4

METODE INTELIGENTE DE REZOLVARE A PROBLEMELOR REALE. Laura Dioşan Tema 4 METODE INTELIGENTE DE REZOLVARE A PROBLEMELOR REALE Laura Dioşan Tema 4 Text mining Task-uri Regăsirea informaţiei Clasificarea automată a textelor Text mining Task-uri Regăsirea informaţiei Clasificarea

More information

Decizia manageriala în conditii de risc. Profilul riscului.

Decizia manageriala în conditii de risc. Profilul riscului. Revista Informatica Economica nr.2 (4)/2000 97 Decizia manageriala în conditii de risc. Profilul riscului. Conf.dr. Florica LUBAN Catedra de Eficienta Economica, A.S.E. Bucuresti În lucrare se arata cum

More information

Update firmware aparat foto

Update firmware aparat foto Update firmware aparat foto Mulţumim că aţi ales un produs Nikon. Acest ghid descrie cum să efectuaţi acest update de firmware. Dacă nu aveţi încredere că puteţi realiza acest update cu succes, acesta

More information

Metodologie de comparare a reţelelor 4G prin evaluarea QoS-ului total

Metodologie de comparare a reţelelor 4G prin evaluarea QoS-ului total Metodologie de comparare a reţelelor 4G prin evaluarea QoS-ului total Ing. Simona Livia Constantin 1, Ing. Mihaela Tache 1 Cuvinte cheie: QoS, 4G, AHP, GRA, Reţele heterogene. Rezumat. Tema acestui articol

More information

CONTRIBUŢII PRIVIND MANAGEMENTUL CALITĂȚII PROIECTULUI ÎN INDUSTRIA AUTOMOTIVE

CONTRIBUŢII PRIVIND MANAGEMENTUL CALITĂȚII PROIECTULUI ÎN INDUSTRIA AUTOMOTIVE UNIVERSITATEA POLITEHNICA TIMIŞOARA Școala Doctorală de Studii Inginerești Ing. Daniel TIUC CONTRIBUŢII PRIVIND MANAGEMENTUL CALITĂȚII PROIECTULUI ÎN INDUSTRIA AUTOMOTIVE Teză destinată obținerii titlului

More information

EN teava vopsita cu capete canelate tip VICTAULIC

EN teava vopsita cu capete canelate tip VICTAULIC ArcelorMittal Tubular Products Iasi SA EN 10217-1 teava vopsita cu capete canelate tip VICTAULIC Page 1 ( 4 ) 1. Scop Documentul specifica cerintele tehnice de livrare pentru tevi EN 10217-1 cu capete

More information

Baze de date distribuite și mobile

Baze de date distribuite și mobile Universitatea Constantin Brâncuşi din Târgu-Jiu Facultatea de Inginerie Departamentul de Automatică, Energie şi Mediu Baze de date distribuite și mobile Lect.dr. Adrian Runceanu Curs 3 Model fizic şi model

More information

METODE DE EVALUARE A IMPACTULUI ASUPRA MEDIULUI ŞI IMPLEMENTAREA SISTEMULUI DE MANAGEMENT DE MEDIU

METODE DE EVALUARE A IMPACTULUI ASUPRA MEDIULUI ŞI IMPLEMENTAREA SISTEMULUI DE MANAGEMENT DE MEDIU UNIVERSITATEA POLITEHNICA BUCUREŞTI FACULTATEA ENERGETICA Catedra de Producerea şi Utilizarea Energiei Master: DEZVOLTAREA DURABILĂ A SISTEMELOR DE ENERGIE Titular curs: Prof. dr. ing Tiberiu APOSTOL Fond

More information

Managementul referinţelor cu

Managementul referinţelor cu TUTORIALE DE CULTURA INFORMAŢIEI Citarea surselor de informare cu instrumente software Managementul referinţelor cu Bibliotecar Lenuţa Ursachi PE SCURT Este gratuit Poţi adăuga fişiere PDF Poţi organiza,

More information

Ghid de utilizare a Calculatorului valorii U

Ghid de utilizare a Calculatorului valorii U Ghid de utilizare a Calculatorului valorii U la Apelul de Propuneri de Proiecte Nr.3 pentru Instituțiile din Sectorul Public pentru investiții în Eficiență Energetică și Surse de Energie Regenerabilă Versiunea

More information

[HABILITATION THESIS] October, 2015 HABILITATION THESIS

[HABILITATION THESIS] October, 2015 HABILITATION THESIS HABILITATION THESIS ADVANCED APPROACHES ON FOOD SAFETY AND FUNCTIONALITY ABORDĂRI AVANSATE ASUPRA SIGURANȚEI ȘI FUNCȚIONALITĂȚII ALIMENTELOR Associate Professor Nicoleta STĂNCIUC Dunărea de Jos University

More information

Calculatoare Numerice II Interfaţarea unui dispozitiv de teleghidare radio cu portul paralel (MGSH Machine Guidance SHell) -proiect-

Calculatoare Numerice II Interfaţarea unui dispozitiv de teleghidare radio cu portul paralel (MGSH Machine Guidance SHell) -proiect- Universitatea Politehnica Bucureşti Facultatea de Automaticăşi Calculatoare Calculatoare Numerice II Interfaţarea unui dispozitiv de teleghidare radio cu portul paralel (MGSH Machine Guidance SHell) -proiect-

More information

LIDER ÎN AMBALAJE EXPERT ÎN SISTEMUL BRAILLE

LIDER ÎN AMBALAJE EXPERT ÎN SISTEMUL BRAILLE LIDER ÎN AMBALAJE EXPERT ÎN SISTEMUL BRAILLE BOBST EXPERTFOLD 80 ACCUBRAILLE GT Utilajul ACCUBRAILLE GT Bobst Expertfold 80 Aplicarea codului Braille pe cutii a devenit mai rapidă, ușoară și mai eficientă

More information

Detecţia regiunilor de interes în identificarea biometrică folosind caracteristicile urechii

Detecţia regiunilor de interes în identificarea biometrică folosind caracteristicile urechii Detecţia regiunilor de interes în identificarea biometrică folosind caracteristicile urechii Detecţia regiunilor de interes în identificarea biometrică folosind caracteristicile urechii Sorin SOVIANY 1,

More information

Lucrarea nr. 1 Statistică descriptivă (Excel)

Lucrarea nr. 1 Statistică descriptivă (Excel) Statistică multivariată Lucrarea nr. 1 Statistică descriptivă (Excel) A. Noţiuni teoretice Variabilă o caracteristică ale cărei valori se modifică după elementele studiate (este modelată printr-o variabilă

More information

The First TST for the JBMO Satu Mare, April 6, 2018

The First TST for the JBMO Satu Mare, April 6, 2018 The First TST for the JBMO Satu Mare, April 6, 08 Problem. Prove that the equation x +y +z = x+y +z + has no rational solutions. Solution. The equation can be written equivalently (x ) + (y ) + (z ) =

More information

EPIDEMIOLOGIE GENERALĂ. Dr. Cristian Băicuş Medicală Colentina, 2005

EPIDEMIOLOGIE GENERALĂ. Dr. Cristian Băicuş Medicală Colentina, 2005 EPIDEMIOLOGIE GENERALĂ Dr. Cristian Băicuş Medicală Colentina, 2005 metodologia cercetării (validitate) = EPIDEMIOLOGIA CLINICĂ cercetare clinică ŞI BIOSTATISTICA articol, prezentare evaluarea critică

More information

Optimizarea performanţelor sistemelor biometrice prin selecţia punctelor de operare în analiza ROC

Optimizarea performanţelor sistemelor biometrice prin selecţia punctelor de operare în analiza ROC Optimizarea performanţelor sistemelor biometrice prin selecţia punctelor de operare în analiza ROC Sorin SOVIANY 1, Sorin PUŞCOCI 1 Rezumat. Articolul prezintă un model practic pentru evaluarea şi optimizarea

More information

Solutii avansate pentru testarea si diagnoza masinilor industriale.

Solutii avansate pentru testarea si diagnoza masinilor industriale. Solutii avansate pentru testarea si diagnoza masinilor industriale 15 ani de activitate in domeniul procesarii numerice a semnalelor Solutii de inalta acuratete pentru analiza sunetelor, vibratiilor si

More information

Caracterizarea texturilor color pentru segmentarea imaginilor de psoriazis Color texture characterization for psoriasis image segmentation

Caracterizarea texturilor color pentru segmentarea imaginilor de psoriazis Color texture characterization for psoriasis image segmentation Investeşte în oameni! FONDUL SOCIAL EUROPEAN Programul Operaţional Sectorial Dezvoltarea Resurselor Umane 2007 2013 Axa prioritară 1 Educaţie şi formare profesională în sprijinul creşterii economice şi

More information