ROMÂNIA LQD REGRESSION FOR ROBUST FORECASTING OF STEEL CONSUMPTION IN ROMANIA

Similar documents
Procesarea Imaginilor

Titlul lucrării propuse pentru participarea la concursul pe tema securității informatice

Metrici LPR interfatare cu Barix Barionet 50 -

ISBN-13:

Subiecte Clasa a VI-a

D în această ordine a.î. AB 4 cm, AC 10 cm, BD 15cm

Reflexia şi refracţia luminii. Aplicaţii. Valerica Baban

Modalitǎţi de clasificare a datelor cantitative

Structura și Organizarea Calculatoarelor. Titular: BĂRBULESCU Lucian-Florentin

Olimpiad«Estonia, 2003

2. Setări configurare acces la o cameră web conectată într-un router ZTE H218N sau H298N

Auditul financiar la IMM-uri: de la limitare la oportunitate

Semnale şi sisteme. Facultatea de Electronică şi Telecomunicaţii Departamentul de Comunicaţii (TC)

Versionare - GIT ALIN ZAMFIROIU

Mecanismul de decontare a cererilor de plata

ARBORI AVL. (denumiti dupa Adelson-Velskii si Landis, 1962)

GHID DE TERMENI MEDIA

Textul si imaginile din acest document sunt licentiate. Codul sursa din acest document este licentiat. Attribution-NonCommercial-NoDerivs CC BY-NC-ND

Dispozitive Electronice şi Electronică Analogică Suport curs 02 Metode de analiză a circuitelor electrice. Divizoare rezistive.

Reţele Neuronale Artificiale în MATLAB

Preţul mediu de închidere a pieţei [RON/MWh] Cota pieţei [%]

REVISTA NAŢIONALĂ DE INFORMATICĂ APLICATĂ INFO-PRACTIC

Ghid identificare versiune AWP, instalare AWP şi verificare importare certificat în Store-ul de Windows

Aspecte controversate în Procedura Insolvenţei şi posibile soluţii

The First TST for the JBMO Satu Mare, April 6, 2018

earning every day-ahead your trust stepping forward to the future opcom operatorul pie?ei de energie electricã și de gaze naturale din România Opcom

The driving force for your business.

Mods euro truck simulator 2 harta romaniei by elyxir. Mods euro truck simulator 2 harta romaniei by elyxir.zip

Updating the Nomographical Diagrams for Dimensioning the Concrete Slabs

Arbori. Figura 1. struct ANOD { int val; ANOD* st; ANOD* dr; }; #include <stdio.h> #include <conio.h> struct ANOD { int val; ANOD* st; ANOD* dr; }

Evoluția pieței de capital din România. 09 iunie 2018

În continuare vom prezenta unele dintre problemele de calcul ale numerelor Fibonacci.

Analiza corelaţiei dintre PIB, consumul privat şi public prin regresie multiplă

Evaluarea legaturilor dintre indicatorii proprietăţii utilizând metoda regresiei multiple

Nume şi Apelativ prenume Adresa Număr telefon Tip cont Dobânda Monetar iniţial final

A NOVEL ACTIVE INDUCTOR WITH VOLTAGE CONTROLLED QUALITY FACTOR AND SELF-RESONANT FREQUENCY

Metoda de programare BACKTRACKING

La fereastra de autentificare trebuie executati urmatorii pasi: 1. Introduceti urmatoarele date: Utilizator: - <numarul dvs de carnet> (ex: "9",

SINGULAR PERTURBATION DETECTION USING WAVELET FUNCTION REPRESENTATION

ANTICOLLISION ALGORITHM FOR V2V AUTONOMUOS AGRICULTURAL MACHINES ALGORITM ANTICOLIZIUNE PENTRU MASINI AGRICOLE AUTONOME TIP V2V (VEHICLE-TO-VEHICLE)

9. Memoria. Procesorul are o memorie cu o arhitectură pe două niveluri pentru memoria de program și de date.

Excel Advanced. Curriculum. Școala Informală de IT. Educație Informală S.A.

CERERI SELECT PE MAI MULTE TABELE

SAG MITTIGATION TECHNICS USING DSTATCOMS

F. Radulescu. Curs: Utilizarea bazelor de date, anul IV C5.

INFLUENŢA CÂMPULUI MAGNETIC ASUPRA DINAMICII DE CREŞTERE"IN VITRO" LA PLANTE FURAJERE

CERERI SELECT PE O TABELA

2. In the pattern below, which number belongs in the box? 0,5,4,9,8,13,12,17,16, A 15 B 19 C 20 D 21

ARE THE STATIC POWER CONVERTERS ENERGY EFFICIENT?

INTEROGĂRI ÎN SQL SERVER

Metoda BACKTRACKING. prof. Jiduc Gabriel

Grafuri bipartite. Lecție de probă, informatică clasa a XI-a. Mihai Bărbulescu Facultatea de Automatică și Calculatoare, UPB

Laborator 2 - Statistică descriptivă

ACTA TECHNICA NAPOCENSIS

Procesarea Imaginilor - Laborator 5: Etichetarea componentelor conexe 1

Mircea Merca 1) Articol dedicat Prof. Dr. Ioan Tomescu la a 70-a aniversare

EVALUATION OF THE YARN QUALITY CHARACTERISTICS THROUGH SYNTHETIC INDICATORS

REZOLVAREA NUMERICĂ A ECUAŢIILOR CU DERIVATE PARŢIALE FOLOSIND METODA LINIILOR

Analiza corelaței dintre Produsul Intern Brut şi consumul final de energie electrică

MS POWER POINT. s.l.dr.ing.ciprian-bogdan Chirila

Tehnici nealeatoare de esantionare utilizate în practica statistica

ACTA TECHNICA NAPOCENSIS

PROCEDURA PRIVIND DECONTURILE. 2. Domeniu de aplicare Procedura se aplică în cadrul Universităţii Tehnice Cluj-Napoca

Lucrare clarificatoare nr. 10 ELABORAREA ANALIZEI DE RISC ÎN CADRUL ANALIZEI COST-BENEFICIU A PROIECTELOR FINANŢATE DIN FEDR ŞI FC

X-Fit S Manual de utilizare

Legea aplicabilă contractelor transfrontaliere

INPUT MODELLING USING STATISTICAL DISTRIBUTIONS AND ARENA SOFTWARE

Model statistico-econometric utilizat în analiza corelaţiei dintre Produsul Intern Brut şi Productivitatea Muncii

Update firmware aparat foto

RESEARCH CONCERNING THE INFLUENCE OF ANGLE OF FILING FROM THE KNIFE BLADES VINDROVERS ON THE MECHANICAL WORK ON CUTTING

DECLARAȚIE DE PERFORMANȚĂ Nr. 101 conform Regulamentului produselor pentru construcții UE 305/2011/UE

Transmiterea datelor prin reteaua electrica

MODELUL UNUI COMUTATOR STATIC DE SURSE DE ENERGIE ELECTRICĂ FĂRĂ ÎNTRERUPEREA ALIMENTĂRII SARCINII

INFORMAȚII DESPRE PRODUS. FLEXIMARK Stainless steel FCC. Informații Included in FLEXIMARK sample bag (article no. M )

Implicaţii practice privind impozitarea pieţei de leasing din România

USING SERIAL INDUSTRIAL ROBOTS IN CNC MILLING PROCESESS

Cristina ENULESCU * ABSTRACT

Metode de ierarhizare utilizate în analiza statistică a întreprinderilor mici şi mijlocii în profil regional

ADMITERE 2015 SUBIECTELE PROBELOR ŞI BAREMELE DE CORECTARE ŞI NOTARE PROFILUL MAIŞTRI MILITARI PROBA NR.1 TEST GRILĂ LA LIMBA ENGLEZĂ VARIANTA 2

CAIETUL DE SARCINI Organizare evenimente. VS/2014/0442 Euro network supporting innovation for green jobs GREENET

EFECTUL TRATĂRII SONICE ASUPRA MICROBIOLOGIEI APEI DE DUNĂRE

A Die-Linked Sequence of Dacian Denarii

(Text cu relevanță pentru SEE)

Propuneri pentru teme de licență

CONSISTENŢA INTERNĂ A UNUI INSTRUMENT. O DECIZIE DIFICILĂ.

Printesa fluture. Мобильный портал WAP версия: wap.altmaster.ru

STARS! Students acting to reduce speed Final report

INFLUENŢA CÂMPULUI MAGNETIC ASUPRA GERMINĂRII "IN VITRO" LA PLANTE FURAJERE

Fişa de îndeplinire a standardelor minimale stabilite de CNATDCU

EXPERIMENTAL RESULTS REGARDING STRUCTURAL RESPONSE OF BOLTED AND HYBRID CONNECTIONS FOR PULTRUDED ELEMENTS

METODE DE EVALUARE A IMPACTULUI ASUPRA MEDIULUI ŞI IMPLEMENTAREA SISTEMULUI DE MANAGEMENT DE MEDIU

METHODS AND PRINCIPLES OF OPTIMIZATION SPECIFIC TO THE DOMAIN OF EQUIPMENTS AND MANUFACTURING PROCESSES

STUDY EVOLUTION OF BIT B ERRORS AND ERRORS OF PACKAGES IN I

Prima. Evadare. Ac9vity Report. The biggest MTB marathon from Eastern Europe. 7th edi9on

Lucrarea de laborator nr. 4

Generatorul cu flux axial cu stator interior nemagnetic-model de laborator.

CORELATII ÎNTRE PROPRIETATILE HÂRTIILOR COMPONENTE SI CALITATEA CARTONULUI ONDULAT. II

Candlesticks. 14 Martie Lector : Alexandru Preda, CFTe

PARLAMENTUL EUROPEAN

METHODS AND PRINCIPLES OF OPTIMIZATION SPECIFIC TO THE DOMAIN OF EQUIPMENT AND MANUFACTURING PROCESSES

Transcription:

Lector univ. dr. Costin-Ciprian POPESCU E-mail: ciprian.popescu@csie.ase.ro Catedra de Matematica Academia de Studii Economice din Bucuresti UTILIZAREA REGRESIEI LQD PENTRU OBłINEREA UNEI PROGNOZE ROBUSTE PRIVIND CONSUMUL DE OłEL ÎN ROMÂNIA LQD REGRESSION FOR ROBUST FORECASTING OF STEEL CONSUMPTION IN ROMANIA Abstract. A mixed approach consisting in combining some clustering methods and a highly robust estimator is presented. On this basis, a more representational forecasting model can be developed. It is used in a numerical application for shaping a more realistic view of the future possibilities regarding steel consumption in our country. Key words: clustering,robust regression, LQD, forecasting. Clasificarea JEL : C0, C1, C3. 1. Introducere O problemă majoră în ceea ce priveşte regresia, este aceea a robusteńii unui estimator, adică a capacităńii acestuia de a nu fi influenńat semnificativ de valori atipice. De exemplu, una dintre cele mai utilizate metode, aceea a celor mai mici pătrate, este foarte sensibilă la astfel de valori, ea nefiind una robustă. În ultimele decenii, au fost dezvoltate metode robuste [1], cum ar fi: LMS (least median of squares) [9], LTS (least trimmed squares) [10], sau LQD (least quartile difference) []. După cum se arată şi în [1], cea din urmă se dovedeşte în multe cazuri mai performantă din punctul de vedere al robusteńii decât primele enumerate. Pentru a măsura robusteńea unui estimator, a fost introdus conceptul BP (breakdown point) [7], acesta reprezentând fracńiunea minimă de date (în număr de δ ) care trebuie alterate pentru a schimba estimarea finală într-un mod consistent. Practic, BP reprezintă pentru un estimator măsura rezistenńei sale la contaminare [11]. S-a demonstrat că, pentru n date inińiale, estimatorul celor mai mici pătrate are BP egal cu 1 / n ( δ = 1, deci o singură valoare atipică îl influenńează semnificativ) în timp ce LQD are δ = n / [1]. În lucrarea de fańă, va fi prezentată o interpretare şi o aplicańie a estimatorului LQD, pe baza rezultatelor de dualitate geometrică obńinute în [3] şi, mai ales, în [1]. Ca şi ceilalńi algoritmi robuşti, LQD pune totuşi o problemă care Ńine de complexitatea computańională, mai ales pentru mulńimi mari de date [8]. O modalitate de a diminua numărul acestora este aplicarea

Costin-Ciprian Popescu preliminară a unui algoritm de clustering, de exemplu metoda subtractivă [4]. În acest mod se poate obńine un estimator suficient de robust (fapt validat în aplicańia numerică) dar şi o diminuare a complexităńii computańionale.. Regresia de tip LQD Dacă q, i N, q, 1 i q 1, atunci q -cuantila de ordinul i [] a unei variabile aleatoare X, este un număr c i, ales astfel încât 1 1 ( X ci ) 1 iq, P( c ) iq P X i, (unde prin P s-a notat probabilitatea ). Există q 1 astfel de q -cuantile: c 1,, c q 1. Acestea nu sunt neapărat unic determinate. De exemplu, pentru q = se obńine -cuantila (mediana) iar pentru q = 4 se obńin 4 -cuantilele (cuartilele). Acestea din urmă sunt în număr de trei, a doua fiind egală cu mediana. Dacă se consideră variabilele aleatoare X 1,..., X n, care sunt apoi rearanjate în ordinea crescătoare a valorilor (realizate pe un eşantion), în forma X( 1 )... X( n) atunci X ( i) se numeşte statistica de ordin i [6]. Formularea inińială a regresiei LQD presupune stabilirea corespondenńei dintre valorile (în număr de n 3) obńinute experimental pentru două variabile X, Y şi punctele de coordonate ( ) i y i x,, i = 1, n. Estimatorul LQD presupune găsirea unei drepte de regresie de forma y = ax b, determinată conform etapelor de mai jos [1]. x,, se consideră eroarea Pentru un punct oarecare ( ) i y i i ( a, b) = y ax b ε. Panta dreptei LQD (notată cu â ) coincide cu panta dreptei care minimizează statistica de ordin unde [ ] { i, j= 1, n, i j} C h ( h = 1 ( n 3) ( a, b) ε i i ), corespunzătoare mulńimii de valori ε, ij ij < ( a b) = ε ij( a) = ε i ε j,. Parametrul b se determină egalându-l cu mediana med y ax ˆ i= 1 n, { } i i, unde valoarea lui â este cea găsită anterior []. Având ca bază rezultatele de dualitate geometrică [3], ce stabilesc o corespondenńă de tip punct-dreaptă în spańii duale, în [1], este propusă o soluńie de natură geometrică, aşa cum este arătat şi în continuare. Punctele ( ) i y i x,, i = 1, n din spańiul primal xoy, se transferă în C n

Utilizarea regresiei LQD pentru obńinerea unei prognoze robuste privind.. perechi de drepte de tipul ( ) formulele: unde d, ( i, j= 1, n, i< j ), din spańiul dual sot, după ij d ij dij xijs yij, i, dij xijs yij ( x y ) i x = y y. ij = xi x j, ij i j EcuaŃia unei drepte oarecare din sot va fi de tipul t = gs h. Problema LQD duală presupune găsirea unui punct ( s, tˆ) n C h α = C drepte verifică inegalitatea t ˆ > gsˆ h, y ˆ pentru care un număr de cu tˆ pozitiv şi minim. Punctele care verifică doar inegalitatea, sunt soluńii locale şi se numesc puncte de nivel α. CondiŃiile suplimentare puse asupra parametrului tˆ au ca rezultat selectarea soluńiei globale dintre cele locale. Modalitatea de aflare a lui â prin intermediul problemei duale a fost enunńată şi demonstrată în [1]. Rezultatele pot fi sintetizate în teorema următoare. Teoremă (stabilirea corespondenńei dintre soluńiile celor două probleme LQD). Dacă ( sˆ, tˆ) este soluńia problemei duale LQD, iar dreapta de regresie LQD în spańiul primal are ecuańia y= ax ˆ bˆ, atunci aˆ= sˆ, iar statistica de ordin corespunzătoare valorilor ( aˆ, b) de b. { i, j= 1, n, i j} ij < C h ε are valoarea tˆ, independent În cele ce urmează, pentru determinarea completă a dreptei LQD (în spańiul primal), se va lua bˆ egal cu valoarea cuartilei de ordinul doi calculată pentru y ax ˆ i=1 n. mulńimea { } i i, 3. Modelul mixt clustering-regresie. AplicaŃie numerică Consumul aparent de ońel brut, (exprimat în mii de tone), pe piańa din România, în perioada 1988-007 (sursa: World Steel Association: Steel Statistical Yearbok 1990, Steel Statistical Yearbok 000 şi Steel Statistical Yearbok 008 ), este dat în Tabelul 1.

Costin-Ciprian Popescu Tabelul 1: Consumul aparent de ońel brut în România Anul 1988 1989 1990 1991 199 Consumul 1061 107 8170 930 3446 Anul 1993 1994 199 1996 1997 Consumul 3070 340 380 400 390 Anul 1998 1999 000 001 00 Consumul 340 90 3100 3300 3440 Anul 003 004 00 006 007 Consumul 3730 3960 40 100 6110 Va fi utilizată metoda discutată anterior, în scopul obńinerii unei drepte de regresie care să facă posibilă conturarea unui model realist, util în analize/prognoze ulterioare. Datele din tabel pot fi privite ca fiind puncte în planul cartezian xoy : ( x y ) P i i, i (Fig. 1). Pentru a diminua numărul lor, fără alterarea semnificativă a tendinńelor de variańie, se poate aplica mai întâi o metodă de clustering, numită subtractivă (introdusă de Chiu, 1994). Scopul este obńinerea unui tipar relevant, bazat pe o mulńime de puncte reper ce are cardinalul mai mic decât mulńimea punctelor inińiale. Figura 1. Punctele de inińializare în spańiul primal

Utilizarea regresiei LQD pentru obńinerea unei prognoze robuste privind.. Aplicând deci metoda subtractivă, se obńin patru grupuri de date, cu centroizii 1988,1061 1991,930 Q = 1998,340, (Fig. ): Q 1 = P 1 ( ), Q = P 4 ( ), 3 P 11 ( ) Q = ( 00,40). 4 P 18 Figura. Datele inińiale şi centroizii Având acum ca bază de plecare punctele Q i ( i =1, 4 ), problema se poate translata din spańiul xoy în spańiul dual sot, prin construirea celor şase perechi de drepte de mai jos: d1 3s 6131 d13 10s 8611 d14 17s 7811,, d1 3s 6131, d13 10s 8611 d14 17s 7811 d3 7s 480 d4 14s 1680 d34 7s 800,, d3 7s 480. d4 14s 1680 d34 7s 800 În cazul de fańă, avem că n = 4 şi h = 3, deci prezintă interes punctele de nivel α = 9 ( C 4 C3 ). Punctele de nivel 9 conduc către linia poligonală a soluńiilor locale. Aceasta este determinată de vârfurile care se află la intersecńiile dreptelor: d, ( d 13,d 3), ( d ) 3,d 1, ( d ) 1,d 14, ( d ) 14,d 13, ( d ) 13,d 34, ( d ) 34,d 4, ( d ) 4,d 14, (,d ) 14 34 ( d ), ( d ), ( d ), ( ) d (Fig. 3). 34,d 3 3,d 4 4,d 1 1,d 3

Costin-Ciprian Popescu Figura 3. Imaginea centroizilor în spańiul dual. SoluŃiile locale şi cea globală. După efectuarea paşilor rămaşi, se găseşte că punctul de minim global în spańiul dual are coordonatele ( 10,1640). Aceasta înseamnă că a ˆ= 10. Mai departe, cuartila de ordinul doi (sau mediana) pentru mulńimea de valori { y ax ˆ i= 1, 4}= = Q i Q i {.06 10 },.448 10,.431 10,.448 10 este.448 10 (fiind egală şi cu media în cazul de fańă), deci b ˆ =.448 10. Atunci soluńia finală este dată de dreapta: d 1 : y= 10x.448 10. 4. CONCLUZII Pentru anul 008, consumul este de 800 tone (sursa: World Steel Association: Steel Statistical Yearbok 009 ), iar în anii 009 şi 010 consumul este de 70, respectiv 840 tone (conform datelor estimate din Capital ). Dacă se aplică metoda celor mai mici pătrate de exemplu, pentru datele precedente (în integralitatea lor, nesupuse diminuării numărului lor inińial ca urmare a extragerii de puncte reper), se obńine dreapta d : y= 4.09x 4.883 10, iar metoda celor mai mici pătrate aplicată doar centroizilor, conduce la rezultatul

Utilizarea regresiei LQD pentru obńinerea unei prognoze robuste privind.. d 3 : y= 393.89x 7.94 10 (Fig. 4). Se observă capacitatea de predicńie superioară a metodei propuse. Figura 4. Studiul comparativ al performanńei algoritmilor BIBLIOGRAFIE [1] Bernholt, T., Nunkesser, R., Schettlinger, K. (007), Computing the least quartile difference estimator in the plane, Comput. Statist. Data Anal., 763-77; [] Cenuşă, G., Săcuiu, I., Burlacu, V. (003), Teoria probabilităńilor şi statistică matematică, Ed. ASE Bucureşti; [3] Chazelle, B., Guibas, L. J., Lee, D. T. (198), The power of geometric duality, BIT, 76-90. [4] Chiu, S. (1994), Fuzzy model identification based on cluster estimation, Journal of Intelligent & Fuzzy Systems (3), 67-78; [] Croux, C., Rousseeuw, Hössjer, O. (1994), Generalized S-estimators, J. Amer. Statist. Assoc. 89, 171-181; [6] David, H. A., Nagaraja, H. N. (003), Order statistics, Third Edition, Wiley. [7] Donoho, P. Huber, P. (1983), The notion of breakdown point, in: P. Bickel, K. Doksum, J. Hodges (Eds.), A Festschrift for Erich L. Lehmann, Wadsworth, Belmont, CA;

Costin-Ciprian Popescu [8] Langerman S., Steiger, W., L. (003), The complexity of hyperplane depth in the plane, Discrete Comput. Geom. 30, 99-309. [9] Rousseeuw, P. J (1984), Least median of squares regression, J. Amer. Statist. Assoc. 79, 871-880; [10] Rousseeuw, P. J., Leroy, A. M. (1987), Robust regression and outlier detection, Wiley, N.Y. [11] Wilcox, R., R. (00), Introduction to robust estimation and hypothesis testing, Elsevier Academic Press, USA.