Procedee de eşantionare aplicate în cercetarea pieţei şi administrarea eficientă a afacerilor

Similar documents
Titlul lucrării propuse pentru participarea la concursul pe tema securității informatice

Reflexia şi refracţia luminii. Aplicaţii. Valerica Baban

Structura și Organizarea Calculatoarelor. Titular: BĂRBULESCU Lucian-Florentin

Modalitǎţi de clasificare a datelor cantitative

Procesarea Imaginilor

GHID DE TERMENI MEDIA

Subiecte Clasa a VI-a

Metrici LPR interfatare cu Barix Barionet 50 -

Auditul financiar la IMM-uri: de la limitare la oportunitate

Tehnici nealeatoare de esantionare utilizate în practica statistica

Semnale şi sisteme. Facultatea de Electronică şi Telecomunicaţii Departamentul de Comunicaţii (TC)

ARBORI AVL. (denumiti dupa Adelson-Velskii si Landis, 1962)

Versionare - GIT ALIN ZAMFIROIU

ISBN-13:

Aspecte controversate în Procedura Insolvenţei şi posibile soluţii

Mecanismul de decontare a cererilor de plata

CAIETUL DE SARCINI Organizare evenimente. VS/2014/0442 Euro network supporting innovation for green jobs GREENET

2. Setări configurare acces la o cameră web conectată într-un router ZTE H218N sau H298N

earning every day-ahead your trust stepping forward to the future opcom operatorul pie?ei de energie electricã și de gaze naturale din România Opcom

Testul t pentru eşantioane independente. M. Popa

Excel Advanced. Curriculum. Școala Informală de IT. Educație Informală S.A.

INSTRUMENTE DE MARKETING ÎN PRACTICĂ:

Dispozitive Electronice şi Electronică Analogică Suport curs 02 Metode de analiză a circuitelor electrice. Divizoare rezistive.

D în această ordine a.î. AB 4 cm, AC 10 cm, BD 15cm

Textul si imaginile din acest document sunt licentiate. Codul sursa din acest document este licentiat. Attribution-NonCommercial-NoDerivs CC BY-NC-ND

Preţul mediu de închidere a pieţei [RON/MWh] Cota pieţei [%]

CONSISTENŢA INTERNĂ A UNUI INSTRUMENT. O DECIZIE DIFICILĂ.

Software Process and Life Cycle

Lucrarea nr. 1 Statistică descriptivă (Excel)

Managementul Proiectelor Software Metode de dezvoltare

În continuare vom prezenta unele dintre problemele de calcul ale numerelor Fibonacci.

MS POWER POINT. s.l.dr.ing.ciprian-bogdan Chirila

Reţele Neuronale Artificiale în MATLAB

Metoda BACKTRACKING. prof. Jiduc Gabriel

Ghid identificare versiune AWP, instalare AWP şi verificare importare certificat în Store-ul de Windows

Metode cantitative de analiza in stiintele politice Suport curs Invatamant la Distanta

La fereastra de autentificare trebuie executati urmatorii pasi: 1. Introduceti urmatoarele date: Utilizator: - <numarul dvs de carnet> (ex: "9",

Olimpiad«Estonia, 2003

Tema seminarului: Analiza evolutiei si structurii patrimoniului

MANAGEMENTUL CALITĂȚII - MC. Proiect 5 Procedura documentată pentru procesul ales

The First TST for the JBMO Satu Mare, April 6, 2018

ANALIZA COSTURILOR DE PRODUCTIE IN CAZUL PROCESULUI DE REABILITARE A UNUI SISTEM RUTIER NERIGID

Candlesticks. 14 Martie Lector : Alexandru Preda, CFTe

Updating the Nomographical Diagrams for Dimensioning the Concrete Slabs

METODE FIZICE DE MĂSURĂ ŞI CONTROL NEDISTRUCTIV. Inspecţia vizuală este, de departe, cea mai utilizată MCN, fiind de obicei primul pas într-o

octombrie 2009 Sondaj naţional BENEFICIAR:

Metode de ierarhizare utilizate în analiza statistică a întreprinderilor mici şi mijlocii în profil regional

Statistică descriptivă Calculul parametrilor. Călinici Tudor 2015

INTEROGĂRI ÎN SQL SERVER

EPIDEMIOLOGIE GENERALĂ. Dr. Cristian Băicuş Medicală Colentina, 2005

Propuneri pentru teme de licență

REVISTA NAŢIONALĂ DE INFORMATICĂ APLICATĂ INFO-PRACTIC

MODELUL UNUI COMUTATOR STATIC DE SURSE DE ENERGIE ELECTRICĂ FĂRĂ ÎNTRERUPEREA ALIMENTĂRII SARCINII

Nume şi Apelativ prenume Adresa Număr telefon Tip cont Dobânda Monetar iniţial final

DECLARAȚIE DE PERFORMANȚĂ Nr. 101 conform Regulamentului produselor pentru construcții UE 305/2011/UE

Grafuri bipartite. Lecție de probă, informatică clasa a XI-a. Mihai Bărbulescu Facultatea de Automatică și Calculatoare, UPB

PROCEDURA PRIVIND DECONTURILE. 2. Domeniu de aplicare Procedura se aplică în cadrul Universităţii Tehnice Cluj-Napoca

ACTA TECHNICA NAPOCENSIS

Documentaţie Tehnică

INFORMAȚII DESPRE PRODUS. FLEXIMARK Stainless steel FCC. Informații Included in FLEXIMARK sample bag (article no. M )

Evaluarea acţiunilor

METODE DE EVALUARE A IMPACTULUI ASUPRA MEDIULUI ŞI IMPLEMENTAREA SISTEMULUI DE MANAGEMENT DE MEDIU

Raportul dintre cifra de afaceri si personalul din IMM Model de analiză

ANTICOLLISION ALGORITHM FOR V2V AUTONOMUOS AGRICULTURAL MACHINES ALGORITM ANTICOLIZIUNE PENTRU MASINI AGRICOLE AUTONOME TIP V2V (VEHICLE-TO-VEHICLE)

Evoluția pieței de capital din România. 09 iunie 2018

Biostatistica. Statistica aplicata in domeniul medicinei si biologiei

PROGNOZA ŞOMAJULUI ÎN ROMÂNIA PE TERMEN SCURT

Anexa 3 Criterii de prioritizare a investițiilor în infrastructura unităților de învățământ

1. Transferul de căldură printr-o nervură rectangulară

ÎMBUNĂTĂŢIREA CALITĂŢII VALORII STATISTICE CALCULATE ÎN DECLARAŢIA INTRASTAT ŞI ACTUALIZAREA COEFICIENTULUI CIF/FOB ÎN ROMÂNIA

Lucrare clarificatoare nr. 10 ELABORAREA ANALIZEI DE RISC ÎN CADRUL ANALIZEI COST-BENEFICIU A PROIECTELOR FINANŢATE DIN FEDR ŞI FC

XII. Cât de precisă este estimarea efectului tratamentului?

Laborator 2 - Statistică descriptivă

Evaluarea tipurilor de erori intr-un studiu stiintific

Evaluarea legaturilor dintre indicatorii proprietăţii utilizând metoda regresiei multiple

CORELATII ÎNTRE PROPRIETATILE HÂRTIILOR COMPONENTE SI CALITATEA CARTONULUI ONDULAT. II

SINGULAR PERTURBATION DETECTION USING WAVELET FUNCTION REPRESENTATION

Metodologie de comparare a reţelelor 4G prin evaluarea QoS-ului total

STUDIUL DE ANALIZĂ A COST-EFICACITĂŢII SERVICIILOR DE ASISTENŢĂ MEDICALĂ COMUNITARĂ DIN COMUNITĂŢILE ASISTATE PE ANUL 2010 ÎN JUDEŢUL SIBIU

STUDIUL DE AUDIENŢĂ RADIO (SAR)

Analiza corelaţiei dintre PIB, consumul privat şi public prin regresie multiplă

Utilizarea metodelor statistice în evaluarea riscului financiar

Arbori. Figura 1. struct ANOD { int val; ANOD* st; ANOD* dr; }; #include <stdio.h> #include <conio.h> struct ANOD { int val; ANOD* st; ANOD* dr; }

EN teava vopsita cu capete canelate tip VICTAULIC

NOTA: se vor mentiona toate bunurile aflate in proprietate, indiferent daca ele se afla sau nu pe teritoriul Romaniei la momentul declararii.

Intensitatea tehnologică a exporturilor în anul 2012

Mods euro truck simulator 2 harta romaniei by elyxir. Mods euro truck simulator 2 harta romaniei by elyxir.zip

AE Amfiteatru Economic recommends

9. Memoria. Procesorul are o memorie cu o arhitectură pe două niveluri pentru memoria de program și de date.

Lucrarea de laborator nr. 4

CURS 2. Reprezentarea numerelor intregi si reale. Sistem de numeraţie

INFLUENŢA CÂMPULUI MAGNETIC ASUPRA DINAMICII DE CREŞTERE"IN VITRO" LA PLANTE FURAJERE

A NOVEL ACTIVE INDUCTOR WITH VOLTAGE CONTROLLED QUALITY FACTOR AND SELF-RESONANT FREQUENCY

TEMĂ SPD 2017 MODEL 1

Model statistico-econometric utilizat în analiza corelaţiei dintre Produsul Intern Brut şi Productivitatea Muncii

Cristina ENULESCU * ABSTRACT

METODE ȘI MODELE ECONOMETRICE UTILIZATE ÎN ANALIZA INFLUENȚEI FACTORIALE ASUPRA CREȘTERII PRODUSULUI INTERN BRUT

ARHITECTURA SISTEMELOR DE CALCUL ŞI SISTEME DE OPERARE. LUCRĂRILE DE LABORATOR Nr. 6, 7 şi 8 REPREZENTAREA INFORMAŢIILOR NUMERICE ÎNTREGI ŞI REALE.

Capete terminale şi adaptoare pentru cabluri de medie tensiune. Fabricaţie Südkabel Germania

Update firmware aparat foto

Transcription:

3 Procedee de eşantionare aplicate în cercetarea pieţei şi administrarea eficientă a afacerilor 3.1 Eşantionare aleatoare Eşantionul este un segment al populaţiei studiate, ales să o reprezinte în ansamblu. Reprezentativitatea acestuia asigură corectitudinea estimărilor efectuate baza calculului indicatorilor de sondaj şi a inferenţei statistice realizate. Atunci când alege eşantionul cercetătorul trebuie să răspundă la mai multe categorii de întrebări: i) CINE urmează să fie studiat (care este unitatea de sondaj?); ii) CÂTE unităţi va cuprinde eşantionul (volumul eşantionului desigur influenţează siguranţa rezultatelor, dar, dacă este bine ales, şi un eşantion de sub 1% din populaţia totală poate furniza rezultate cu o probabilitate ridicată); iii) care sunt CRITERIILE de alegere a unităţilor în eşantion (care este procedeul de eşantionare folosit?). Folosind eşantionarea aleatoare, probabilistică, fiecare unitate componentă a populaţiei studiate are o anumită probabilitate, pentru a fi inclusă în eşantion, putându-se astfel estima eroarea de eşantionare. Atunci când procedeele aleatoare sunt prea costisitoare sau durează prea mult,

studiile de piaţă apelează şi la eşantionare neprobabilistică sau mixtă, caz în care nu pot fi estimate erorile de eşantionare. Pentru a respecta caracterul aleator al formării eşantionului, procedeul de eşantionare nu trebuie să fie influenţat de analist. Un eşantion este aleator dacă toate unităţile extrase din colectivitatea generală au avut aceeaşi şansă (probabilitate egală şi diferită de zero) de a participa la eşantion. Rezultatele unui astfel de sondaj pot fi interpretate probabilistic. Eşantionarea aleatoare se realizează după planuri de sondaje simple (pentru sondaje în populaţii omogene, dar putându-se aplica şi pentru populaţii neomogene), după planuri de sondaj în mai multe etape (stratificarea, sondajul multistadial, multifazic, de serii, secvenţial). Această metodă de eşantionare este indicat a se folosi în cazul în care unităţile din populaţie sunt de dimensiuni mici şi nu există diferenţe semnificative între mărimea unităţilor populaţiei. În practica de piaţă economică această condiţie este rar îndeplinită în totalitate,. De aceea, se recomandă aplicarea de metode de eşantionare cu probabilităţi inegale, în ipoteza că unităţile au şanse diferite de a face parte din eşantion. Pentru aplicarea acestei metode este necesară cunoaşterea unor date auxiliare despre populaţie. În unele cazuri, eşantionarea cu probabilităţi inegale poate fi mai avantajoasă decât cea cu probabilităţi egale. De exemplu, dacă estimăm numărul angajaţilor dintr-o regiune, cu scopul de a planifica cifra de şcolarizare la o firmă de instruire, vom folosi datele dintr-un eşantion de judeţe, extrase aleator, pentru care se cunoaşte populaţia fiecarui judeţ (în urma ultimului recensământ). Dacă notăm cu X i numărul firmelor din judeţul i cuprins în eşantion, cu N numărul judeţelor ţării şi cu n numărul judeţelor cuprinse în eşantion, sum(x i ) estimează numărul firmelor la nivel naţional. Judeţele, indiferent de mărimea lor, au avut şanse egale de a participa la eşantion. Dar numărul firmelor depinde în mod evident de populaţia judeţului şi deci estimatorul poate fi afectat de o eroare semnificativă.

Pornind de la ipoteza existenţei unei legături directe, pozitive între populaţia unui judeţ şi numărul de firme comerciale, se poate acorda judeţelor mai mari o şansă mai mare de a face parte din eşantion. Probabilitatea ce i se va atribui fiecărui judeţ va fi proporţională cu populaţia sa. Procedeul de extracţie va fi nerepetat. Estimatorul devine: (P/n). sum(x i /pi), unde P este populaţia întregii ţări şi p i populaţia judeţului i din eşantion. Din procedee de extracţie cu probabilităţi egale amintim procedee absolut aleatoare, procedeul loteriei şi al tabelului cu numere întâmplătoare şi procedeul mecanic sau de eşantionare sistematică. 3. Eşantionare dirijată şi mixtă Eşantionarea dirijată apare în cadrul sondajului efectuat de un expert sau un observator - bun cunoscător al caracteristicilor populaţiei din care se va extrage eşantionul, care va include în eşantion, în mod conştient, unităţile alese după părerea sa subiectivă. Acest procedeu de eşantionare este mult mai ieftin decât cele probabilistice şi se poate aplica dacă eşantioanele sunt atât de mici, încât inferenţele efectuate pe baza lor nu ar reprezenta decât o simplă ipoteză ce nu ar putea fi testată, indiferent de metoda de prelevare utilizată. Datele disponibile pot prezenta un grad ridicat de nesiguranţă, ceea ce va face ca opinia unui expert să ducă la obţinerea de rezultate mai bune. Selecţia dirijată nu permite stabilirea gradului de precizie a unei estimaţii făcute pe baza ei, precizia depinzând direct de numeroase circumstanţe. În practică se aplică aceasta metodă de eşantionare datorită imposibilităţii respectării condiţiilor de efectuare a unei eşantionări aleatoare (baza de sondaj completă şi fără omisiuni, cunoaşterea unor informaţii suplimentare despre unităţile cuprinse în eşantion).

Cea mai utilizată metodă de eşantionare dirijată în cercetările de piaţă şi anchetele de piaţă este cea pe cote. În acest caz se cunoaşte structura populaţiei studiate după sex, vârstă, categorie socio-profesională, din studii demografice anterioare. În cadrul fiecărei grupe se cuprinde un număr de persoane alese de către operator. Acestuia i se comunică doar caracteristicile persoanelor ce trebuie intervievate, numărul lor pe fiecare grupă în parte şi structura populaţiei studiate. Se presupune că eşantionul este reprezentativ dacă el redă structura populaţiei generale studiate. Metoda se bazează pe o alegere raţională a unităţilor din eşantion. Prin modul de constituire a eşantionului apare ca o metodă mixtă, combinând metodele probabilistice cu cele nealeatoare de eşantionare. Asimilarea cu metodele probabilistice se face în măsura în care putem defini ca probabilităţi frecvenţele relative, definite în cadrul populaţiei. Putem face această echivalenţă dacă volumul populaţiei de referinţă este suficient de mare pentru a da posibilitatea aplicării legii numerelor mari. De aceea, se poate afirma că sondajul pe cote apare ca un sondaj stratificat, selecţia în cadrul grupelor fiind conştienţa nu este aleatoare. Caracterul voluntar al metodei constituie principalul său dezavantaj, operatorul putând influenţa în mod voit sau nu rezultatele sondajului. Asemănarea dintre eşantionarea stratificată aleatoare şi cea pe cote constă în stratificarea iniţială a populaţiei de referinţă pe straturi omogene. Diferenţa dintre stratificarea aleatoare şi eşantionarea pe cote constă în procedeul de selecţie al unităţilor din fiecare strat, selecţia în cazul eşantionarii pe cote fiind lăsată pe seama operatorilor. Deci metoda se bazează pe definirea caracteristicilor de structurare a populaţiei de referinţă. Astfel, pentru fiecare caracteristică, structura eşantionului trebuie să fie identică cu cea a populaţiei din care este prelevat. Se definesc variabilele de control ca ansamblul caracteristicilor reţinute pentru a asigura identitatea între eşantion şi populaţia de referinţă. Stabilirea

variabilelor de control are în vedere obiectivul studiului şi tipul populaţiei de referinţă. Pentru alegerea criteriilor de cotă, de structurare este recomandabil să se ţină seama de următoarele îndrumări: definirea variabilelor pe baza întrebărilor cuprinse în eşantion, folosirea ca variabile de control doar a acelora pentru care se poate defini o distribuţie statistică pentru populaţia de referinţă, limitarea numărului de criterii de cotă ce trebuie să fie independente, fără să cuprindă conotaţii psihologice şi formate din unităţi statistice cu un grad cât mai mare de omogenitate. Dacă se respectă aceste condiţii se poate obţine un eşantion sensibil apropiat de un eşantion extras pe baza procedeelor aleatoare. Un eşantion obţinut prin procedeul cotelor, reprezentativ la nivel naţional, format din consumatori, trebuie structurat după criteriile: mediul de provenienţă, marimea oraşului, sex, venit etc. Într-un alt exemplu, într-un sondaj statistic organizat la nivelul Municipiului Bucureşti, cu scopul identificării preferinţelor cursanţilor unui curs de informatică, pentru calculatoare personale şi produse program, organizat în scopul identificării segmentelor ţintă pe diferite tipuri şi categorii de cursanţi, pot fi alese ca variabile de control categoria socio-profesională, vârsta, gradul de educaţie, structura populaţiei aceste variabile de segmentare fiind publicate în urma ultimului recensământ. De asemenea, în cadrul unui sondaj efectuat cu scopul identificării oportunităţilor pe piaţa serviciilor de consultanţă în resurse umane am ales drept variabile de control pentru o populaţie formată din agenţi economici din Bucureşti: forma dominantă de proprietate şi provenienţa capitalului, date preluate de la INS. Această metodă este de departe cea mai utilizată în studiile de piaţă, deoarece necesită un buget redus de cheltuieli, fiind mai puţin costisitoare decât orice metodă de eşantionare aleatoare, proiectarea nu este laborioasă, rezultatele se obţin operativ, într-un timp scurt şi, de fapt, este singura metodă posibilă dacă nu există bază de sondaj.

O altă metodă de formare dirijată a eşantionului este metoda voluntariatului, extrem de utilizată în trecut în cercetările medicale şi psihologice. A început să fie din ce în ce mai des folosită în studiile de marketing. Includerea în eşantion se realizează pe baza opţiunii voluntare a persoanelor de a participa la eşantion. Anchetele desfăşurate pe baza metodei voluntariatului se aplică studiului opiniilor ascultătorilor radioului, cititorilor ziarelor, navigatorilor pe internet. Metoda constă în publicarea chestionarului în presă ori afişarea sa într-o pagină de Web, însoţită de rugămintea de a răspunde. Deşi aceste anchete furnizează un volum mare de date, se pune problema posibilităţii extrapolării rezultatelor, imposibil de realizat datorită necunoaşterii reprezentativităţii eşantionului celor ce au răspuns. O a treia metodă de eşantionare dirijată este metoda de eşantionare bazată pe accesibilitate, cercetătorul alegând acei membrii ai populaţiei de la care se pot obţine cel mai uşor informaţiile. Metoda itinerariilor este, de asemenea, o metodă de eşantionare dirijată care se poate aplica în regiunile cu densitatea populaţiei mare. Această metodă poate fi combinată cu metodă de eşantionare pe cote, ceea ce presupune că operatorul trebuie să formeze grupele urmând un itinerar prestabilit. În cazul unui refuz, operatorul va trece la următorul punct prestabilit de pe traseu. Principiul de bază al metodei unităţilor tipice constă în faptul că diferite caracteristici ale unităţilor statistice sunt corelate, ceea ce permite gruparea populaţiei în subansambluri omogene, iar variabila de control reprezintă aceste subansambluri prin media sa, denumită unitate tip. Deşi metodele prezentate mai sus nu respectă principiile eşantionării aleatoare, sunt folosite destul de des în sondajele de piaţă, fiind efectuate de specialişti în domeniul marketing-ului, ce contribuie prin cunoştinţele lor şi experienţa acumulată la atenuarea dezavantajelor acestor metode de eşantionare.

În practică, se pot combina metodele de eşantionare aleatoare cu cele dirijate, obţinându-se o combinaţie de avantaje şi atenuarea dezavantajelor fiecăreia. Un exemplu îl constituie selecţia stratificată, în care se împarte întreaga populaţie în straturi (grupe) după criterii de stratificare corespunzătoare scopului sondajului şi se alege din fiecare strat câte un subeşantion folosind procedeul aleator de selecţie. Eşantionarea stratificată se recomandă a se utiliza în studiul fenomenelor economico-sociale de masă şi, în mod special, în studierea fenomenelor de piaţă, caracterizate printr-un grad mare de eterogenitate. Pentru a creşte gradul de omogenitate, populaţia de referinţă se împarte mai întâi pe grupe omogene. Aplicând în continuare selecţia aleatoare în fiecare grupă, subeşantionul obţinut va fi omogen. Erorile de sondaj rezultate vor fi mai mici decât în cazul extragerii eşantionului din populaţia totală, neîmpărţită pe clase omogene. 3.3 Determinarea mărimii eşantionului Determinarea volumului eşantionului este pasul esenţial ce trebuie parcurs înainte de culegerea datelor. Volumul eşantionului este desemnat prin numărul unităţilor statistice simple sau complexe ce vor fi prelevate din populaţia de referinţă, de la care se vor înregistra datele de intrare pentru analiză. Deci, analistul trebuie să decidă, în funcţie de mai mulţi factori, care este numărul optim de unităţi statistice ce trebuie cuprinse în sondaj pentru ca eşantionul să fie reprezentativ şi rezultatele sale să se poată extinde asupra populaţiei de referinţă cu respectarea principiilor inferenţei statistice. În consecinţă, se pune problema determinării dimensiunii optime a eşantionului care să asigure îndeplinirea obiectivelor sondajului. Eşantionul ideal trebuie să fie în concordanţă cu eşantionul practic, ce poate fi construit astfel încât să se poată atinge obiectivele studiului.

Un alt element care trebuie foarte clar precizat şi utilizat este reprezentat de modalitatea de determinare a volumului eşantionului. Contrar simţului comun, nu este importantă ponderea eşantionului în colectivitatea totală (care intră doar ca element de corecţie), cât mărimea absolută a lui. Fixarea apriorică a proporţiei de sondaj, raportul dintre volumul eşantionului şi volumul populaţiei totale, poate conduce fie la supra-dimensionare, fie la subdimensionare. O raţie de sondaj de zeci de procente se dovedeşte nesemnificativă în condiţiile unui volum relativ redus al colectivităţii totale, după cum o pondere chiar mai mică de 1% este suficientă la colectivităţi mari şi foarte mari. Volumul optim de eşantionare depinde de obţinerea volumului minim care să asigure o reprezentativitate adecvată a eşantionului, ce este dat de factori de influenţă situaţi în afara mărimii colectivităţii totale şi care se referă la structura colectivităţii. Expresiile de definiţie a mărimii eşantionului sunt: n = t. σ / e pentru caracteristici continue (3.1) şi n = t. P. (100 - P) / e pentru caracteristici alternative (3.) unde, t: valoarea teoretică corespunzătoare probabilităţii cu care se lucrează (de regulă, P = 95%, iar t = 1,96); σ: abaterea medie pătratică a distribuţiei caracteristicii care stă la baza elaborării eşantionului (σ = dispersia sau varianţa V); P: procentul în care populaţia cercetată posedă caracteristica de eşantionare; e: eroarea limită de reprezentativitate admisă.

Datorită faptului că nu se studiază întreaga colectivitate, estimarea valorilor obţinute (medii, procente) la nivelul eşantionului pentru întreaga colectivitate se face cu o anumită eroare. Valoarea reală se află cuprinsă în limitele determinate de mărimea obţinută la nivelul eşantionului ± e. În determinarea volumului eşantionului se acceptă aprioric o anumită eroare cuprinsă între 1% (foarte rar practicată, dealtfel, deoarece necesită eşantioane foarte mari) şi 5% (prag de eroare aproape general acceptat de către experţii în marketing). În continuare, algoritmul de lucru este simplu. La o anumită valoare a lui σ sau P şi o valoare impusă a lui e rezultă în mod automat o anumită valoare a lui n. Dificultatea cea mai mare constă însă tocmai în obţinerea informaţiilor referitoare la distribuţia caracteristicilor de eşantionare, respectiv valorile σ sau P. La valorile σ = 0,5 m sau P = 50% şi e = 1% rezultă un eşantion de 9600 persoane necesar pentru a fi studiat, ori, de multe ori, colectivitatea totală este mică. Volumul cerut pentru eşantion scade vertiginos, dacă ne reducem dorinţa de rigurozitate şi acceptăm valori mai mari ale lui e, ceea ce se şi face de regulă. Pentru un nivel al erorii e = %, 3%, 4% sau 5% (menţinând constant σ sau P) volumul eşantionului se reduce şi el la: 400, 1060, 600 şi, respectiv, 384 persoane. Dacă se modifică valorile σ sau P vor rezulta mărimi diferite pentru n. În evaluarea gradului de reprezentativitate a cercetărilor intervin şi alte elemente, care se referă la aplicarea corectă a tuturor cerinţelor de întocmire a eşantionului, a corecţiilor cerute de schema de eşantionare, de dispersia spaţială a populaţiei, de selectarea subiecţilor şi de cercetarea efectivă a acestora. Putem preciza o serie de principii ce trebuie respectate pentru evaluare: aplicarea eşantionării la colectivităţile de populaţie reclamă asigurarea unui număr minim de persoane (n) care să permită un grad acceptabil de reprezentativitate; mărimea colectivităţii totale intervine doar ca element de corecţie, factorul de corecţie fiind (N n)/(n 1), cu care se

micşorează valoarea n a volumului eşantionului, deja obţinută. Valoarea raportului se apropie de unu în cazul în care N este un număr mare. Atunci când studiem colectivităţi relativ mici (sub 500 persoane) nu se pot determina eşantioane reprezentative după regulile numerelor mari şi ar trebui să se ia în considerare cerinţele suplimentare ale eşantioanelor mici. Când suntem în imposibilitatea de a construi eşantioane reprezentative este preferabil să studiem loturi omogene sau neomogene de populaţie, dar care nu ne permit să generalizăm rezultatele la ansamblul colectivităţii, de unde rezultă implicit avantajele cercetării selective, riguros realizate. O atenţie cu totul deosebită trebuie acordată modului în care se face uz de o metodă mai rapidă de determinare a mărimii eşantionului, care pleacă de la volumul colectivităţii totale (N) fără a mai lua în considerare caracteristicile populaţiei, expresia Taro Jamane: N = N / (1+N. e ) (3.3) Efectuarea unor calcule simple ne indică şi de această dată că, de fapt, volumul eşantionului obţinut nu reflectă variaţiile mărimii colectivităţii totale. Se constituie anumite praguri peste care n (volumul eşantionului) nu mai creşte oricât de mult ar creşte N. Aşa, de exemplu, la e = 5% pragul respectiv este 399. La valori mai mici ale erorii limită admise pragul eşantionului se fixează, evident, la valori mai mari, dar întotdeauna în jurul valorii indicate de expresia de definiţie a mărimii eşantionului în care P = 50% (când furnizează cea mai mare mărime a eşantionului), iar t = 1,96 corespunde unei probabilităţi de 95%. După cum se observă, metoda Jamane poate conduce la eşantioane subdimensionate (când se doreşte o siguranţă mai mare, deci o probabilitate de peste 95%, sau când populaţia este eterogenă în raport cu caracteristicile de bază) şi la eşantioane supradimensionate (în cazul în care populaţia este relativ omogenă). Şi de această dată dorinţa de a lucra cu erori mici de reprezentativitate conduce la eşantioane foarte mari (tabelul 3.1).

Calculul expus îndreptăţeşte, pe de o parte, afirmaţia potrivit căreia mărimea eşantionului nu depinde în mod absolut de mărimea colectivităţii totale (în condiţiile în care eroarea de reprezentativitate rămâne constantă, variaţiile mărimii colectivităţii totale nu pot fi reflectate în mărimea eşantionului), iar, pe de altă parte, impune o anumită circumspecţie în utilizarea metodei simplificate pentru determinarea volumului eşantionului. Mărimile simulate ale eşantionului calculat prin expresia Taro Jamane pentru anumite valori ale lui N şi e Tabel 3.1 Mărimea Mărimea eşantionului pentru diverse erori limită admise colectivităţii e = 5% e = 3% e = 1% totale (N) 500 1000 5000 10000 100000 1000000 10000000 85 370 384 398 399 399 345 56 909 1000 1099 1109 1110 476 909 3333 5000 9090 9900 9990 Stabilirea volumului eşantionului se face pe bază unui compromis între opţiunea pentru eşantioane de volum mare, care să asigure un grad mare de reprezentativitate şi un grad mare de încredere pentru parametrii estimaţi ai populaţiei de referinţă, şi optiunea pentru eşantioane de volum mic, ce implică costuri reduse. Dimensiunea minimă a eşantionului trebuie să asigure o reprezentativitate acceptabilă în procesul inferenţei statistice, care să nu ducă la distorsiuni. Mărimea eşantionului depinde de numeroşi factori controlabili şi necontrolabili pentru cercetător: gradul de exactitate cu care se doreşte să se estimeze caracteristicile populaţiei de referinţă, mărimea erorilor de sondaj, legea numerelor mari şi, nu în ultimul rând, bugetul disponibil, perioada de timp avută la dispoziţie şi resursele de personal de care dispune.

Gradul preciziei cerute de beneficiarul rezultatelor este principalul factor ce determină marimea eşantionului. Încrederea ce poate fi atribuită informaţiilor obţinute pe baza unui eşantion depinde direct de mărimea eşantionului, şi nu de fracţia de selecţie. În stabilirea dimensiunii eşantionului, dacă se stabileşte aprioric un prag de semnificatie, se impune ca abaterile dintre media populaţiei de referinţă, dacă se cunosc, şi mediile eşantioanelor ce se pot genera să respecte inegalitatea. Gradul de variabilitate al oricărei populaţii este un alt factor de influenţă ce poate fi sau nu cunoscut. Dacă variabilitatea este cunoscută din cercetări anterioare sau dintr-o cercetare organizată în mod special, volumul eşantionului rezultă imediat din calcule. Dacă dispersia eşantionului sau a populaţiei de referinţă nu este cunoscută în cazul cel mai nefavorabil), se ia în calcul dispersia maximă. Calculul ei presupune stabilirea mărimii maxime a dispersiei pentru caracteristici cantitative: (xmin x) + (xmax x) σ max = şi σ max = f (1 f ) = 0,5(1 0,5) = 0,5 (3.4) şi determinarea valorii de 0,5 corespunzătoare frecvenţei maxime f, a caracteristicii alternative. În practică se operează cu eşantioane de volum redus (pentru care se foloseşte la estimarea erorilor legea repartiţie Student) şi eşantioane de volum normal (pentru care se foloseşte legea de repartiţie Laplace), în funcţie de gradul de omogenitate al colectivităţii. Evident, conform legii numerelor mari cu cât creşte volumul eşantionului (nu fracţia de selecţie), cu atât precizia rezultatelor este mai mare. Mărimea eşantionului se decide şi în funcţie de rezultatele ce vor fi analizate, ţinându-se seama de necesitatea obţinerii preciziei nu doar pe total eşantion, ci şi pe subgrupe. Un alt factor de influenţă este faptul că sondajul, în general, urmăreşte rezultatele privitoare la mai multe caracteristici. Un eşantion

suficient de mare pentru estimarea intervalului de încredere pentru o caracteristică poate să fie insuficient pentru o altă caracteristică. Problemele se complică în cazul sondajelor stratificate, caz în care trebuie estimată mărimea eşantionului pe fiecare strat şi apoi, prin însumare, va rezulta eşantionul pe total populaţie. În cazul sondajului multistadial trebuie facută o estimare a variantelor în interiorul şi între unităţile din primul stadiu. Toate aceste dificultăţi de natură tehnică pot fi evitate printr-o documentare prealabilă corespunzătoare. Mărimea eşantionului va mai fi decisă şi în funcţie de restricţiile de resurse şi bugetul disponibil, de cerinţele beneficiarului şi de posibilitatea previzionării dispersiei variabilelor înregistrate. 3.4 Probleme privind prognoza volumului de eşantionare. Dispersii marginale Fenomenele din domeniul studiului pieţei sunt, în general, fenomene dinamice, ceea ce determină valori diferite în timp ale variabilelor ce le caracterizează. Sondajul prezintă o situaţie statică, de aceea se recomandă organizarea de sondaje periodice cu acelaşi set de variabile înregistrate. Măsurând valorile unor variabile ce caracterizează un fenomen în momente diferite de timp putem determina variaţii statistice nu doar între valorile individuale înregistrate, ci şi între valorile medii calculate la momente de timp diferite, pastrându-se sau nu aceeaşi amplitudine a variaţiei. Pentru proiectarea volumului unui nou eşantion în sondaje periodice este necesară conoaşterea tendinţei de evoluţie a dispersiei şi posibilitatea previzionării dispersiei şi abaterii standard. De aici apare ca necesară elaborarea de serii de timp de dispersii şi de modificări absolute şi/sau relative ale acesteia, ca de exemplu, serii cronologice de indici ai dispersiei

sau de sporuri ale dispersiei unei variabile înregistrate în sondaje efectuate la momente de timp diferite. Posibilitatea previzionării dispersiei cu ajutorul indicatorilor marginali ar adăuga o nouă restricţie în estimarea volumului noului eşantion, alături de restricţiile de costuri. Cea mai frecventă metodă de sondaj utilizată în studiile sociale şi economice este sondajul stratificat. De aceea, această formă de sondaj poate fi utilizată şi pentru studiul fenomenelor în dinamică, pe baza datelor înregistrate în sondaje realizate în perioade diferite, în vederea elaborării de serii cronologice care să permită, prin aplicarea de tehnici complexe de sondaj, efectuarea de prognoze optime. În scopul previzionării gradului de variaţie, a dispersiei şi a abaterii tip, în urma realizării de sondaje periodice se pot construi serii cronologice cu periodicitate constantă sau variabilă, de niveluri atinse de indicatori micro sau macroeconomici, de medii şi măsuri ale variaţiei atinse de valorile individuale ale distribuţiei marginale şi chiar de indicatori marginali care exprimă modificarea mediilor şi a dispersiilor. Cunoaştem că rezultatele unui sondaj stratificat conduc la verificarea regulei de adunare a dispersiilor, conform căreia dispersia totală înregistrată de variaţia valorilor individuale ale distribuţiei marginale este suma dispersiilor parţiale, deci: σ = σ + σ /, (3.5) total y x unde, σ total = dispersia totală, determinată de toţi factorii de influenţă ai variaţiei unei variabile; σ = media dispersiilor înregistrată în interiorul straturilor, determinată de factorii neînregistraţi;

σ y/ x = dispersia dintre straturi, determinată de factorul de formare a straturilor, ce arată în ce măsură discriminează sau nu criteriul de stratificare variabila studiată. Dacă simplificăm fiecare termen al ecuaţiei de mai sus cu dispersia totală, calculând deci structura dispersiei totale, obţinem raportul de determinaţie şi raportul de nedeterminaţie, după formula: σ σ / 1= + σ σ total yx total, (3.6) unde, σ σ total = raport de nondeterminaţie ce exprimă procentual partea din variaţia totală datorată factorilor aleatori neînregistraţi; σ σ y/ x total = raport de determinaţie ce exprimă procentual partea din variaţia totală a variabilei dependente explicată de factorul de grupare, de discrimare, de variabila independentă. Dacă înregistrăm două niveluri ale dispersiei pentru două sondaje succesive se poate calcula modificarea absolută a dispersiei totale ce se va distribui între modificarea absolută a dispersiei dintre straturi şi a mediei dispersiilor din interiorul straturilor, astfel: σ = σ + σ / (3.7) total y x Acest spor al dispersiei totale poate fi pozitiv sau negativ şi se poate distribui egal sau diferit pe cele două componente. Pentru a măsura modul de distribuţie şi a determina contribuţia factorului de stratificare la variaţia

dispersiei totale, calculăm structura ecuaţiei modificărilor absolute ale dispersiilor împăţind ecuaţia modificărilor absolute, cu modificarea absolută a dispersiei totale, astfel: σ σ 1 = + σ σ total y/ x total, (3.8) În ecuaţia de mai sus se propune că indicatorii marginali obţinuţi să se noteze, numească şi intrepreteze, astfel: a. σ mg = σ σ total = dispersie medie marginală, ce arată cu cât se va modifica media dispersiilor din interiorul straturilor dacă dispersia totală suferă o modificare cu o unitate sau cu cât trebuie să se modifice media dispersiilor din interiorul straturilor pentru a obţine o modificare cu o unitate a dispersiei totale; poate lua valori între 1 şi 1. b. σ y/ xmg = σ y/ x = dispersie marginală dintre straturi, ce arată cu σ total cât se va modifica nivelul dispersiei dintre straturi la o modificare unitară a dispersiei totale sau cu cât trebuie modificată dispersia dintre straturi pentru a obţine o modificare unitară a dispersiei totale; poate lua valori între -1 şi 1. Există posibilitatea identificării unei funcţii matematice de trend pe termen lung, atât a dispersiilor marginale, cât şi a raportului acestora cu evoluţia în domeniu; fapt ce va trebui aprofundat. Între cele trei tipuri de dispersii există o relaţie directă sau inversă, deci creşterea dispersiei totale va determina creşteri/descreşteri în proporţii egale sau diferite ale dispersiilor parţiale, şi invers.

Desigur dispersiile de eşantion sunt corectate cu numărul gradelor de libertate corespunzătoare, dar pentru simplificarea modului de scriere a formulelor nu am mai introdus şi aceste notaţii. Dispersia totală se corectează cu n - 1 grade de libertate, dispersia dintre starturi se corectează cu numărul de straturi -1, deci r - 1, iar media disersiilor din interiorul starturilor cu volumul eşantionului numărul de straturi, deci n - r. Construind serii cronologice de dispersii marginale ce vor fi supuse analizei statistice de previziune putem estima, cu o anumită probabilitate, nivelul mediei dispersiei din interiorul straturilor şi al dispersiei totale, niveluri necesare programării unui nou volum de eşantionare. Dacă seriile construite sunt nestaţionare vor trebui diferenţiate pentru a se transforma în evoluţii staţionare. În final, trebuie precizat că modificările absolute ale dispersiilor corectate pot fi calculate cu bază mobilă sau cu bază fixă. Sporurile cu bază fixă apar în cazul în care am realizat într-o cercetare anterioară o probă martor sau un eşantion programat în care se ajunge la o distribuţie martor ce coincide cu structura distribuţiei totale şi a cărei reprezentativitate este validată statistic. Necesitatea utilizării indicatorilor marginali ai variaţiei valorilor individuale ale unei variabile cantitative de sondaj este legată, mai ales, de calculele de prognoză care sunt necesare pentru determinarea volumului unui nou eşantion. Metoda se poate aplica înspecial în situaţia sondajului stratificat, caz în care, pentru estimarea intervalului de încredere, se foloseşte media dispersiilor din interiorul straturilor şi necesită, pentru o mai bună fundamentare teoretică, testarea riguroasă în activitatea practică.

Statistics for Marketing and Business Administration 3.5 Summary. Sampling methods applied in Marketing and Business Administration studies Random Sampling The sample is a segment of the statistical population chosen to represent it as a whole. Its representativity ensures the accuracy of the estimation made on the basis of calculating the research indicators and the inferential statistics. When it chooses the sample, the researcher must answer to different categories of questions: WHO is to be studied (which is the research unit?)? HOW MANY units will the sample include (the sample size influences the results' accuracy, but if it is well chosen, even a sample of under 1 per cent of the total population may give results with a high probability) WHICH are the CRITERIAS for choosing the sampling units (which is the sampling method used?) Using random, probabilistic sampling, each unit of the population has a certain probability to be included in the sample, making possible the estimation of sampling error. In case the random methods are too expensive or take too long, the market studies use non-probabilistic or mix sampling. In this case the sampling errors cannot be estimated. The random sample is made up of simple research plans (for researches of homogenous population and also applicable for non-homogenous population) or of multi-stage research plans (ranking, multi-stage research, multi-phase research, serial research, sequential research). The sampling method is indicated to be used in the case where the units of population are of small size and there are no significant differences between the sizes of the units' population. For example, if we estimate the

Statistics for Marketing an Business Administration number of employees in an area, with the purpose of planning the training figure at a training firm, we will use data from districts' samples, randomly chosen, for which the population of each district is known (as a result of the last census). If we denote by X i the number of firms from district і comprised in the sample, by N the number of the country's districts and by n the number of the districts comprised in the sample, sum(x i ) is estimating the number of firms at national level. The districts, no matter their size, had equal chances to be a part of the sample. But, the number of firms depends obviously on the district's population. Thus, the estimator can be afected by a significant error. Starting from the hypothesis of the existence of a direct, positive relation between the population of a district and the number of the commercial firms, larger districts can be granted a higher chance to be part of the sample. The probability which is assigned to which district will be well-balanced with its population. The method of extraction will not be repeated. The estimator becomes: (P/n). sum(x i /pi), where P is the population of the whole country, p i is the population of district і from the sample. Conducted and mix sampling Conducted sampling appears in the research achieved by an expert or an observer who is a good expert of the population's characteristics, from which the sample will be chosen, and who will consciously include in the sample units chosen in a subjective way. This sampling procedure is much cheaper than the probabilistic ones and can be applied if the samples are so small that the inferences made with the their help would represent only a simple hypothesis that could not be tested, despite the processing method used.

Statistics for Marketing and Business Administration The most used method of conducted sample in the market research and market inquire is the quotas sampling. In this case the structure of the population is known according to sex, age, socio-vocational category, due to some previous demographic studies. In every group it is included a number of persons chosen by the operator. The operator is told only the characteristics of the persons that must be interviewed, their number for every group and the structure of the studied population. It is presumed that the sampling is representative if it gives the structure of the total studied population. Another method of forming the conducted sampling is the volunteers method, which was often used in the past in medical and psychological researches. It started to be used more and more in the marketing research. The enclosure in the sample is made based on the voluntary option of the person to participate in the sample. The itinerary method is also a conducted sample, which can be applied in areas with a high density of population. This type may be combined with the sampling method based on quota, which supposes that the operator must form the groups following a pre-established itinerary. In case of refusal, the operator will pass to the next pre-established point of the itinerary. The basic principle of the typical units method consists in the fact that different characteristics of the statistical units are correlated, which allows grouping the population in homogenous subtypes, and the control variable represents these subtypes through its average, called type unit. Although the methods presented above do not respect the principle of random sampling, they are often used in the market research, being achieved by specialists in marketing, who contribute with their knowledge and with their accumulated experience to decrease the disadvantages of these sampling methods.

Statistics for Marketing an Business Administration Determining the size of the sample Determining the size of the sample is the essential step that must be taken before gathering the data. The size of the sample is designated by the number of simple and complex number of units, which will be obtained from the reference population, from which the entering data will be recorded for the analysis. So, the analysts must decide, according to many factors, which is the optimal number of statistical units that must be included in the survey so that the sample will be representative and its results will extend over the reference population, respecting the principles of statistical inference. The optimal size of the sample depends on obtaining the minimum size which will ensure the representativity of the sample, size which is given by the influencing factors situated outside the total collectivity's size, which refer to the structure of the collectivity. The expressions to define the sample size are: n = t. σ / e, for continous variables and n = t. P. (100 - P) / e, for alternative variables where: t: theoretical value corresponding to the probability with which it is working (generally P=95%, and t=1.96); square average deviation of the characteristic's distribution, which is the base for the sample's elaboration (σ the dispersion or variance V); P: the percentage in which the studied population posses the sampling characteristics; e: the allowed representativity error.

Statistics for Marketing and Business Administration A special attention must be given to the way of using a faster method of determining the sample size, which starts with the total collectivity size (N) without taking into consideration the characteristic of the population, the Taro Jamane expression: N = N / (1+N. e ) Also this time, some simple computation indicates, that the size of the obtained sample does not reflect the variations of the total collectivity size. Certain levels are constituted, over which n (the sample size) will not rise, no matter the rise of N. For example, for e=5%, the level is 399. The computation given as example confirms, on one hand, the affirmation according to which the sample size does not depend entirely on the total collectivity size given the condition in which the representatvity error remains constant, the variations of the total collectivity size cannot be reflected in the sample size), and on the other hand, imposes a certain wariness in using the "simplified" method for determining the sample size. The simulated measures of the sample computed with the Taro Jamane expression for certain values of N and e. The sample size depends on various controllable and uncontrollable factors for the researcher: the accuracy level with which it is wished to estimate the characteristics of the reference population, the size of the sampling errors, the law of large numbers, and last but not least, the available budget, the available period of time and the available personnel resources.

Statistics for Marketing an Business Administration Computation choices for the ample size Table 3.1 The total collectivity size (N) 500 1000 5000 10000 100000 1000000 10000000 The sample size for various allowed limit errors e = 5% e = 3% e = 1% 345 476 85 56 909 370 909 3333 384 1000 5000 398 1099 9090 399 1109 9900 399 1110 9990 If the dispersion of the sample or of the reference population is not known, the most unfavorable case may be considered, by taking into consideration the maximum dispersion. Its computation supposes the establishment of the maximum size of the dispersion for quantitative characteristics. ( x x) + ( x x) = min max σ max and σ max = f ( 1 f ) = 0. 5( 1 0. 5) = 0. 5 The determination of the value is 0.5- corresponding to the maximum frequency f, to the alternative characteristic. In practical activity we often operate with reduced size samples (for which the Student repartition law is used for errors estimating) and the normal size samples (for which Laplace repartition law is used to estimate errors), depending on the homogeneity level of the collectivity. According

Statistics for Marketing and Business Administration to the law of large numbers, the more the sample size is increasing (not the selection fraction), the more the accuracy of the results is higher. The sample size is decided also according to the results, which will be finalized, keeping in mind the necessity of the accuracy not only over the entire sample, but also over subgroups.