Ievads daļas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 attēli 2.3 2.3.2 un d.16_pielikums

1.Empīriskie sadalījumi un to raksturotāji

 

1.1. Empīriskie sadalījumi un to īpašības

 

1.1.1.Variācijas rindas

 

Statistikas pētījuma objekts vienmēr ir masveida objekti un parādības, piemēram, kāda uzņēmuma strādnieki, rajona lauksaimniecības uzņēmumi, visas valsts iedzīvotāji utt. Tātad statistikas pētījuma objekts ir kopa jeb kopums, ko veido kopas vienības jeb elementi (cilvēki, uzņēmumi utt.). Lai iegūtu ziņas par interesējošo kopu, ir jānovēro tās vienības un jāreģistrē dati par svarīgākajām pazīmēm, kas raksturo kopas vienību un līdz ar to visu kopu. Datu savākšanas procesu sauc par statistisko novērošanu. Statistiskās novērošanas gaitā parasti savāc datus par vairākām, nereti daudzām pazīmēm. Tomēr vienkāršākās pētījuma metodes paredz datus apstrādāt un analizēt par katru pazīmi atsevišķi. Tādēļ pieņemam, ka par katru kopas vienību ir reģistrēts viens rādītājs, visbiežāk - skaitlis, kas raksturo vienu novērojamo pazīmi.

Var novērot visas interesējošās kopas vienības. Šādu kopu sauc par ģenerālkopu jeb ģenerālo kopu. Var novērot tikai kādu ģenerālkopas daļu, kuru atlasa tā, lai tā labi pārstāvētu (reprezentētu) visu ģenerālkopu. Tā atlasītu kopu sauc par izlasi. Izlases metode tiks aplūkota turpmākās nodaļās.

Pieņemsim, ka 10 studentu grupa, kārtojot eksāmenu ir ieguvusi šādas atzīmes (desmit ballu sistēmā): 7;5;6;9;7;8;3;4;4;7. Tā kā studentu skaits, kuri kārtojuši eksāmenu, ir neliels, dati ir labi pārskatāmi. Viegli secināt, ka visbiežāk iegūtā atzīme ir 7 (labi). Maksimālā atzīme ir 9 un minimālā 3. Šādu datu jeb novērojumu virkni sauc par nesakārtotu empīrisko rindu. Ja studentu skaits būtu vismaz 30…50, nesakārtota datu rinda jau būtu nepārskatāma. Lai uztvertu informāciju, ko slēpj reģistrētie statistiskie dati, tie ir jāsistematizē, jāizstrādā.

Pirms uzsākam šo darbu, ir jāiepazīstas ar dažiem statistikā plaši lietotiem jēdzieniem. Jau minējām kopu jeb kopumu. Piemērā tā ir 10 studentu grupa. Statistikā kopa sastāv no kopas vienībām, piemērā kopas vienības ir katrs atsevišķs students. Par katru kopas vienību novērojam (reģistrējam) vienu vai vairākas pazīmes. Piemērā novērojamā pazīme ir atzīme eksāmenā. Katrai pazīmei var būt ierobežots vai neierobežots skaits nozīmju jeb variantu. Piemērā tās ir vērtējuma gradācijas: 10, 9,…, 2, 1. Statistiskajā novērošanā atsevišķām kopas vienībām reģistrētās pazīmes vērtības veido empīriskos datus, kurus vairumā gadījumu sauksim par novērojumiem. Piemērā tie ir desmit iepriekš minētie skaitļi.

Novēroto un reģistrēto datu dažādību (vienīgi iespējamo vai nosacīti izdalīto variantu ietvaros) sauc par variāciju. Ja novērojamai pazīmei piemīt šī dažādība (variācija), pazīmi sauc par variējošu pazīmi. Praktiski ir nozīme savākt un apstrādāt datus tikai par variējošām pazīmēm.

Pazīmes variācija var būt kvantitatīva un atributīva. Variācija ir kvantitatīva, ja variantus var izteikt ar skaitļiem, piemēram, alga, ražība, pašizmaksa. Variācija ir atributīva, ja variantus var raksturot tikai ar jēdzieniem, resp., vārdiem, piemēram, tautība, šķirne utt. Kvantitatīva variācija var būt diskrēta un nepārtraukta. Variācija ir diskrēta, ja varianti ir nošķirti, parasti veseli skaitļi (cilvēku skaits ģimenē, istabu skaits dzīvoklī, traktoru skaits saimniecībā). Variācija ir nepārtraukta, ja viens variants no otra var atšķirties ar lielumu, kas ir pēc patikas mazs. Šādā gadījumā variantus nodala mērīšanas, svēršanas vai reģistrācijas precizitāte. Tā, piemēram, ražību divās saimniecībās var uzlūkot par atšķirīgu, ja tā atšķiras vismaz par 0,1 cnt/ha.

Nesakārtotu novērojumu rindu apstrādā, sastādot sadalījuma (variācijas) rindu un aprēķinot statistiskos raksturotājus jeb rādītājus.

Ja datu maz (piemēram, mazāk par 30), tad variācijas rindu parasti nesastāda, bet aprēķina statistiskos rādītājus tieši no nesakārtotas empīriskās rindas.

Ja novēroto datu ir daudz, statistiķis var izvēlēties, kādus apstrādes paņēmienus lietot. Var vispirms izveidot variācijas rindu. Tā noder tiešai izpētei un interpretācijai. Pēc variācijas rindas tuvināti var aprēķināt interesējošos rādītājus. Citos gadījumos variācijas rindu neizveido, bet vajadzīgos vispārinošos rādītājus aprēķina tieši pēc nesakārtotiem novērojumu datiem. Izvēli pamato, ņemot vērā pētījuma mērķi un uzdevumus, savākto datu raksturu un apjomu, lietojamo skaitļošanas tehniku, kā arī citus apsvērumus.

Aplūkosim variācijas rindas izveidošanu un interpretāciju.

Sadalījuma jeb variācijas rindu iegūst, saskaitot, cik reizes reģistrēti vienādi varianti. Rezultātus sakopo tabulā. Tajā uzrāda noteiktā kārtībā sakārtotas pazīmes vērtības jeb variantus un to biežumus. Ja biežumi izsaka tiešo kopas vienību skaitu, tad tie ir absolūtie biežumi. Biežumus var izteikt procentos, visu kopas apjomu pieņemot par 100. Tā iegūst relatīvos biežumus.

Jēdzienus “sadalījuma rindas” un “variācijas rindas” speciālajā literatūrā bieži uzlūko par sinonīmiem. Lietderīgāk par variācijas rindām saukt tikai tās rindas, kuras sakārtotas kvantitatīvas pazīmes augošā vai dilstošā kārtībā, jo tās var apstrādāt, izmantojot speciālus variācijas pētīšanas paņēmienus. Apstrādājot atributīvas sadalījuma rindas, daļu šo paņēmienu nevar izmantot.

Sastādot variācijas rindu, sākotnējos variantus var apvienot intervālos. Tālākā variācijas rindas apstrādē intervālu centrus bieži uzskata par jauniem variantiem. Līdz ar to vienā intervālā nonākušos variantus nosacīti uzskata par vienādiem.

1.1. tabulā variācijas rinda izveidota, izmantojot nepārtrauktu pazīmi (graudaugu ražību cnt/ha). Tādēļ ir izveidoti intervāli (skat. tabulas 2.aili), kuru lielums ir 4 cnt/ha. Tālākajos aprēķinos par jauniem nosacītiem variantiem parasti pieņem intervālu centrus (skat. 1.1.tabulas 3.aili). Variācijas rindas, kurās uzrādīti nevis atsevišķi varianti, bet intervāli, sauc par intervālu variācijas rindām.

Lai  nerastos grūtības, kurā intervālā ieskaitīt kārtējo novērojumu, kurš tieši atbilst intervālu robežām, apakšējo robežu var uzrādīt ar lielāku precizitāti nekā augšējo robežu (skat. 1.1.tabulas 2.aili). Ja abas robežas ir uzrādītas ar vienādu precizitāti un nav citas norādes, tad intervāla  apakšējo robežu ir pieņemts lasīt  ar kontekstu “vairāk nekā”, bet augšējo robežu ar kontekstu “ieskaitot”.

Tabulas 4. un 5.ailēs ir parādīti intervālu absolūtie un relatīvie biežumi- saimniecību skaits un šis skaits, pārrēķināts procentos. Katra no šīm ailēm kopā ar aili, kurā norādīti intervāli vai varianti, veido variācijas rindu.

 

Apstrādājot intervālu variācijas rindas, jālieto šādi lielumi:

            x- pazīmes vismazākā reģistrētā vērtība, bet, ja tā nav zināma,   

                      pirmā intervāla apakšējā robeža, piemērā 10,01 cnt/ha;

            x- pazīmes lielākā reģistrētā vērtība vai pēdējā intervāla augšējā robeža, piemērā
                          34,0 cnt/ha;

            x-x- variācijas amplitūda jeb apjoms, piemērā 

                                 34-10=24cnt/ha;

            x(z) -norādītā intervāla zemākā (apakšējā) robeža, piemērā

                      x(z)=14,01cnt/ha;

            x(a)- norādītā intervāla augstākā (augšējā) robeža, piemērā

                        x(a)=22,0cnt/ha;

            - intervāla garums1 jeb grupas lielums.= x(a)- x(z) , piemērā =18-14=4 cnt/ha.

 

 

 

 

 

 

___________________

1   Statistikā intervāla garumu sauc arī par intervāla lielumu, intervāla plašumu, intervāla apjomu.

1.1.tabula

 

Kādas ekoloģiskās grupas lauksaimniecības uzņēmumu sadalījums pēc graudaugu ražības

 

Grupas

Nr.

Graudaugu ražība, cnt/ha

Saimniecību

Uzkrātais saimniecību

Graudaugu sējumu platība ha

 

intervāli

intervālu centri

skaits

relatīvais biežums (%)

skaits

relatīvais biežums (%)

(grupu statistiskais svars)

1

2

3

4

5

6

10,01…14,0

14,01…18,0

18,01…22,0

22,01…26,0

26,01…30,0

30,01…34,0

12

16

20

24

28

32

4

27

47

43

26

8

3

17

30

28

17

5

4

31

78

121

147

155

3

20

50

78

95

100

90

720

1350

1260

810

270

Kopā

155

100

4500

 

Matemātiskajā statistikā parasti lieto vienāda garuma intervālus, tātad == … =. Ekonomiskajā statistikā lieto arī nevienāda garuma intervālus, visbiežāk tad, ja tie saistīti ar kaut kādiem ekonomiskiem tipiem, kā arī tad, ja vienāda garuma intervālu rindas malējos intervālos biežumi ir mazi vai parādās tukši intervāli.

Ja nav nakādu citu apsvērumu par vēlamo intervālu garumu, to var aprēķināt, izmantojot Sterdžesa formulu:

= ,                                                     (1.1)

kur n - visu novērojumu skaits.

 

Lietojot šādu intervāla garumu, variācijas rinda iegūst racionālu samēru. Tā nav par daudz izstiepta un nav arī par daudz saspiesta, tā ka nezūd ieskats par sadalījuma īpatnībām atsevišķās tās daļās.

Aprēķinot racionālu intervāla garumu pēc 1.1. tabulas datiem ar Sterdžesa formulu (1.1), iegūstam

=.

Intervāla garumu izdevīgi izvēlēties veselos, aprēķiniem parocīgos skaitļos, vēl labāk, ja arī intervālu centri iznāk veseli skaitļi. Tādēļ, izveidojot 1.1. tabulu ir izmantots .

 

Novērtējot izveidoto variācijas rindu, secinām, ka visvairāk saimniecību ir ieguvušas ražību no 18 līdz 26 cnt/ha (vislielākie biežumi ir 3. un4. intervālos, kuri atrodas sadalījuma vidū). Šāda ražība ir raksturīga dotai ekoloģiskai grupai, kurā dominē smilts un mālsmilts augsnes. Tajā pat laikā šajā ekoloģiskajā grupā ir diezgan daudz saimniecību, kuras ieguvušas ievērojami augstāku ražību; ir arī saimniecības, kurās ražība zemāka. Tās vai nu atrodas īpatnējos dabas apstākļos, vai arī izmanto saimniecību pamatmasai neraksturīgu agrotehniku.

Statistikā izmanto arī kumulatīvās jeb uzkrāto biežumu variācijas rindas. Kumulatīvās variācijas rindas tabulā uzrāda variantus, resp., intervālus un uzkrātos biežumus. Tajos ieskaita visas tās kopas vienības, kurām reģistrētā pētāmās pazīmes vērtība ir mazāka vai vienāda ar attiecīgā intervāla augšējo robežu. Kumulatīvās variācijas rindas izveidošana ir parādīta 1.1. tabulas 6. un 7. ailēs.

 

 

 

 

Variācijas rinda izveidojas datu grupēšanas rezultātā. Grupēšana ir viena no statistisko datu apstrādes pamatmetodēm. Gandrīz katra grupējuma tabula satur variācijas rindu, bet parasti grupējuma tabulās ir rādītāji ne tikai par vienu, bet par divām vai vairākām pazīmēm. Tāpēc grupējumu tabulas pēc satura mēdz būt plašākas, piem., 1.1. tabulas pēdējā aile.

Statistiskās kopas vienības var sagrupēt ne vien pēc kvantitatīvas, bet arī pēc atributīvas pazīmes. Uzrādot tabulā vienību skaitu katrā izdalītajā grupā, iegūst atributīvu sadalījuma rindu.

Plašāk izpētīts un lietots ir atributīvās variācijas speciāls gadījums - alternatīvā variācija. Par alternatīvo variāciju runā tad, ja pazīme var iegūt tikai divas nozīmes, resp., ir iespējami tikai divi varianti, piemēram, vīrietis vai sieviete; strādājošais ar augstāko izglītību vai bez tās utt.

 

 

1.1.2. Variācijas rindu grafiskie attēli

 

Variācijas rindu grafiskie attēli padara uzskatāmāku pētāmās kopas sadalījumu pēc interesējošās pazīmes. Variācijas rindu var attēlot ar poligonu vai histogrammu, bet kumulatīvo rindu- ar kumulātu.

Poligonu izmanto galvenokārt diskrētu variācijas rindu attēlošanai. To izveido šādi: uz abscisu ass atliek attēlojamos variantus (pazīmes vērtības). Šajos punktos konstruē abscisu asij perpendikulārus taisnes nogriežņus, kuru garumi ir proporcionāli variantu biežumiem. Pēc tam blakus esošo nogriežņu virsotnes savieno ar taisnes nogriežņiem  un iegūst poligonu. Var rīkoties arī citādi. Koordinātu sistēmā atliek punktus, kuru koordinātas attiecīgi ir pazīmes vērtības (varianti) un to biežumi. Pēc tam, blakus esošos punktus savienojot ar taisnes nogriežņiem, iegūst poligonu.

Histogrammu lieto galvenokārt intervālu variācijas rindu attēlošanai. Uz abscisu ass atliek nogriežņus, kas atbilst variācijas rindas intervāliem. Pieņemot tos par pamatiem, konstruē taisnstūrus, kuru augstumi ir proporcionāli variantu biežumiem. Var izmantot kā absolūtos, tā relatīvos biežumus. Šādi attēlo vienāda garuma intervālu variācijas rindu.

Par intervāla blīvumu sauc intervāla biežuma attiecību pret intervāla garumu. Intervāla blīvums raksturo kopas vienību skaitu, rēķinot uz vienu variējošās pazīmes vienību.

 

Histogramma, kas attēlo 1.1. tabulas datus, ir parādīta 1.1. grafiskajā attēlā.

1.1. attēls. Lauksiamniecības uzņēmumu sadalījums pēc graudaugu ražības.

 

Kumulātu iegūst, attēlojot kumulatīvo variācijas rindu. Koordinātu sistēmā atliek punktus, kuru abscisas ir proporcionālas variantu lielumiem, bet ordinātas - attiecīgo variantu uzkrātajiem biežumiem (absolūtajiem vai relatīvajiem). Savienojot blakus esošos punktus ar taisnes nogriežņiem, iegūst lauztu līniju - kumulātu.

Ja ir jāattēlo intervālu variācijas rinda, par pirmā intervāla apakšējās robežas ordinātu ņem nulli, bet par augšējās robežas ordinātu - pirmā intervāla biežumu. Par otrā intervāla augšējās robežas ordinātu ņem otrā intervāla uzkrāto biežumu utt. Par pēdējā intervāla augšējās robežas ordinātu jāņem viss kopas apjoms (absolūto vai relatīvo biežumu summa).

 

Kumulāta, kas attēlo 1.1. tabulas datus (absolūtos biežumus), ir parādīta 1.2. attēlā.

 

1.2. attēls. Lauksaimniecības uzņēmumu sadalījums pēc graudaugu ražības.

 

 

1.1.3. Variācijas rindas raksturotāji

 

Variācijas rinda un tās grafiskais attēls dod izvērstu ieskatu par pētāmās kopas īpašībām. Taču šāda informācija ne vienmēr ir pietiekama - īpaši tad, ja ir jāsalīdzina divi vai vairāki sadalījumi. Bez tam variācijas rindas un to attēli aizņem samērā daudz vietas statistikas materiālos, tajās nav pietiekami augsts informācijas blīvums. Tādēļ statistikā izmanto rādītājus, kuri īsi un koncentrēti raksturo pašas galvenās sadalījuma īpašības.

Lai noskaidrotu, kādas sadalījuma īpašības vajadzētu raksturot šiem rādītājiem, aplūkosim divus sadalījumus, kas doti 1.2. tabulā un 1.3.attēlā. Tur parādītas divas variācijas rindas: divu ekoloģisko grupu saimniecību sadalījumi pēc graudaugu ražības.

 

1.3. attēls. Divu ekoloģisko grupu lauksaimniecības uzņēmumu sadalījumi
pēc graudaugu ražības, procentos.

 

 

Salīdzinot abus sadalījumus, ievērojam šādas atšķirības.

 

1. Kaut gan abu sadalījumu centrālie intervāli sakrīt, pirmās ekoloģiskās grupas sadalījumā lielāki biežumi ir pa labi, bet otrās ekoloģiskās grupas sadalījumā - pa kreisi no centrālā intervāla. Ja abu sadalījumu novietojumu uz skaitļu ass novērtē nevis pēc centrālā intervāla, bet pēc visiem intervāliem, tad pirmais sadalījums ir novirzīts vairāk pa labi lielāku skaitļu apgabalā, bet otrais pa kreisi - mazāku skaitļu apgabalā.Tādēļ ir vajadzīgs viens vai vairāki rādītāji, kas raksturo sadalījumu novietojumu uz skaitļu ass. Šim nolūkam noder t.s. lokācijas rādītāji. Sadalījuma lokāciju raksturo dažādi vidējie lielumi. Parasti tos sauc par sadalījuma centrālās tendences rādītājiem. Pēdējais apzīmējums ir piemērots tad, ja sadalījumam ir viens variants ar vislielāko biežumu un tas atrodas centrā. Bet, ja tādi varianti ir divi vai vairāki un tie neatrodas blakus, tad vienas centrālās tandences nav. Tomēr paliek sadalījuma lokācija jeb novietojums. Līdz ar to pēdējais termins ir pēc satura plašāks nekā termins “centrālā tendence”.

2. Sadalījumi var atšķirties ar apgabalu, ko tie aizņem uz horizontālās x ass. Piemērā vizuāli izskatās, ka šie apgabali ir vienādi vai līdzīgi, bet citos gadījumos tas tā nav. Līdz ar to otrai variācijas rindu raksturotāju grupai vajadzētu raksturot sadalījumu variāciju. Pie otrās grupas pieder tādi rādītāji kā variācijas apjoms jeb amplitūda, vidējā absolūtā novirze, standartnovirze jeb vidējā kvadrātiskā novirze, variācijas koeficients u.c.

3. Sadalījumi atšķiras ar savām simetrijas īpašībām.Piemērā abiem sadalījumiem ir nedaudz izstiepts labais, bet aprauts kreisais zars, turklāt otrajam sadalījumam šī īpašība ir izteiktāka. Tādēļ ir vajadzīgi rādītāji, kas raksturo variācijas rindas asimetriju.

 

1.2. tabula

 

Graudaugu ražība divu ekoloģisko grupu lauksaimniecības uzņēmumos

 

Grupas

nr.

Graudaugu ražība

cnt/ha

Saimniecību skaits ekoloģiskajās grupās

Saimniecību relatīvie biežumi ekoloģiskajās grupās (%)

Grupu statistiskie svari pēc graudaugu sējumu platības (%)

 

intervāli

intervālu centri

pirmajā

otrajā

pirmajā

otrajā

pirmajā

otrajā

1

2

3

4

5

6

10,01…14,0

14,01…18,0

18,01…22,0

22,01…26,0

26,01…30,0

30,01…34,0

12

16

20

24

28

32

4

27

47

43

26

8

17

48

60

37

15

3

3

17

30

28

17

5

9

27

33

21

8

2

2

16

30

28

18

6

10

25

32

22

9

2

Kopā

155

180

100

100

100

100

 

4. Otrās ekoloģiskās grupas saimniecību sadalījums (vismaz centrā) paceļas stāvāk virs horizontālās x ass, veidojot smailāku virsotni. Pirmās ekoloģiskās grupas saimniecību sadalījums veido lēzenāku figūru. Sadalījuma smailumu sauc par ekscesu.

 

Ja ir četri rādītāji, no kuriem viens raksturo variācijas rindas centrālo tendenci, bet pārējie - variāciju, asimetriju un ekscesu, tad variācijas rinda ir raksturota samērā pilnīgi. Bieži pietiek jau ar pirmajiem diviem sadalījuma raksturotājiem (centrālās tendences un variācijas rādītājiem).

Zinot, ka katru variācijas rindu var raksturot ar četrām īpašībām (centrālo tendenci, variāciju, asimetriju, ekscesu), var aprēķināt šīs īpašības raksturojošos rādītājus tieši pēc sākotnējiem datiem. Pašu variācijas rindu tabulas veidā šādā gadījumā vispār neizstrādā; nav redzams arī tās attēls. Tomēr pēc aprēķinātajiem raksturotājiem var diezgan labi iedomāties, kāda būtu variācijas rinda, ja to izveidotu.

Statistisko raksturotāju aprēķināšana tieši pēc sākotnējiem datiem ir ļoti izdevīga, ja datus apstrādā ar datortehniku. Tas dod iespēju gandrīz pilnīgi standartizēt skaitļošanas darbu. Bez tam pēc sākotnējiem datiem aprēķinātie raksturotāji ir precīzāki nekā pēc iepriekš grupētiem datiem aprēķinātie.

Precizitāte vairāk zūd tad, ja ir izmantots nedaudz intervālu(variantu). Ja intervālu daudz, precizitātes zudums mazāks.

Vēl jāatzīmē, ka ar statistiskajiem raksturotājiem mēs nepētām grupējuma rezultātā iegūtās variācijas rindas (tabulas) vai tās grafiskā attēla īpašības, kaut arī tāda raksturotāju interpretācija ir ļoti labi uzskatāma. Tiklab variācijas rinda kā grupējuma rezultāts, kā arī statistiskie raksturotāji atspoguļo paša statistiskā objekta (parādības) objektīvās īpašības - objektīvo vienību sadalījumu, ievērojot šo vienību dažādību. Tādēļ tiklab variācijas rinda (tabula), kā arī dažādie sadalījuma raksturotāji atspoguļo paša statistiskā objekta (kopas, kopuma) īpašības. Dažādus raksturotājus, piemēram, vidējos lielumus, var izmantot neatkarīgi no tā, vai vienlaikus izmanto, vai nē citus raksturotājus un metodes (grupējumu, grafisko analīzi u.c.). Metožu un rādītāju kompleksa izmantošana vienīgi padziļina to izpratni.

 

 

1.2. Vidējie lielumi un to īpašības

 

1.2.1. Vidējo lielumu nozīme un veidi

 

Vidējie lielumi atklāj masveida parādību raksturīgos līmeņus. Ja statistiskie dati ir sakopoti, izveidojot variācijas rindu, vidējais lielums raksturo to centrālo tendenci jeb novietojumu uz 0x ass (grafiskajā attēlā tas ir punkts uz abscisu ass).

Statistikā izšķir vairākus vidējo lielumu tipus, kurus var apvienot grupās. Pirmo un svarīgāko grupu veido pakāpju vidējie: aritmētiskais vidējais, harmoniskais vidējais, kvadrātiskais vidējais, ģeometriskais vidējais un citi. Otra svarīgākā grupa ir struktūras vidējie: moda un mediāna.

Vidējos lielumus nevar izvēlēties patvaļīgi. Katram vidējam lielumam ir savs saturs un īpašības, tādēļ to lietošana ir jāpamato, vadoties no pētijuma mērķa un uzdevumiem, kā arī apstrādājamās informācijas īpatnībām. Lai varētu izvēlēties vispiemērotāko vidējo, jāzina vidējo lielumu īpašības.

Izšķir vienkāršos jeb nesvērtos vidējos un svērtos vidējos.

Nesvērtos vidējos lieto vienmēr, ja ir jāaprēķina nesagrupētu absolūto lielumu vidējie. Citu lielumu, piemēram, relatīvo lielumu vidējos var rēķināt kā nesvērtos tikai tad, ja visas kopas vienības no pētāmās pazīmes veidošanās viedokļa ir vienādi lielas.

Svērtos vidējos galvenokārt lieto, rēķinot relatīvo (un citu atvasināto) lielumu vidējos pie kam kopas vienības, vadoties pēc kādas pētījumam nozīmīgas pazīmes, ir dažāda lieluma.

 

1.2.2. Pakāpju vidējie

 

Par pakāpju vidējiem sauc vidējos, kurus aprēķina, izmantojot šādas formulas. Vienkāršajiem vidējiem:

                                                                        ,                                                             (1.2.)

 

 

 

 

 

svērtajiem vidējiem:

                                           ,                                                   (1.3)

kur xi - i-tais novērojums (dats), bet, rēķinot variācijas rindas vidējo, -variants; n - kopas vienību skaits; fi - i-tās kopas vienības, bet, rēķinot sagrupētas variācijas rindas vidējo, varianta statistiskais svars;

z - pakāpes rādītājs, kas katram vidējā tipam ir atšķirīgs. Biežāk izmantotie pakāpju rādītāji ir šādi:

                                                -1 - harmoniskais vidējais;

                                                 0 - ģeometriskais vidējais;

                                                 1 - aritmētiskais vidējais;

                                                 2 - kvadrātiskais vidējais utt.

 

Formulas, kuras izmanto praktiskos aprēķinos, iegūst, aizstājot iepriekš minētajās formulās pakāpes rādītāju z ar vajadzīgo skaitli un izdarot nepieciešamos pārveidojumus.

 

 

1.2.3. Aritmētiskais vidējais

 

Aritmētisko vidējo iegūst, pakāpju vidējā formulā ņemot z=1. Tā kā x1=x un =x, tad vienkāršais aritmētiskais vidējais ir

                                                              ;                                                                 (1.4)

bet svērtais                               .                                                                (1.5)

 

Ja summēšanu izdara pa visu statistisko kopu, summēšanas robežas var neuzrādīt. Tātad . Ja summē tikai pa kādu kopas daļu, summēšanas robežas ir jāuzrāda.

 

Aprēķinot absolūto lielumu vidējo pēc nesagrupētiem datiem, vienmēr ir jālieto vienkāršais aritmētiskais vidējais. Absolūtie lielumi paši par sevi raksturo katra novērojuma lielumu(masu) statistiskā objekta jeb parādības kopējā apjoma veidošanā. Tādēļ kādi citi samērotāji statistisko svaru veidā nav vajadzīgi.

 

Piemērs. Aprēķināt vidējo mēneša darba algu 8 cilvēku brigādei, ja atsevišķiem brigādes strādniekiem šajā mēnesī ir izmaksāts: 215,27; 230,91; 190,15; 250,31; 201,50; 222,93; 219,10; 205,12 lati.

 

Šajā gadījumā ir jārēķina individuālu absolūto lielumu vidējais. Mūsu rīcībā ir tieši, nesagrupēti dati par katra strādnieka algu. Tādēļ ir jālieto vienkāršā (nesvērtā) aritmētiskā vidējā formula. Vienkāršā aritmētiskā vidējā lietošanas pamatojumu vēl var pastiprināt, ņemot vērā, ka visu strādnieku dati ir vienādi informatīvi vidējā lieluma veidošanā, kā arī zinot, ka  ir visiem strādniekiem izmaksātās naudas summa, tātad lielums ar reālu ekonomisku saturu.

 

 

Izdarot aprēķinus

 

Strādnieka vidējā mēneša alga pēc noapaļošanas ir 217 lati.

 

 

1.2.4. Svērtā aritmētiskā vidējā lietošana

 

Svērto aritmētisko vidējo visbiežāk lieto, aprēķinot relatīvo lielumu vidējo. Tāpat statistiskie svari ir jālieto aprēķinot kopējo vidējo no grupu vidējiem un dažos citos gadījumos. Ir lietderīgi izšķirt trīs uzdevumu grupas, kuru ietvaros lieto svērtos vidējos.

Pie pirmās grupas pieskaitīsim tos uzdevumus, kur, vadoties no kvalitatīviem (profesionāliem) apsvērumiem, visas statistiskā objekta vienības nav vienādi lielas (nozīmīgas, informatīvas) vidējā lieluma veidošanā. Pati pazīme x, kuras vidējais ir jāaprēķina, neraksturo šo lielumu. Piemēram, ja x ir intensitātes relatīvais lielums.

 

Piemērs. Aprēķināt iedzīvotāju vidējo blīvumu trīs Baltijas valstīs, ja ir zināmi dati par katru no tām: Latvijā 39,0, Lietuvā 56,8, Igaunijā 32,7 cilvēki uz km2 (deviņdesmito gadu vidū).

 

Rēķinot vienkāršo aritmētisko vidējo, rezultāts 42,8 ir neprecīzs, jo, vadoties no pētījamās pazīmes, visas valstis nav vienādi lielas. Pareizus rezultātus šajā gadījumā dod svērtā  aritmētiskā vidējā formula. Par x tajā jāņem iedzīvotāju skaits uz km2 katrā valstī, bet par f - valstu teritorijas platība t.km2. Tādēļ papildus uzdevuma datiem ir jānoskaidro šī platība: Latvijā 64,6, Lietuvā 65,3, Igaunijā 45,2 tūkst.km2.

 

Līdz ar to

         

 

Ja pazīme x, kurai rēķina aritmētisko vidējo, ir relatīvais lielums, piemērā - intensitātes relatīvais lielums (iedzīvotāju blīvums), tad reizinājums xf un arī summa  ir absolūtie lielumi, piemērā - iedzīvotāju skaits katrā valstī un visās trīs valstīs kopā. Piemērs parāda, ka pareizi izvēloties statistiskos svarus, ir jānodrošina lai lielumiem xf un būtu reāls statistisks saturs un tie būtu izšķiroši pētāmās problēmas izpētē.

Statistiskās novērošanas un sakopošanas gaitā vispirms iegūst absolūtos lielumus, bet relatīvos aprēķina vēlāk. Piemēra ietvaros par katru valsti vispirms nosaka iedzīvotāju skaitu xf un teritorijas platību f, no kā viegli iegūt vajadzīgās summas  un . Iedzīvotāju blīvumi x var palikt pat neizrēķināti vai nepublicēti. Vajadzīgo vidējo lielumu (vidējo iedzīvotāju blīvumu) var iegūt dalot vienu summāro absolūto lielumu ar otru, tātad kā jaunu intensitātes relatīvo lielumu. Tikai interpretācijas stadijā viņam tiek piešķirts vidējā lieluma saturs. Līdz ar to ir redzams, ka aritmētiskie vidējie lielumi un intensitātes relatīvie lielumi ir savā starpā ļoti cieši saistīti rādītāji.

Ja, rēķinot svērto aritmētisko vidējo, par statistiskajiem svariem nav pamatoti ņemt variantu atkārtošanās reižu skaitu, bet ir jāņem kāda cita pazīme (kura ir atšķirīga no x), svērtais aritmētiskais vidējais ir teorētiski vienīgais, kurš dod pareizu un precīzu vidējo, vadoties no uzdevuma profesionālās nostādnes. Vienkāršais vidējais šādā gadījumā dod tikai tuvinātu rezultātu.

Pie otrās grupas pieskaitīsim tos uzdevumus, kur vadoties no profesionāliem apsvērumiem visas kopas vienības ir vienādi lielas (nozīmīgas) vidējā lieluma veidošanā un pazīme x, kurai vidējais jārēķina, ir diskrēta. Tādā gadījumā skaitliski identiskus rezultātus iegūstam: 1) aprēķinot nesvērto vidējo pēc sākotnējiem, nesagrupētiem datiem un 2) aprēķinot svērto aritmētisko vidējo pēc grupētiem datiem, par statistiskajiem svariem ņemot vienību skaitu katrā grupā.

 

Piemērs. Aprēķināt vidējo atzīmi 10 studentu grupai, kuras eksaminācijas rezultāti ir šādi: 7;5;6;9;7;8;3;4;4;7 (dati bija jau nodaļas sākumā).

 

Uzdevuma atrisināšanai pēc brīvas izvēles var izmantot gan vienkāršā, gan svērtā aritmētiskā vidējā formulu. Lietojot vienkāršā vidējā formulu, par summējamiem lielumiem x jāņem visas iegūtās atzīmes (novērtējumi) :

 

.

 

Lai izmantotu svērtā aritmētiskā vidējā formulu, par x jāņem diskrētā vērtējuma varianti: 9; 8; …; 3, Jāsaskaita viņu atkārtošanās reižu skaits, to izmantojot par statistiskajiem svariem f. Ja variantu atkārtošanās reižu skaits ir saskaitīts, viegli uzrakstīt variācijas rindu. Tādēļ var uzskatīt, ka pirms vidējā lieluma rēķināšanas ir izdarīts statistisks grupējums.

 

x

f

9

8

7

6

5

4

3

1

1

3

1

1

2

1

10

Līdz ar to

 

Izteiksmes skaitītāju parasti aprēķina grupējuma tabulā, tajā papildus izveidojot aili xf.

Abu formulu lietošana šajā gadījumā dod identiskus rezultātus tādēļ, ka svērtā aritmētiskā vidējā formulā vienādu novērojumu (datu) tieša saskaitīšana tiek aizstāta ar reizināšanu.

Praktiski ieteicamās formulas izvēli nosaka tikai skaitļošanas darba ekonomija. Svērtā aritmētiskā vidējā lietošana ir efektīva tad, ja: 1) iepriekš ir izstrādāta diskrēta variācijas rinda vai tā jāizstrādā neatkarīgi no vidējā lieluma aprēķina; 2) variantu skaits ir daudzkārt mazāks par novērojumu skaitu, un darbu izpilda ar neprogrammējamu skaitļošanas tehniku. Vienkāršā aritmētiskā vidējā formula ir efektīva ja: 1) variantu skaits ir liels, resp., tuvs visu novērojumu skaitam; 2) sākotnējie dati ir fiksēti uz informācijas tehniska nesēja un skaitļošanu veic ar datoru.

Otrās uzdevumu grupas ietvaros dažkārt arī diskrētu absolūto lielumu aritmētisko vidējo ir lietderīgi aprēķināt kā svērto, ja vienādi absolūtie lielumi daudzkārt atkārtojas.

Pie trešās grupas pieskaitīsim uzdevumus, kad aritmētiskais vidējais jāaprēķina pēc intervālu variācijas rindas. Sākotnējie dati nav pieejami vai arī tos grūti atkārtoti apstrādāt tehnisku iemeslu dēļ. Pēc intervālu variācijas rindas vidējo aritmētisko vienmēr aprēķina kā svērto. Grupas ietvaros var izšķirt četras uzdevumu apakšgrupas, atkarībā no tā, kā izpildās zināmi priekšnosacījumi.

1. Par visām grupām(intervāliem) ir zināmi tās pazīmes x, kuras vidējais jārēķina, grupas vidējie lielumi. Izmantojot par variantiem grupu vidējos, saglabājam kopējā vidējā precizitāti.

2. Grupu vidējie nav zināmi; par to tuvinātām vērtībām pieņem intervālu centrus. Tādas aizvietošanas rezultātā kopējā vidējā precizitāte samazinās, turklāt vairāk, ja grupu maz un sadalījums nav simetrisks.

3. Vadoties no profesionāliem apsvērumiem, grupu lielumu tieši raksturo vienību skaits tajās vai arī ir zināmi citi grupu statistiskie svari, kuri precīzi raksturo grupu lielumu. Tad statistiskās svēršanas rezultātā vidējā precizitāte nesamazinās.

4. Prienoteikums 3. nav izpildāms. Par statistiskajiem svariem ir jāizmanto grupu absolūtie vai relatīvie biežumi, kaut gan tie tikai tuvināti raksturo grupu lielumu vidējā veidošanās procesā. Kopējā vidējā precizitāte tā rezultātā samazinās.

Aprēķinātais vidējais ir maksimāli precīzs, ja vienlaikus izpildas pirmais un trešais priekšnoteikums. Neprecizitāte var būt vislielākā, ja tie vienlaikus neizpildās, t.i. uzdevums vienlaikus attiecināms uz 2. un 4. apakšgrupām.

 

Piemērs. Aprēķināt pirmās ekoloģiskās grupas laukssaimniecības uzņēmumu vidējo graudaugu ražību pēc datiem, kas doti 1.1. tabulā.

 

Šajā gadījumā ir dota intervālu variācijas rinda, neuzrādot intervālu (grupu) vidējos. Grupu vidējo vietā kā to tuvinātas vērtības ir jāņem intervālu centri. Tā rezultātā nedaudz zaudējam kopējā vidējā precizitāti.

Par grupu statistiskajiem svariem varētu izmantot absolūtos vai relatīvos biežumus (saimniecību skaitu vai to īpatsvaru procentos). Bet piemērā tabulā ir doti dati arī par graudaugu sējumu platību katrā grupā (pēdējā aile). Šie lielumi ir pareizāki grupu statistiskie svari kopējās vidējās ražības veidošanas procesā nekā saimniecību skaits, tādēļ viņu lietošana dos precīzāku svērto vidējo. Graudaugu absolūtās sējumu platības vietā var izmantot sējumu platības struktūru pa grupām procentos, kas aprēķinu precizitāti nesamazina, bet padara tos ērtākus, jo statistisko svaru summa 100 ir aprēķiniem parocīgāks skaitlis. Aprēķinus var sakārtot tā, kā tas parādīts 1.7.tabulas pirmajās trīs ailēs(par statistiskajiem svariem ir izmantota sējumu platība procentos).

 

Tādējādi

Tātad vidējā graudaugu ražība pirmās ekoloģiskās grupas saimniecībās bija 22,5cnt/ha. Tāpat aprēķinot vidējo ražību otras ekoloģiskās grupas saimniecībās(1.1. un 1.2. tabula) iegūstam 20,0 cnt/ha. Starpība 2,5 cnt/ha raksturo abu statistisko kopu centrālās tendences atšķirību.

Aritmētisko vidējo grafiski attēlo punkts uz skaitļu ass x, virs kuras paceļas variācijas rindas histogramma, skat.1.3.attēlu. Histogrammai 1. tāds punkts ir 22,5, bet histogrammai 2. - 20,0. Šie punkti grafiski nozīmē atbilstošo histogrammu novietojumu centrus (lokāciju) uz skaitļu ass. Attālums starp šiem diviem punktiem, salīdzināmo vidējo starpība, (piemērā 22,5 - 20,0=2,5cnt/ha) vislabāk raksturo pētītās pazīmes atšķirību salīdzimāmajās kopās. Tātad pirmās ekoloģiskās grupas saimniecībās iegūta par 2,5cnt/ha augstāka graudaugu ražība nekā otras grupas saimniecībās.

Piemēra ietvaros vidējo ražību varētu precizēt, ja mūsu rīcībā būtu sākotnējie dati par graudaugu ražību un sējumu platību katrā saimniecībā. Tad aritmētisko vidējo varētu aprēķināt par x ņemot katras saimniecības faktisko ražību, bet par f - sējumu platību. Darba tabulā būtu 155 rindas (atbilsoši saimniecību skaitam) un kopsummas rinda. Strādājot ar datoru, tādus starprezultātus fiksē tikai mašīnas atmiņā.

Vēl labāk, ja mūsu rīcībā būtu dati par graudu kopražu un sējumu platību katrā saimniecībā. Tos summējot un izdalot kopražas kopsummu ar sējumu platības kopsummu, mēs iegūtu vidējo ražību kā intensitātes relatīvo lielumu. Tas būtu visprecīzākais rezultāts, jo absolūtos lielumus parasti pieraksta un publicē ar lielāku zīmīgo ciparu skaitu, turklāt uzdevuma atrisinājumam jāizpilda vismazāk darbību.

Redzam, ka piemēru, kurš ilustrē svērtā aritmētiskā vidējā lietošanas trešo uzdevumu grupu, var atrisināt precīzāk, reducējot to uz pirmo uzdevumu grupu, ja vien ir pieejama vajadzīgā sākotnējā informācija. Tādēļ īsto un teorētiski vispamatotāko svērtā aritmētiskā vidējā lietošanu raksturo pirmā uzdevuma grupa.

Savukārt, ja atrisinot izvirzīto uzdevumu, 1.1. tabulā nebūtu datu par sējumu platību pa grupām (pēdējā aile), par statistiskajiem svariem vajadzētu ņemt saimniecību skaitu pa grupām, kas samazinātu vidējā precizitāti.

Vispār, rēķinot svērto aritmētisko vidējo pēc intervālu variācijas rindas, tuvinājums ir pilnīgi pietiekams, ja intervāli ir pietiekami šauri un vienību skaits tajos ir liels. Tuvinājums ir nepietiekams, ja kopa ir sagrupēta tikai divās vai trīs grupās. Lielas kļūdas var rasties, ja grupējumā ir lietoti vaļējie intervāli, kuros ir daudz vienību, bet apstrādes gaitā tie formāli tiek pārveidoti par slēgtiem intervāliem, pieņemot, ka šie intervāli ir tikpat gari (lieli) kā pārējie.

 

 

1.2.5. Aritmētiskā vidējā īpašības

 

Arimētiskajam vidējam ir vairākas īpašības. Pirmās divas īpašības raksturo aritmētiskā vidējā būtību. Pārējās īpašības ir saistītas ar formulu pārveidojumiem, kas var atvieglot aritmētiskā vidējā aprēķinus.

 

1.Noviržu summa no aritmētiskā vidējā ir nulle(nulles īpašība).

, ja svari ir vienādi vai to nav,

, ja svari dažādi.                                                                     (1.6)

 

Pierādījums nesvērtam vidējam. Izteiksmē (1.6) summē katru locekli atsevišķi,  aizstāj ar tā vērtību no formulas(1.4) un konstantā lieluma  summēšanas vietā liek tā reizinājumu ar saskaitāmo skaitu n: .

 

2. Noviržu kvadrātu summa no aritmētiskā vidējā ir minimāla (vismazāko kvadrātu īpašība):

, ja c.

Šo pašu īpašību var izteikt arī ar vienādību

                        nesvērtam vidējam:

;                              (1.7)

 

                        svērtam vidējam:

.                      (1.7a)

 

Pierādījums nesvērtam vidējam.

 

No starpības x-c atņem un tai pieskaita konstantu lielumu , sagrupē saskaitāmos, binomu kāpina kvadrātā un konstantu lielumu saskaitīšanu aizstāj ar reizināšanu:

                

            

Bet, tā kā saskaņā ar aritmētiskā vidējā pirmo īpašību , tad otrais loceklis ir vienāds ar nulli un , no kā izriet, ka

 

Ir izstrādāti daudzi paņēmieni aritmētiskā vidējā aprēķina vienkāršošanai, ja ir jālieto rokas skaitļošanas mašīnas (kalkulatori). Agrāk matemātiskās statistikas kursos tiem pievērsa lielu vērību. Tagad, kad praktisko skaitļošanu veic ar datoriem, šos paņēmienus lieto reti un tie zaudē savu nozīmi. Tādēļ tos aplūkosim bez pierādījumiem un piemēriem.

3. Ja no visiem lielumiem x, kuru vidējo aprēķina (x var būt nesagrupēti dati, varianti vai intervālu centri) atņem vienu un to pašu konstantu lielumu c un starpībām x-c aprēķina aritmētisko vidējo, tad tas ir par to pašu konstanto lielumu c mazāks nekā sākotnējo datu aritmētiskais vidējais. Lai atrastu sākotnējo lielumu aritmētisko vidējo, samazināto lielumu vidējam jāpieskaita konstante c.

4. Ja visus nesagrupētus datus (variantus vai intervālu centrus) x samazina  reizes (izdala ar ) un dalījumiem aprēķina aritmētisko vidējo, samazināto lielumu vidējais ir jāreizina ar .

5. Ja visu datu (variantu) statistiskie svari ir vienādi, svērtais aritmētiskais vidējais ir vienāds ar vienkāršo vidējo.

6. Ja visu svaru sistēmu reizina vai dala ar vienu un to pašu skaitli, svērtais aritmētiskais vidējais nemaimās. Ja svaru summa ir vienāda ar 1, aritmētisko vidējo var aprēķināt pēc formulas , kur v - relatīvie biežumi. Tā kā , dalīšanai ar svaru summu nav nozīmes. No tā secina, ka aprēķinot svērto aritmētisko vidējo, absolūto biežumu vietā var lietot relatīvos biežumus.

7.Ja statistikā kopa ir sadalīta k grupās un ir izrēķināti grupu aritmētiskie vidējie, tad visas kopas svērto aritmētisko vidējo var aprēķināt kā grupu vidējo svērto aritmētisko vidējo:

                                                ,                                                                 (1.8)

 

kur  - i-tās grupas svērtais aritmētiskais vidējais;

        fi - i-tās grupas statistiskais svars;

        k - grupu skaits.

 

Ja, aprēķinot grupu vidējos, par statistiskajiem svariem pamatoti ir izmantots kopas vienību skaits apakšgrupās, tad katras grupas statistiskais svars ir vienāds ar kopas vienību skaitu grupā:fi=ni, turklāt .

 

 

1.2.6. Harmoniskais vidējais

 

Harmonisko vidējo iegūst, pakāpju vidējā formulā ņemot z=-1. Tā kā x-1=, tad

                         .                                                  (1.9)

Svērtā harmoniskā vidējā formula ir šāda:

                         .                                                                          (1.10)

 

 

1.2.7. Harmoniskā vidējā lietošana

 

Ja ir jāaprēķina absolūto lielumu vidējais, tad uzdevumos ar ekonomikas saturu praktiski vienmēr jālieto vienkāršais aritmētiskais vidējais. Jautājums ir sarežģītāks, ja ir jāaprēķina relatīvo lielumu vidējie, it īpaši intensitātes relatīvo lielumu vidējais.

Intensitātes relatīvo lielumu iegūst kā divu dažādu absolūto lielumu (pazīmju) attiecību (dalījumu). Mainot vietām šīs attiecības skaitītāju un saucēju, iegūst tiešos un apgrieztos intensitātes relatīvos lielumus.

 

Parādīsim, kā dažas ļoti svarīgas ekonomikas kategorijas skaitliski raksturo ar tiešajiem un apgrieztajiem intensitātes relatīvajiem lielumiem (skat. 1.3 tabulu).

 

1.3. tabula

Tiešie un apgrieztie intensitātes relatīvie lielumi, kas raksturo dažas svarīgas ekonomikas kategorijas

 

Pētījamā ekonomikas kategorija (parādība)

Tiešais lielums

x

Apgrieztais lielums

1. Darba ražīgums

 

 

Ražotā produkcija vienā laika vienībā (produkcijas daudzuma rādītāju dala ar patērētā darba laika rādītāju)

Darba patēriņš vienas produkcijas vienības ražošanai; darbietilpība (patērētā darba laika rādītāju dala ar ražotās produkcijas daudzuma rādītāju)

2. Ražošanas fondu izmantošanas līmenis

Ražotā produkcija uz vienu fondu vienību, parasti vērtības izteiksmē (fondu atdeve, kapitāla atdeve)

Ražošanas fondi (parasti vērtības izteiksmē) uz vienu produkcijas vienību (fondu ietilpība, kapitālietilpība)

3.Naudas pirktspēja

Preces daudzums, ko var nopirkt par vienu naudas vienību (latu)

Preces vienas vienības cena

4.Kapitāla (fondu) aprite

Investīcijas apjoms laika vienībā

Kapitāla (fondu) aprites laiks

5.Transporta kustības ātrums

Nobrauktais ceļa garums laika vienībā, piem. stundā

Laika patēriņš noteikta attāluma (piem., 100km) nobraukšanai

 

No matemātikas viedokļa tiešie un apgrieztie relatīvie lielumi ir savstarpēji apgriezti. Tādēļ formāli jebkuru no tiem var pieņemt par tiešo. Vadoties no rādītāju satura, ekonomikā par tiešajiem lielumiem sauc tos, kuri palielinās, no loģikas viedokļa palielinoties pētījamai ekonomikas kategrijai. Piem., pieaugot darba ražīgumam, palielinās ražotās produkcijas daudzums laika vienībā. Apgrieztie lielumi tādos pat apstākļos samazinās. Piemēram, pieaugot darba ražīgumam, samazinās darba patēriņš vienas produkcijas vienības ražošanai.

 

Viegli pārliecināties, ka tiešā un apgrieztā individuālo intensitātes relatīvo lielumu reizinājums ir 1:

Tādēļ ir loģiski nepieciešams, lai arī tiešo un apgriezto lielumu vidējie atbilstu šai sakarībai. Ir jānodrošina, lai

                                                               (1.11)

Izmantojot viegli pārskatāmu piemēru, parādīsim, kā to panāk (skat.1.4.tabulu).

 

1.4. tabula

Trīs strādnieku darba ražīguma analīze

 

Strādnieka tabelas Nr.

Ražota produkcija gab.

Patērēts darba laiks stundas

f

Darba ražīgums stundā

x

Darba patēriņš vienas vienības ražošanai

1.

16

8

2

0,5

2.

9

9

1

1,0

3.

9

6

1,5

0,667

Kopā

Vidēji

34

23

1,48

0,676

 

Aprēķinām tiešā un netiešā darba ražīguma rādītāju vidējos lielumus kā summāros intensitātes relatīvos lielumus:

(gabali stundā);

  (stundas viena gabala ražošanai).

Sakarība  izpildās, ņemot vērā, ka  un  pierakstīti tuvināti.

 

Pārbaudām, kā šos pašus lielumus var iegūt, lietojot svērto vidējo formulas.

Vidējais darba ražīgums ir

,

kas sakrīt ar iepriekšējo.

Par statistiskajiem svariem f izmantojām katra strādnieka patērēto (nostrādāto) darba laiku. Tas ir lielums, kurš, veidojot darba ražīguma tiešo rādītāju, atrodas attiecības saucējā.

Tādā pašā veidā rēķinot apgrieztā darba ražīguma rādītāja vidējo, pareizu rezultātu neiegūstam:

 

.

 

Pareizu apgriezto lielumu vidējo var iegūt divejādi.

Pirmais paņēmiens saglabā aritmētiskā vidējā formu, bet izmaina svaru sistēmu. Šajā gadījumā par svariem jāņem ražotās produkcijas daudzums, t.i. lielums, kurš atrodas individuālo apgriezto relatīvo lielumu saucējā, bet tiešo relatīvo lielumu skaitītājā.Šos svarus bieži apzīmē ar M un var aprēķināt arī šādi M=xf. Piemēram, pirmajam strādniekam M=2×8=16(gab.).

Tādējādi

.

 

Ja grib paturēt sākotnējo svaru sistēmu, tad apgriezto lielumu vidējais ir jārēķina kā harmoniskais vidējais (otrais paņēmiens).

Aizstājot formulā(1.10) x ar (jo mēs rēķinām nevis parasto, bet apgriezto lielumu vidējo) iegūst svērtā harmoniskā vidējā formulu, kādu parasti uzrāda statistikas kursos:

                                                                                                                 (1.12)

Lai nerastos ilūzija, ka šī formula pēc būtības atšķiras no (1.10) var izdarīt substitūciju  (apgrieztos relatīvos lielumus apzīmēt ar z), iegūstot formulu, kas precīzi sakrīt ar (1.10).

Piemērā

Esam ieguvuši pareizo rezultātu, ja neņem vērā atšķirības pēdējā skaitļa šķirā starprezultātu noapaļošanas dēļ.

Statistikas praksē nav vienprātības par to, vai vidējos  un  abus uzskatīt par aritmētiskiem vidējiem, kas ir jāaprēķina, izmantojot dažādas svaru sistēmas, vai attiecīgi par aritmētisko un harmonisko vidējo, kuri aprēķināti ar vienu un to pašu svaru sistēmu f.

Pēc mūsu domām pamatotāks ir otrais viedoklis, jo neprasa pamatot citu īpašu svaru sistēmu un vairāk akcentē uzmanību uz vidējā lieluma būtību, bet mazāk - uz izskaitļošanas tehniku. Pieņemot šo viedokli, var secināt, ka tiešo relatīvo lielumu vidējais ir jārēķina kā svērtais aritmētiskais vidējais, bet apgriezto relatīvo lielumu - kā svērtais harmoniskais vidējais.

 

Protams apgriezto lielumu vidējo var izskaitļot arī kā aritmētisko vidējo, izmainot sākotnējo svaru sistēmu M=xf, bet tas nemaina vidējā būtību. Tāpat ir iespējams izskaitļot pēc dotajiem individuālajiem apgrieztajiem lielumiem  sākotnēji nezināmos tiešos lielumus x, aprēķināt ar parasto svaru sistēmu f viņu svērto aritmētisko vidējo  un visbeidzot aprēķināt viņa apgriezto lielumu . Arī šāds ceļš ved pie vēlamā mērķa - apgriezto lielumu pareiza vidējā lieluma - un bieži ir ja ne īsāks, tad pārskatāmāks. Tomēr tas nemaina vidējā  būtību, kurš pēc savām īpašībām ir svērtais harmoniskais vidējais.

Dažādi ceļi vidējo lielumu aprēķināšanā ir iespējami tad, ja vienas un tās pašas kategorijas(parādības) skaitliskai raksturošanai ir definēti un tiek lietoti gan tiešie gan apgrieztie lielumi. Ekonomikā visbiežāk tā arī ir. Turpretī tehnikā nereti izmērī un lieto tikai vienu lielumu, piemēram, apgriezto.

Radioelektronikā, lai raksturotu rezistorus un dažus citus elektriskās ķēdes elementus, izmanto rādītāju “aktīvā pretestība” (omos, kiloomos, megaomos).Īstenībā tas ir apgrieztais lielums īpašībai “vadītspēja”. Pēdējā ir definēta un to izsaka “sīmensons’, taču praksē lieto reti. Tādēļ vajadzīgie aprēķini parasti ir jāizdara ar apgriestajiem lielumiem. Piemēram, radioamatierim ielodēšanai elektriskajā shēmā ir vajadzīga 500W aktīva pretestība. Tuvākā nominālā rezistoru vērtība, ko ražo saskaņā ar standartu, ir 510W. Ja ir vēlēšanās iegūt lielāku precizitāti, var saslēgt virknē divus zemomīgākus rezistorus, piem., 270 un 330W. Ja to pašu rezultātu grib sasniegt, saslēdzot paralēli divus vai vairākus augstomīgākus rezistorus, jālieto formula

kur R - vajadzīgā, bet R1 un R2 paralēli saslēgto rezistoru pretestības. Manipulējot ar R1 un R2 (vajadzības gadījumā R3 utt.) vērtībām, var iegūt vajadzīgo R.

Piem.,ja R vajadzīgs 500W, bet R1 izvēlamies 750W, tad R2 jāņem 1500W.

Iepriekšējā formula kļūst identiska ar harmoniskā vidējā formulu (1.10), ja tās abas puses pareizina ar n, tad nR=, piemērā tā ir harmoniskā vidējā divu izmantoto rezistoru (R1=750W un R2=1500W) pretestība nR=2×500=1000W.

Izdarīt analogus aprēķinus, izmantojot tiešos lielumus - rezistoru vadītspēju sīmensos - būtu šķietami vieglāk, bet praktiski tas grūtāk, jo visu elektrisko shēmu elementu aktīvās pretestības uzrāda omos, tāpat marķē rezistorus u.c. elementus, graduē mērinstrumentu skalas.

Tāda radioelektroniska lieluma kā kapacitāte apgrieztais lielums elementārajā radiotehnikā vispār netiek definēts. Tādēļ vairāku virknē saslēgtu kondensātoru kopējo kapacitāti vienmēr nākas aprēķināt ar formulu

kur C1, C2, … - virknē saslēgto kondensātoru kapacitātes, C - šīs ķēdes kopējā kapacitāte.

Pēdējās formulas tieši izriet no harmoniskā vidējā formulas.

Ja ekonomikā lietoto rādītāju un formulu izvēli nākas pamatot ar loģiskiem profesionāliem apsvērumiem, kas vienmēr pieļauj tādu vai citādu diskusiju iespēju, tad tehnikā (vismaz lielākajā daļā gadījumu) izdarīto aprēķinu un līdz ar to lietoto formulu pareizību viegli pārbaudīt ar tiešiem mērijumiem, izmantojot atbilstošos mērinstrumentus.

 

1.2.8.Ģeometriskais vidējais

 

Ģeometrisko vidējo iegūst kā pakāpju vidējā robežu, ja .

 

Ir pierādīts, ka šī robeža ir

                                                                                     (1.13)

 

Ģeometrisko vidējo izskaitļo, lietojot logaritmus:

                                                                                       (1.14)

 

Ja ir jāaprēķina svērtais ģeometriskais vidējais, lieto formulu

kuru pārveido logaritmējot,

                                  (1.15)

 

Ģeometriskā vidējā logaritms ir vienāds ar datu variantu logaritmu arimētisko vidējo.

Ģeometrisko vidējo galvenokārt lieto dinamikas rindu apstrādē. Ar to aprēķina vidējos augšanas tempus2.

 

Piemērs. Aprēķināt ikmēneša ķēdes augšanas tempus un vidējo augšanas tempu četros mēnešos, izmantojot 1.5. tabulas datus.

 

1.5.tabula

Rūpniecības uzņēmuma ražošanas apjoms

gada pirmajos četros mēnešos (tūkst.Ls)

 

 

Janvāris

Februāris

Marts

Aprīlis

Produkcijas apjoms

10,2

11,1

11,3

12,0

 

 

Atrisinājums. Ķēdes augšanas tempi ir šādi: TII:I==1,088; TIII:II==1,018; TIV:III==1,062.

 

Vidējo augšanas tempu aprēķina kā ģeometrisko vidējo:

 

 

 

 

 

 

 

 

___________________

2  Plašāk skat. grāmatas nodaļu par dinamikas rindām.

1.2.9. Kvadrātiskais vidējais

 

Kvadrātisko vidējo iegūst, pakāpju vidējā formulā ņemot z=2. Tad

                        .                                                 (1.16)

Svērto kvadrātisko vidējo aprēķina pēc formulas

                    .                                         (1.17)

 

Kvadrātisko vidējo plašāk lieto divos gadījumos.

Pirmais gadījums. Ir jārēķina vidējais datiem, kuri ir izteikti novirzēs no kāda cita vidējā. Piemēram, ir jāaprēķina detaļu svara vidējā novirze no normas. Šajā gadījumā nevar rēķināt noviržu aritmētisko vidējo. Tas vislabāk saprotams tad, ja noviržu no normas vietā ņem novirzes no aritmētiskā vidējā (vidējā svara). Tādu noviržu algebriskā summa saskaņā ar aritmētiskā vidējā pirmo īpašību vienmēr ir vienāda ar nulli. Tāpat arī noviržu no normas summa parasti ir tuva nullei. Šādā gadījumā summējot novirzes, ir vai nu jāsummē noviržu absolūtās vērtības, vai arī noviržu kvadrāti. Pēdējo summu dalot ar noviržu skaitu iegūstam kvadrātisko vidējo.

Aprēķinot vidējo kvadrātisko novirzi, mēs īstenībā raksturojam ne pazīmes centrālo tendenci, bet pazīmes variāciju. Tādēļ vidējā kvadrātiskā novirze (standartnovirze) plašāk tiks aplūkota apakšnodaļā “Variācijas rādītāji”.

Otrais gadījums. Ir jāaprēķina kādu lineāru mērījumu (kvadrātu malu, apļu diametru u.t.t.) vidējais lielums, turklāt zinātniski praktiska interese ir ne tikdaudz par pašiem šiem mērijumiem, bet par figūru laukumiem, ko šie mērījumi raksturo.

Aprēķinot, piemēram, vidējo kvadrātisko apļu diametru, ar tā palīdzību var konstruēt apli, kura laukums atbilst sākotnējo apļu laukumu aritmētiskai vidējai vērtībai. Ejot šādu ceļu, dažreiz vieglāk aprēķināt visu novēroto figūru (apļu) kopējo laukumu. Netiešā veidā šo paņēmienu lieto mežu taksācijā, novērtējot koksnes krājumu kādā platībā pēc atsevišķu koku diametra (krūšu augstumā) mērījumiem. Vēl jāņem vērā koku garums.

 

 

1.2.10. Pakāpju vidējo mažoritāte

 

Katram statistikas uzdevumam, kurā jāaprēķina vidējais lielums, vispiemērotākais ir viens noteikts vidējais, kurš vislabāk atspoguļo pētāmo objektu vai parādību. Tomēr formāli katrā uzdevumā var aprēķināt visus vidējā lieluma veidus. Līdz ar to var rasties jatājums kā, lietojot dažādus vidējā lieluma veidus, atšķirsies iegūtie rezultāti.

Ja pēc vienas un tās pašas informācijas, izmantojot vienus un tos pašus statistiskos svarus, aprēķina vairākus pakāpju vidējos, tad lielāks ir tas vidējais, kura formulā ir lielāks pakāpes rādītājs z. Šo likumu sauc par pakāpju vidējo mažoritātes likumu un pierāda vispārīgā veidā. Saskaņā ar mažoritātes likumu

                                   ,                                                                  (1.18)

 

kur x-1 - harmoniskais vidējais (z=-1); x0 - ģeometriskais vidējais (z=0);  - aritmētiskais vidējais (z=1);  - kvadrātiskais vidējais (z=2).

Mažoritātes likums nav spēkā vienīgi triviālajā gadījumā, ja vidējie tiek aprēķināti konstantu lielumu virknei. Dažādi vidējie vairāk atšķiras tad, ja datu variācija ir lielāka.

 

 

1.2.11. Mediāna un kvartiles

 

Pazīstamākie struktūras vidējie ir mediāna un moda. Par mediānu sauc augošā vai dilstošā kārtībā sakārtotas variācijas rindas vidū esošu variantu.

Ja vienību skaits variācijas rindā ir nepāra skaitlis 2m+1, tad sakārtotas rindas mediāna ir xm+1. Ja vienību skaits ir pāra skaitlis 2m, tad mediāna ir variantu xm un xm+1 aritmētiskais vidējais. Apzīmējot mediānu ar simbolu Me, to pašu var parādīt formulās

                               Me=xm+1, ja n=2m+1;                                                                      (1.19)

 

                               Me=, ja n=2m.                                                            (1.20)

 

Lai atrastu mediānu intervālu variācijas rindai, vispirms ir jāatrod mediānas jeb mediālais intervāls. To atrod, izmantojot kumulatīvo variācijas rindu. Mediānas intervāls ir tas, kurā uzkrātie absolūtie biežumi pirmo reizi pārsniedz pusi no kopas vienību skaita vai kurā uzkrātie relatīvie biežumi pirmo reizi pārsniedz 50%. Tālāk pieņem, ka mediānas intervāla ietvaros varianti sadalās vienmērīgi. Tas dod pamatu izmantot interpolācijas formulu.

                               Me=,                                                         (1.21)

kur          x0 - mediānas intervāla apakšējā robeža;

                - mediānas intervāla garums;

               SMe-1 - uzkrātais biežums intevālā, kas atrodas pirms mediānas intervāla;

               fMe - mediānas intervāla biežums;

                - kopējais novērojumu skaits variācijas rindā.

 

Piemērs. Aprēķināt mediānu 1.1. tabulā dotajai variācijas rindai.

 

Mediānas intervālu var noteikt tieši no tabulas. Tas ir intervāls 18,01…22,0 cnt/ha, jo tajā uzkrātais relatīvais biežums3 pirmo reizi pārsniedz 50% (piemērā tieši 50%). Pēc tabulas datiem nosaka mediānas aprēķināšanas formulā vajadzīgos lielumus:

x0=18; =4; SMe-1=20; fMe=30; =50.

Tālāk var lietot formulu (1.21).

Me=(cnt/ha).

 

 

 

 

 

 

________________________

3  Rēķinot mediānu, modu u.c. rādītājus, parasti interesējas tieši par kopas vienību (saimniecību) sadalījumu, tādēļ attiecīgos biežumus arī izmanto aprēķinos. Tomēr var būt gadījumi, kad ir lietderīgi izmantot tos statistiskos svarus, kurus lietojām svērtā aritmētiskā vidējā aprēķināšanā (sējumu platību sadalījumu). Tad mediāna raksturos ražību, kura visu sējumu platību dala divās vienādās daļās, un tā būs labāk salīdzināma ar svērto aritmētisko vidējo.

Mediāna ir 22cnt/ha. Tā sakrīt ar mediānas intervāla augšējo robežu, jo uzkrātais biežums šajā intevālā sasniedz tieši 50%. Ja tas 50% pārsniegtu, mediāna atrastos mediānas intervāla robežās. Ja saimniecību sadalījums mediānas intervāla robežās ir vienmērīgs4 , tad pusē no visas kopas saimniecībām graudaugu ražība ir bijusi mazāka par 22cnt/ha, bet pusē - lielāka. Šīs pašas kopas graudaugu ražības aritmētiskais vidējais bija 22,5cnt/ha. Tā tas ir vienmēr, kad sadalījums nav simetrisks. Ja sadalījums ir pilnīgi simetrisks, mediāna un aritmētiskais vidējais ir vienādi. Izmantojot šo īpašību, var izveidot samērā vienkāršus sadalījuma asimetrijas rādītājus.

Analogi mediānai aprēķina arī virkni citu variācijas rindas struktūras rādītāju. Šie rādītāji gan nav pieskaitāmi vidējiem lielumiem, tomēr, ņemot vērā viņu lietderību, izdarot samērā vienkāršu sadalījuma analīzi, dažus no tiem aplūkosim.

Plaši lieto sadalījuma kvartiles. Tās ir pētītās pazīmes vērtības, kas sakārtotu variācijas rindu dala četrās līdzīgās daļās tā, ka katrā no tām nonāk 25% kopas vienību. Ir trīs kvartiles: pirmā Q1, otrā Q2 un trešā Q3. Pirmā kvartile ir pazīmes vērtība par kuru sakārtotā rindā 25% kopas vienībām ir reģistrētas mazākas vērtības. Otrā kvartile tādā pat veidā nodala 50% kopas vienību, tātad ir vienāda ar mediānu, bet trešā 75% kopas vienību.

Ja mediāna jau ir aprēķināta, otrā kvartile vairs nav jāaprēķina. Lai aprēķinātu pirmo un trešo kvartili, grupētu datus gadījumā vispirms nosaka šīs kvartiles saturošos intervālus. Tie ir intervāli, kur sakārtotu uzkrāto biežumu rindā biežumi pirmo reizi pārsteidz attiecīgi 25% un 75% no kopas vienību skaita.

Pašas kvartiles atrod ar interpolācijas formulām, kas ir analogas mediānas formulai.

         

Q1=x1+,                                                      (1.22)

Q3=x3+,                                                      (1.23)

kur

Q1 un Q3 - pirmā un trešā kvartile,

x1 un x3 - pirmo un trešo kvartili saturošo intervālu apakšējās robežas,

 - kvartili saturošā intervāla garums. Formulas lietošana pamatotāka, ja visi intervāli ir vienāda garuma, vismaz kvartili saturošais un iepriekšējais intervāli,

 un  - tā intevāla, kurš atrodas pirms attiecīgā kvartili saturošā intervāla, uzkrātais biežums,

 un  - attiecīgo kvartili saturošā intervāla tiešais (neuzkrātais) biežums,

 - kopas vienību skaits.

 

Variācijas rindas otrā kvartile ir mediāna Q2=Me.



 

 

 

 

 

________________________

4  Šī atruna, kas ir vajadzīga vispārējam gadījumam, nav vajadzīga piemēram, jo mediāna sakrīt ar intervāla robežu.

Aprēķināsim pirmo un trešo kvartili lauksaimniecības uzņēmumu sadalījumam pēc 1.1.tabulas datiem, izmantojot saimniecību skaita uzkrātos relatīvos biežumus. Pēc 7.ailes datiem ir redzams, ka 1.kvartile atrodas 3.intervālā (turpat kur mediāna), jo uzkrātais relatīvais biežums 50% pirmo reizi pārsniedz 25%. Trešā kvartile atrodas 4.intervālā, jo uzkrātais relatīvais biežums 78% pirmo reizi pārsniedz 75%. Līdz ar to no 1.1 tabulas var nolasīt formulās ievietojamos lielumus :

x1=18; x3=22; =4; =20; =50;

=30; =28; =100.

 

Izdarot attiecīgos ievietojumus, iegūstam, ka

Q1=18+4(cnt/ha);

Q3=22+4(cnt/ha).

 

Atrastos lielumus interpretē tā, ka dotajā ekoloģiskajā grupā ir 25% saimniecību, kur graudaugu ražība bija mazāka par 18,7cnt/ha, un 25% saimniecību, kur ražība bija virs 25,6cnt/ha. Atceramies, ka mediāna, kas dala sadalījumu uz pusēm, bija 22cnt/ha.

Sakārtotu variācijas rindu desmit vienādās daļās dala deciles, kuras aprēķina līdzīgi kvartilēm.

Variācijas rindu piecās līdzīgās daļās dala kvintiles, bet 100 vienādās daļās - procentiles. Kvartiles, kvintiles, deciles u.c. šādus rādītājus apzīmē ar kopēju terminu - kvantiles.

Pēdējā laikā statistikas praksē ļoti plaši lieto deciļu grupējumus.

Piemēram dzīves līmeņa statistikā visas pēc ienākuma uz vienu mājsaimniecības locekli augošā secībā sakārtotas mājsaimniecības sadala desmit vienādās daļās.

Tālāk var sīkāk izpētīt, piemēram, pirmo deciles grupu, t.i. 10% vistrūcīgāko mājsaimniecību, aprēķinot dažādus citus rādītājus par šo grupu (vidējo mājsaimniecību locekļu skaitu, izdevumus pārtikas iegādei u.t.t.). Līdzīgu raksturojumu var izstrādāt par visām citām sabiedrības desmitdaļām.

Kvantiles un vispār kopas vienību sakārtošanu (ranžēšanu) plaši izmanto neparametriskā statistikā (skat. grāmatas pēdējo nodaļu).

 

 

1.2.12. Moda

 

Par modu Mo sauc variantu, kurš sadalījuma rindā ir sastopams visbiežāk. Diskrētā vai atributīvā variācijas rindā moda nolasāma tieši kā variants ar vislielāko absolūto vai relatīvo biežumu.

Intervālu rindā vispirms jānosaka modas jeb modālais intervāls. Tas ir intervāls ar vislielāko biežumu.

Iepriekšējā piemērā modālais intervāls ir no 18 līdz 22cnt/ha, jo šajā intevālā ir 30% saimniecību - vairāk kā jebkurā citā intervālā. Konkrētajā piemērā modālais intervāls sakrīt ar mediānas intervālu. Citos gadījumos tas tā var nebūt.

 

 

 

 

 

 

 

Intervālu variācijas rindai modu aprēķina pēc interpolācijas formulas (1.24)(tās pamatā ir hipotēze, ka sadalījums intervālu ietvaros ir vienmērīgs):

           Mo=x0+,                                                   (1.24)

kur              Mo - moda;

       x0 - modālā intervāla apakšējā robeža;

        - modālā intervāla garums;

        fMo - modālā intervāla biežums;

        fMo-1 - pirmsnodālā intervāla biežums;

        fMo+1 - pēcmodālā intervāla biežums.

 

Aprēķināsim modu 1.1.tabulā dotajai variācijas rindai. No tabulas atrodam, ka x0=18; =4; fMo=30; fMo-1=17; fMo+1=28. Tad pēc formulas (1.24.)

Mo=x0+

=18+4(cnt/ha).

 

Graudaugu ražības modālais lielums jeb visbiežāk sastopamā ražība šīs kopas saimniecībās ir 21,5cnt/ha. Piemērā mediānas intervāls sakrīt ar modālo intervālu, taču pašas mediāna un moda ir atšķirīgas.

Nosakot mediānu, ņem vērā visus rindas locekļus, bet modu nosaka galvenokārt modālais intervāls; interpolācijas gadījumā bez tam ņem vērā vēl pirmsmodālo un pēcmodālo intervālus. Par sadalījuma raksturu pārējās variācijas rindas daļās, aprēķinot modu, neinteresējas.

Modu lieto galvenokārt tad, ja ir svarīgi izdalīt tieši to variantu, kurš sastopams visbiežāk. Sevišķi raksturīgi tas ir diskrēta sadalījuma gadījumā. Tā, piemēram, preču pieprasījuma statistikā moda var būt visbiežāk pieprasītais apavu numurs, gatavo apģērbu numurs utt. Rēķināt šajā gadījumā aritmētisko vidējo ir maznozīmīgi, jo nav vajadzīgs un nav paredzēts ražot, piemēram, apavus, kuru izmērs tieši atbilstu aritmētiskajam vidējam (izmēru numurs ar desmitdaļām un simtdaļām). Tāpat moda ir svarīgs atributīvas sadalījuma rindas raksturotājs, jo aritmētisko vidējo lielumu un mediānu šādām rindām nevar aprēķināt. Piemēram, var noteikt modālo (visizplatītāko) tautību, bet nevar izrēķināt vidējo tautību.

Var salīdzināt, kurš centrālās tendences rādītājs - aritmētiskais vidējais, mediāna, moda - ir vairāk un kurš mazāk informatīvs. Aprēķinot aritmētisko vidējo nesagrupētu skaitļu rindai, aprēķinos ņem vērā katra skaitļa tiešo vērtību (lielumu). Tādēļ aritmētiskais vidējais ir maksimāli informatīvs centrālās tendences rādītājs. Aprēķinot mediānu, ņem vērā tikai katra skaitļa vietu ranžētā rindā, bet ne tā tiešo vērtību. Tādēļ daļa derīgās informācijas tiek zaudēta, un mediāna ir mazāk informatīvs centrālās tendeces rādītājs nekā aritmētiskais vidējais. Modu nosaka tikai modālais variants, bet intervālu variācijas rindas gadījumā - modālais (daļēji pirms un pēcmodālais) intervāli. Visa informācija, ko satur pārējie intervāli netiek izmantota. Tādēļ moda ir vismazāk informatīvs centrālās tendences rādītājs.

 

 

 

 

 

 

 

1.3. Variācijas rādītāji un to īpašības

 

1.3.1. Variācijas rādītāji

 

Visvienkāršākais variācijas rādītājs ir variācijas amplitūda jeb variācijas apjoms. Par variācijas amplitūdu sauc starpību starp pazīmes lielāko un mazāko novēroto skaitlisko vērtību. Apzīmējot šo rādītāju ar Rv, var rakstīt, ka

 

                                     Rv=xmax-xmin,                                                                             (1.25)

 

kur xmax - pazīmes lielākā, bet xmin - mazākā vērtība.

 

Diskrētā variācijas rindā variācijas amplitūdu var noteikt tieši un precīzi. Ja ir dota intervālu rinda, variācijas amplitūdu var noteikt tikai aptuveni. Ja par pazīmes mazāko vērtību ņem pirmā intervāla apakšējo robežu, bet par lielāko vērtību - pēdējā intervāla augšējo robežu, tad variācijas amplitūda ir nedaudz palielināta. Ja par šīm robežām ņem atbilstošo intervālu centrus, variācijas amplitūda parasti ir nedaudz samazināta.

Iepriekš (1.1. tabulā) apskatītajam saimniecību sadalījumam pēc graudaugu ražības variācijas amlitūda pēc pirmās metodes ir Rv=34-10=24(cnt/ha), pēc otrās metodes 32-12=20(cnt/ha).

Īsto variācijas amplitūdu var konstatēt, izskatot sākotnējos, nesagrupētos datus.

Darba algas variācijas amplitūda 1.2.3.paragrāfā apskatītajā piemērā par 8 strādnieku brigādi ir Rv=250,31-190,15=60,16(lati).

Variācijas amplitūda ir diezgan nedrošs variācijas rādītājs, jo tā ir atkarīga tikai no galējiem variantiem. Nesagrupētu datu gadījumā - no divām viskrasāk atšķirīgajām kopas vienībām. Statistikas praksē diezgan grūti nodrošināt pilnīgu kopas viendabīgumu, tāpēc ir diezgan liela iespēja, ka samērā viendabīgā kopā iekļūst viena vai vairākas krasi atšķirīgas vienības. Tādā gadījumā variācijas amplitūda būs ievērojami palielināta.

Vidējo absolūto jeb vidējo lineāro novirzi definē kā aritmētisko vidējo no atsevišķu novērojumu (variantu) absolūtajām novirzēm no aritmētiskā vidējā. Ja apstrādā nesagrupētus absolūtos lielumus, kā arī tad, ja variantu statistiskie svari ir vienādi, lieto formulu

 

                                   ,                                                            (1.26)

 

kur  - vidējā lineārā novirze; n - kopas vienību skaits.

Ja atsevišķu novērojumu svari ir dažādi kā arī tad, ja ir jāapstrādā grupēti dati, jālieto svērtā vidējā lineārā novirze:

                                                                                         (1.27)

kur f - statistiskie svari.

 

Tā kā formulās (1.26) un (1.27) tiek summētas nevis novirzes, bet to moduļi, tad vidējās lineārās novirzes īpašības ir sarežģītas.

Tādēļ šo variācijas rādītāju statistikas praksē lieto reti. Tā lietošana ir pamatota tad, ja aritmētiskā vidējā  vietā izmanto mediānu Me. Mediāna un vidējā lineārā novirze ir savstarpēji saistīti rādītāji. Par to liecina viena no svarīgākajām mediānas īpašībām: summa, kuru iegūst saskaitot novērojumu absolūtās novirzes no mediānas, ir mazāka nekā summa, kuru iegūst, saskaitot novērojuma absolūtās novirzes no jebkura cita lieluma, kas nav vienāds ar mediānu, t.i.,

                    , ja cMe.                                            (1.28)

Dispersija ir statistikā visvairāk lietotais variācijas rādītājs. To apzīmē ar s2 vai . Apzīmējumu s2 lieto, ja dispersiju aprēķina pēc izlases datiem, kura ņemta no kādas plašākas ģenerālkopas, un izlase to reprezentē. Ģenerālkopas dispersiju un dispersiju teorētiskos pētījumos apzīmē ar . Plašāk šie jautājumi aplūkoti nodaļā “Izlases metode”.

Ja novērojumu statistiskie svari ir vienādi vai arī tos var neņemt vērā, dispersiju aprēķina pēc formulas

s2=.                                             (1.29)

 

Ja statistiskie svari jāievēro, lieto svērtās dispersijas formulu

                                                                        s2=.                                           (1.30)

 

Statistiskie svari jāievēro vienmēr, ja ir jāapstrādā iepriekš sagrupēti dati, tā kā par x jāņem nevis atsevišķs novērojums, bet varianti.

Samērā bieži kā starprezultātu fiksē noviržu kvadrātu summu, kas ir dispersijas formulas skaitītājs. To apzīmē ar Q:

Q= vai Q=.

 

Aprēķināsim dispersiju, izmantojot dažu iepriekšējā apakšnodaļā doto piemēru datus.

 

1. Strādnieku algas dispersiju 8 cilvēku brigādē (sk. 1.2.3.§) aprēķina pēc formulas 1.29., iepriekš izrēķinot, ka aritmētiskais vidējais ir 216,91 lati. Aprēķinus izdevīgi sakārtot tabulā.

 

1.6.tabula

Darba tabula dispersijas aprēķināšanai

 

Novērojumi x

215,27

230,91

190,15

250,31

201,50

222,93

219,10

205,12

Novirzes
 x-

-1,64

14,00

-26,76

33,40

-15,41

6,02

2,19

-11,79

~0

Noviržu kvadrāti
(x-)2

2,690

196,000

716,098

1115,560

237,468

36,240

4,796

139,004

2447,856

 

s2=

 

Dispersijas vienība formāli ir sākotnējās datu vienības kvadrāts, piemērā iznāk lati kvadrātā, kam nav reāla ekonomiska satura. Tādēļ dispersija ir svarīgs starprezultāts citu ekonomiski interpretējamu variācijas rādītāju aprēķināšanai, kā arī variācijas pakāpes salīdzinošai novērtēšanai dažādās kopās vai vienas kopas daļās. Tiešus ekonomiskus secinājumus pēc dispersijas neizdara. Tos izdara, aprēķinot standartnovirzi un variācijas koeficientu, kuri aplūkoti šī paragrāfa beigu daļā.

Tāpat profesionālas interpretācijas nav noviržu kvadrātu summai. Arī tās formālā vienība ir sākotnējās vienības kvadrāts. Tās vienīgā nozīme varētu būt uzmanības pievēršana, mainot sākotnējo vienību. Ja latu vietā gribam izmantot tūkstošus latu, tad tiklab absolūtie, kā vidējie lielumi jādala ar 1000, bet dispersija un noviržu kvadrātu summa ar 10002=1000000.

2. Aprēķināsim atzīmju dispersiju 10 studentu grupai, sākotnējie dati par kuru bija doti nodaļas sākumā (1.1.1§), bet vidējās atzīmes aprēķins 1.2.3§ 2. piemērā.

Tā kā šajā gadījumā variantu nav daudz, ir izdevīgi saskaitīt to atkārtošanās reižu skaitu un lietot formulu (1.30). Tā kā aprēķini ir nelieli, tos var izpildīt, ievietojot datus tieši formulā, neizvēršot darba tabulā.

.

3. Aprēķināsim graudaugu ražības dispersiju, izmantojot 1.1.tabulas datus par statistiskajiem svariem izmantojot sējumu platību īpatsvarus procentos. Strādājot ar neprogrammējamu skaitļošanas mašīnu, darbu ērti izpildīt tabulā skat.1.7.tabulu. Tajā vienlaikus ir izskaitļota arī summa , kas nepieciešama svērtā aritmētiskā vidējā aprēķināšanai.

 

1.7.tabula

 

Darba tabula svērtā aritmētiskā vidējā un svērtās dispersijas aprēķināšanai graudaugu ražībai pirmās ekoloģiskās grupas saimniecībām pēc 1.1 tabulas datiem

 

Ražības varianti

x

Sējumu platība,

procentos

f

 

xf

 

x-

 

(x-)2

 

(x-)2f

12

16

20

24

28

32

2

16

30

28

18

6

24

256

600

672

504

192

-10,48

-6,48

-2,48

 1,52

 5,52

 9,52

109,8304

41,9904

6,1504

2,3104

30,4704

90,6304

219,6608

671,8464

184,5120

64,6912

548,4672

543,7824

Kopā

100

2248

5

5

2232,9600

 

Izmantojot 1.7.tabulā iegūtās summas, aprēķinam:

(cnt/ha);

Analogi aprēķini par otro ekoloģisko grupu (skat.1.2.tabulu), dod s2=22,5584.

 

Lai iegūtu ekonomiski labi interpretējamu variācijas rādītāju, lieto standartnovirzi jeb vidējo kvadrātisko novirzi. Standartnovirzi definē kā kvadrātsakni no dispersijas un apzīmē ar s vai s:

                        s=                                                       (1.31)

 

 

 

Izmantojot statistiskos svarus,

                                                s=.                                                                 (1.32)

 

Graudaugu ražības standartnovirzes iepriekš apskatītajā piemērā ir šādas:

pirmajā grupā               s1==4,7254(cnt/ha);

otrajā grupā                  s2==4,7496(cnt/ha).

 

Standarnovirze, tāpat kā aritmētiskais vidējais, ir izteikta variējošās pazīmes vienībās,  piemērā - centneros no ha. Tādēļ šos rādītājus parasti uzrāda kopā.

Graudaugu vidējā ražība pirmās ekoloģiskās grupas saimniecībās ir 22,48 cnt/ha ar standarnovirzi 4,73 cnt/ha, bet otrās - 20,04 cnt/ha ar standartnovirzi 4,75 cnt/ha. Ražības absolūtā variācija abās ekoloģiskajās grupās ir praktiski vienāda.

Standartnovirzes saturu vislabāk saprast, izveidojot centrētu, divkāršotu variācijas standartintervālu. Tā apakšējo robežu atrod, atskaitot no aritmētiskā vidējā standartnovirzi, bet augšējo - pieskaitot aritmētiskajam vidējam standartnovirzi. Piemērā par pirmo ekoloģisko grupu divkāršota centrēta ražības variācijas standartintervāla apakšējā robeža ir 22,48-4,73=17,75, bet augšējā robeža 22,48+4,73=27,21 (cnt/ha). Ja sējumu platību sadalījums pēc graudaugu ražības ir normāls, šajā intervālā teorētiski ietilpst 68% sējumu platību. 1.1.tabulā uzrādīto intervālu robežas nesakrīt ar tikko aprēķinātā variācijas standartintervāla robežām. Izdarot tuvinātu intervālu sadalīšanu, pēc 1.1.tabulas iznāk, ka variācijas standartintervālā nonāk aptuveni 68% no sējumu platības. Tātad faktiskais sējumu platību sadalījums tā centālajā daļā labi atbilst normālajam sadalījumam. Plašāk šie jautājumi aplūkoti apakšnodaļās “Normālais sadalījums”, “Normālā sadalījuma aprēķināšana” u.c.

Aritmētiskais vidējais un standartnovirze dod skaidri interpretējamus rādītājus gan par pazīmes vidējo lielumu, gan par tās absolūto variāciju. Tomēr divu vai vairāku variācijas rindu standartnovirzes savā starpā ir salīdzināmas vienīgi tad, ja abu rindu vienības ir vienādas. Tad tās parāda, kurā rindā ir lielāka absolūtā variācija. Ja salīdzināmo rindu vienības ir dažādas, standartnovirzes nav salīdzināmas.

Ja pētījumā izšķiroša nozīme ir nevis absolūtās, bet relatīvās variācijas novērtēšanai, tad jāizmanto relatīvās variācijas rādītājs, kurš ir nenosaukts skaitlis un nav atkarīgs ne no pētāmās pazīmes vienības, ne no tās vidējā lieluma.

Variācijas relatīvo lielumu raksturo variācijas koeficients, ko aprēķina, dalot standartnovirzi ar aritmētisko vidējo:

.

Šāds variācijas koeficients ir izteikts viena daļās. Ja to vēlas izteikt procentos, tad iepriekšējais koeficients jāpareizina ar 100 vai jālieto formula

.                                                 (1.33)

 

 

 

 

 

 

 

 

Turpinot iepriekšējo piemēru, var izrēķināt graudaugu ražības variācijas koeficientus abām ekoloģiskajām grupām.

Pirmai:             

otrai:                

 

Tātad graudaugu ražības relatīvā variācija otrā ekoloģiskajā grupā ir lielāka, kaut gan absolūtās variācijas mēri gandrīz sakrīt. Cēlonis ir zemāka vidējā ražība otrās grupas saimniecībās.

Katram variācijas rādītājam ir savs spacifisks statistisks saturs. Praktiskajam darbam ir jāizvēlas tas rādītājs, kurš ir visvairāk piemērots konkrētu analīzes mērķu sasniegšanai.

 

 

1.3.2. Dispersijas īpašības

 

Dispersijas īpašības var pierādīt, algebriski pārveidojot pamatformulas. Īpašības izmanto aprēķinu vienkāršošanai un labākai izpratnei.

 

1.   Konstanta lieluma dispersija ir vienāda ar nulli. Ja visi novērojumi ir vienādi, tad nav variācijas un visi variācijas rādītāji ir vienādi ar nulli.

2.   Ja no visiem novērojumiem atņem kādu konstantu lielumu, tad dispersija nemainās. Šo īpašību izmanto tad, ja visi novērojumi ir lieli skaitļi, kuri savā starpā atšķiras maz.

3.   Ja visus novērojumus reizina (dala) ar konstantu lielumu , tad dispersija pieaug (samazinās)  reizes. Šo īpašību var izmantot, aprēķinot dispersiju pēc intervālu variācijas rindas. Pēc dalot samazinātiem variantiem aprēķināto dispersiju (starprezultātu), aprēķinus nobeidzot, pareizina ar .

4.   Ja, aprēķinot dispersiju, aritmētiko vidējo aizstāj ar kādu citu konstantu lielumu c, tad dispersija pieaug par lielumu . No tā izriet, ka dispersiju var aprēķināt pēc formulas

s2=                                                  (1.34)

 

 

 

Ja par konstanto lielumu ņem nulli, t.i., c=0, tad iegūst formulu

s2=                                  (1.35)

 

Ja izmanto statistiskos svarus, analoga formula ir šāda:

s2=                             (1.36)

 

Pēdējās divas formulas parasti lieto, aprēķinot dispersijas ar taustiņu skaitļošanas mašīnām. Salīdzinājumā ar pamatformulām tām ir lielas priekšrocības, aprēķinot dispersijas arī ar datortehniku. Lai aprēķinātu dispersiju pēc pamatformulām (1.29) un (1.30), vispirms jāaprēķina aritmētiskais vidējais. Lai to izdarītu, ir jāapstrādā visi sākotnējie dati, atrodot  vai . Ja sākotnējo datu ir daudz, tie jāievada mašīnas operatīvajā atmiņā pa daļām. Tālāk, lai aprēķinātu noviržu kvadrātu summas  vai , sākotnējie dati mašīnas operatīvajā atmiņā ir jāievada otreiz, kas prasa daudz laika. Turpretī, izmantojot formulas (1.35) un (1.36), vienā darba šūnā mašīnas atmiņā uzkrāj , otrā , resp.,  un . Ar šīm summām pietiek, lai aprēķinātu gan aritmētisko vidējo, gan dispersiju, neatgriežoties pie sākotnējiem datiem.

Šīs summas viegli fiksēt arī pa kopas daļām (starpsummas). Tas ļauj viegli aprēķināt iepriekš izraudzīto grupu aritmētiskos vidējos un dispersijas.

 

Piemēri.

 

1. Aprēķinām darba algas dispersiju 8 strādnieku brigādei, kas bija aplūkota 1.2.3. paragrāfā. Jāsastāda tabula 1.8.:

 

1.8.tabula

Darba tabula dispersijas aprēķināšanai, izmantojot novēroto datu nu to kvadrātu summas.

 

Novērojumu

Nr.

Novērotie dati x un to summa

Novēroto datu kvadrāti x2 un to summa

1.

2.

3.

4.

5.

6.

7.

8.

215,27

230,91

190,15

250,31

201,50

222,93

219,10

205,12

46 341

53 319

36 157

62 655

40 602

49 698

48 005

42 074

1735,29=

378 851=

 

s2=.

 

Aprēķinātā dispersija sakrīt ar rezultātu, kurš tika iegūts iepriekš (1.3.1.§), ja neskaita nelielas atšķirības starprezultātu noapaļošanas dēļ. Ja darbu izpilda ar vienādu zīmīgo ciparu skaitu, tad par precīzāko ir jāatzīst tas rezultāts, kurš iegūts izpildot darbības bez liela zīmīgo ciparu skaita zuduma starprezultātos. Liels zīmīgo ciparu skaita zudums, strādājot ar formulām (1.35) vai (1.36) rodas, izdarot pēdējo atņemšanas darbību. Tādēļ par precīzāko piemēra ietvaros ir jāatzīst dispersija, kas aprēķināta 1.3.1.§. Lai iegūtu to pašu precizitāti ar formulām (1.35) un (1.36) ir jāizmanto aprēķinos lielāks zīmīgo ciparu skaits.

 

2. Aprēķināsim graudaugu ražības dispersiju pirmās ekoloģiskās grupas saimniecībām. Sākotnējo datu sagatavošana ir parādīta 1.11 tabulā kompleksu aprēķinu ietvaros. Vajadzīgās summas ņem no tās: =2248; =52768; =100.

 

Tad         s2=.

Šajā piemērā, kā redzams, tika izmantota formula (1.36), kura paredz statistisko svaru lietošanu. Piemērā statistiskie svari ir jāizmanto tādēļ, ka dispersiju rēķina pēc iepriekš sagrupētiem datiem (variācijas rindas).

 

 

1.3.3. Intragrupu un starpgrupu dispersijas

 

Grupēšana ir statistikas datu apstrādes pamatmetode. Matemātiski tālāk apstrādājot grupējuma rezultātus, vispirms aprēķina aritmētiskos vidējos katrai grupai. Grupu vidējo lielumu aprēķināšana tehniski ne ar ko neatšķiras no visas kopas vidējo lielumu aprēķināšanas, vienīgi jāsummē nevis pa visu kopu, bet pa katru grupu atsevišķi. Summu dala nevis ar visas kopas, bet gan grupas vienību skaitu vai grupas statistisko svaru summu, ja rēķina svērto vidējo. Grupu aritmētiskos vidējos parasti sakārto tabulā.

Bez vidējā lieluma katrai grupai var aprēķināt arī variācijas rādītājus: dispersiju, standartnovirzi u.c.

Lai raksturotu pazīmes variāciju pa grupām, katrai grupai aprēķina grupas dispersiju , kur  i - grupas numurs. Izmanto formulas:

 

vienkāršai dispersijai

;                                                              (1.37)

svērtai dispersijai

,                                                           (1.38)

kur           xij - i-tās grupas j-tā vērtība;

                - i-tās grupas aritmētiskais vidējais;

                ni - i-tās grupas vienību skaits;

                fij - i-tās vienības statistiskais svars; šī vienība atrodas i-tajā grupā.

 

Summēšana notiek grupu robežās.

Kad ir aprēķinātas atsevišķas grupu dispersijas, var atrast visu grupu vidējo dispersiju :

,                                                                        (1.39)

kur k - grupu skaits. Jāsummē pa visām grupām, i=1; 2; …; k. Ja izmanto statistisko svaru summas, formula ir šāda:

.                                                   (1.40)

Grupu dispersiju aritmētisko vidējo sauc par intragrupu dispersiju (arī par grupu iekšējo dispersiju), jo tā rāda variāciju, kādā vidēji ir izdalītajās grupās.

Intragrupu dispersija ir mazāka par kopējo jeb parastu dispersiju s2, ko aprēķina pēc formulām (1.29); (1.30); (1.35); (1.36), jo grupu aritmētiskie vidējie  nesakrīt ar visas kopas aritmētisko vidējo  un individuālo datu novirzes no grupas vidējiem caurmērā ir mazākas nekā novirzes no visas kopas aritmētiskā vidējā.

Ir svarīgi noteikt ne vien intragrupu, bet arī starpgrupu jeb intergrupu dispersiju. Tā raksturo grupu aritmētisko vidējo variāciju ap visas kopas aritmētisko vidējo. Starpgrupu dispersiju apzīmē ar simbolu d2. To var aprēķināt pēc formulas (1.41) kā grupu aritmētisko vidējo  dispersiju, par svariem izmantojot kopas vienību skaitu katrā grupā:

d2=.                                                   (1.41)

 

Ja grupu aritmētisko vidējo aprēķināšanā ir izmantoti citi statistiskie svari, kas ir atšķirīgi no kopas vienību skaita, tad jālieto formula (1.42):

d2=.                                            (1.42)

 

Piemērs.

 

Brigādē strādā 5 strādnieki un 3 mācekļi. Strādnieku darba ražīgums ir 10; 12; 8; 13; 7 izstrādājumi stundā, bet mācekļu - attiecīgi 6; 8; 10 izstrādājumi stundā. Vidējā izstrāde visiem strādājošiem ir 9,25 izstrādājumi stundā, dispersija s2=2,2776 izstrādājumi. Pēdējie rādītāji var būt nepietiekami, jo strādnieku grupā izstrāde parasti ir augstāka nekā mācekļu grupā. Tādēļ aprēķināsim vidējos un variācijas rādītājus atsevišķi strādniekiem (indekss 1) un mācekļiem (indekss 2), kā arī intragrupu un starpgrupu dispersijas.

 

Vidējie lielumi:

(izstrādājumi);

(izstrādājumi).

 

Grupu dispersijas aprēķina pēc formulas (1.37):

 

 

 

Abu grupu vidējo dispersiju jeb intragrupu dispersiju aprēķina pēc formulas (1.39) :

Intragrupu dispersija 4,25 ir mazāka nekā kopējā dispersija 5,1875, jo darba ražīgums katras strādājošo grupas ietvaros ir mazāk svārstīgs nekā visu strādājošo kopā.

 

Beidzot aprēķināsim starpgrupu dispersiju, izmantojot formulu (1.41):

 

Šī dispersija raksturo grupu vidējo lielumu variāciju ap kopējo vidējo. Redzam, ka grupu ietvaros variācija tomēr ir lielāka nekā starp grupām. Tālāko uzdevumu - noskaidrot, vai intragrupu un starpgrupu dispersijas atšķiras būtiski un līdz ar to vai darba ražīgums strādnieku grupā ir būtiski augstāks nekā mācekļu grupā, risina dispersijas analīze, kurai grāmatā ir veltīta atsevišķa nodaļa.

 

Ja ir aprēķināta kopējā dispersija un intragrupu dispersija, starpgrupu dispersiju var atrast arī kā pirmo divu dispersiju starpību. Tas izriet no dispersiju saskaitīšanas teorēmas, kura apskatīta nākošajā paragrāfā.

 

 

1.3.4. Dispersiju saskaitīšanas teorēma

 

Intragrupu un starpgrupu dispersiju summa ir vienāda ar kopējo dispersiju:

.                                                             (1.43)

 

Pierādījums.

Pieņemam, ka kopa sadalīta k grupās, kurās ir n1, n2, n3, …, nk vienības un .

Grupu aritmētiskos vidējos aprēķina pēc formulas

                                          ,                                                          (a)

kopējo aritmētisko vidējo -

                                          .                                                        (b)

 

 

 

Grupu dispersijas var aprēķināt, izmantojot pārveidoto dispersijas aprēķināšanas formulu:

                                                                                           (c)

 

No šejienes

                                                                               (d)

 

Ja šāda sakarība ir spēkā katrai grupai atsevišķi, tad tai ir jābūt spēkā arī visām grupām kopā. Tādēļ varam izdarīt šo izteiksmju summēšanu pēc indeksa i:

                                 .                                     (e)

 

Vienādības (e) kreiso pusi dalām ar n, bet labo - ar  (to var darīt, jo n=):

                                .                                      (f)

 

No vienādības (f) abām pusēm atņem izteiksmi :

                               (g)

 

Ievērojot dispersijas aprēķināšanas formulu (1.35):

s2=

novērtējam pārveidoto vienādību (g). Tās kreisā pusē ir kopējā dispersija s2, jo  (dažādās formulās ir izmantota vienīgi dažāda precizitāte indeksu norādēs) un , jo kopējo vidējo var aprēķināt kā vidējo no grupu aritmētiskajiem vidējiem, pēdējos sverot ar grupu vienību skaitu. Labās puses pirmais saskaitāmais ir grupu dispersiju vidējais lielums . Divu pēdējo lielumu starpība ir starpgrupu dispersija d2 (par variējošo lielumu ir uzskatīti grupu vidējie lielumi  un, aprēķinot dispersiju, ņemti vērā grupu īpatsvari). Līdz ar to sakarība (1.43)

 

ir pierādīta.

 

Pierādītā formula ir viena no fundamentālām matemātiskās statistikas sakarībām. Tiešā vai pārveidotā veidā to izmanto daudzās matemātiskās statistikas nodaļās.

Pārbaudām dispersiju saskaitīšanas teorēmas pareizību, izmantojot iepriekšējā paragrāfa piemēru:

5,1875=4,2500+0,9375.

 

Tādējādi, ja divas no trim savstarpēji saistītajām dispersijām ir aprēķinātas, trešo var aprēķināt, izmantojot formulu (1.43), kas atvieglo skaitļošanas darbu.

 

Ja salīdzina formulas (1.29); (1.35); (1.39); (1.40), tad ir redzams, ka visas dispersijas aprēķina, dalot noviržu kvadrātu summas (kas ir dažādas) ar vienu un to pašu kopas vienību skaitu  vai svaru summu . Tādēļ vienādības (1.43) abas puses var pareizināt ar n, resp., , un secināt, ka arī noviržu kvadrātu summas veido analogu sakarību:

 

Vienkāršojot pierakstu, iegūstam

                                                                    (1.44)

 

Arī šī ir viena no fundamentālām matemātiskās statistikas sakarībām, ko izmanto, piemēram, dispersijas analīzē.

 

 

 

 

 

 

 

 

 

 

 

 

1.4. Variācijas rindas momenti

 

1.4.1. Momentu jēdziens

 

Moments ir jēdziens, ko plaši lieto mehānikā, lai raksturotu mehāniskai sistēmai pielikta spēka iespējas sistēmu iekustināt un it īpaši izraisīt rotācijas kustību. Ir zināms, ka spēka iespējas iekustināt mehānisku sistēmu ir atkarīgas no spēka lieluma un no attāluma starp spēka pielikšanas un sistēmas atbalsta punktiem.

 

Līdzīgā nozīmē terminu “moments” izmanto statistikā. Pieliktie spēki  šajā gadījumā ir variācijas rindas intervālu biežumi, bet spēku pielikšanas attālumi - intervālu centru attālumi no kāda noteikta atskaites punkta.

 

1.4. attēls. Momentu ģeometriska interpretācija.

 

1.4. attēlā ir parādīta histogramma, kuras stabiņus var uzlūkot par masīviem ķermeņiem, kuri ar zināmu spēku spiež uz abscisu asi. Spēks ir proporcionāls kopas vienību skaitam fi katrā intervālā, resp., stabiņā. Iedomāsimies, ka abscisu ass ir atbalstīta kādā vienā punktā. Lai noteiktu, vai pieliktais spēks izkustinās histogrammai analogu masīvu ķermeni, ir jānosaka šis atbalsta punkts, resp., jāizvēlas kāds attālumu mērīšanas sākumpunkts. Par tādu var izvēlēties

         koordinātu sistēmas sākumpunktu;

         jebkuru brīvi izvēlētu punktu uz abscisu ass;

         aritmētisko vidējo.

Ja histogrammai atbilstošs masīvs ķermenis ir atbalstīts punktā, kas atbilst aritmētiskajam vidējam, pieliktie spēki savtarpēji līdzsvarojas un iedomātais ķermenis var saglabāt līdzsvaru.

Atkarībā no attālumu atskaites punkta izšķir sākuma momentus, nosacītos momentus un centrālos momentus.

Kā redzējām statistiskos momentus visvieglāk izprast un interpretēt, izmantojot intervālu variācijas rindu un tās grafisko attēlu (histogrammu). Tomēr statistiskos momentus tāpat kā vidējos lielumus var aprēķināt arī tieši no sākotnējiem nesagrupētiem datiem. Sākotnējo datu tieša apstrāde turklāt dod precīzākus momentu rādītājus. Vai šādā gadījumā ir vai nav jālieto statistiskie svari, izšķir, vadoties no tādiem pat apsvērumiem, kā rēķinot aritmētisko vidējo.

 

 

 

 

 

 

 

1.4.2. Variācijas rindas momentu definīcija un pamatformulas

 

Par variācijas rindas momentiem statistikā sauc datu (variantu) noviržu pakāpju vidējos lielumus.

Novirzes var ņemt no koordinātu sākumpunkta, no brīvi izvēlēta punkta un no aritmētiskā vidējā. Līdz ar to iegūst attiecīgi sākuma momentus, nosacītos momentus un centrālos momentus.

Novirzes var ņemt pirmajā pakāpē , bet var pirms summēšanas kāpināt kādā citā pakāpē, piemēram, kvadrātā. Līdz ar to iegūst dažādu kārtu jeb pakāpju momentus. Statistikā biežāk lieto pirmās un otrās kārtas momentus, retāk - trešās un ceturtās kārtas momentus. Sistēmas dēļ aplūko arī nulltās kārtas momentus. Momentu pamatveidi, to pamatformulas parādītas 1.9.tabulā.

 

 

1.9.tabula

Variācijas rindas momentu veidi un pamatformulas

 

Momentu kārta

Sākuma M

Nosacītie m

Centrālie

Nulltā

Pirmā

Otrā

Trešā

Ceturtā

k-tās kārtas momentus vispārīgā veidā definē, izmantojot šādas formulas:

 

sākuma momenti

                                                         (1.45)

nosacītie momenti

                                                (1.46)

centrālie momenti

                                                (1.47)

 

Momentu apzīmēšanai bieži lieto arī citus terminus un simbolus.

 

Aprēķinot momentus, par statistiskajiem svariem f var ņemt gan absolūtos, gan relatīvos biežumus.Apstrādājot iepriekš nesagrupētus datus, katra kopas vienība nosacīti veido savu grupu ar biežumu f = 1. Ja statistisko momentu formēšanā no profesionālās analīzes viedokļa visi novērojumi ir vienādi nozīmīgi, resp., “lieli”, tad visi f = 1, un tos var formulā svītrot, ievērojot, ka tādā gadījumā =n.

Nulltās kārtas momenti jebkurai variācijas rindai ir vienādi ar 1, jo jebkurš skaitlis nulltajā pakāpē vienāds ar 1 un arī . Šiem momentiem nav praktiskas nozīmes.

 

 

1.4.3. Pirmās kārtas momentu īpašības

 

Pirmās kārtas sākuma moments ir variācijas rindas aritmētiskais vidējais. Tas ir tieši redzams no formulas

 vai , ja visi f=1.

 

Pirmās kārtas nosacīto momentu var izmantot aritmētiskā vidējā lieluma izskaitļošanas vienkāršošanai, kā tas izriet no aritmētiskā vidējā īpašībām:

 vai

 

Pirmās kārtas centrālais moments ir vienāds ar 0. No aritmētiskā vidējā īpašības redzams, ka noviržu algebriskā summa no aritmētiskā vidējā ir vienāda ar nulli:  vai arī , no kā izriet, ka

 

Līdz ar to no pirmās kārtas momentiem ekonomiska interpretācija ir tikai sākuma momentam, kurš ir variācijas rindas aritmētiskais vidējais.

 

 

1.4.4. Otrās kārtas momentu īpašības

 

Otrās kārtas centrālais moments, kā redzams no formulas, ir variācijas rindas dispersija. Tātad otrās kārtas centrālais moments raksturo pazīmes variāciju.

Otrās kārtas sākuma momentus var izmantot dispersijas aprēķināšanas atvieglošanai. No iepriekšējām nodaļām zinām, ka

vai

                                        (sk.1.36)

Pēdējās formulas labajā pusē pirmais loceklis ir otrās kārtas sākuma moments M2, bet otrais loceklis - pirmās kārtas sākuma momenta M1 kvadrāts. Pati dispersija ir otrās kārtas centrālais moments. Tādēļ

                                                                                                     (1.48)

 

Otrās kārtas centrālo momentu var aprēķināt, izmantojot arī otrās kārtas nosacīto momentu un pirmās kārtas nosacītā momenta kvadrātu.

                                                                                  (1.49)

 

Skaitļošanu var vēl tālāk vienkāršot, ja datus dala ar intervāla vienību .Tad

 

                                   ,                                     (1.50)

 

kur m2 un m1 ir  reizes samazināto datu nosacītie momenti.

 

Rēķinot nosacītos momentus, atskaites sākumu var izvēlēties brīvi, tikai vienas formulas ietvaros to nedrīkst mainīt.

 

 

1.4.5. Vispārinājumi

 

Statistikā svarīgākā nozīme ir pirmās kārtas sākuma momentam un augstāko kārtu centrālajiem momentiem. Pirmās kārtas sākuma moments ir aritmētiskais vidējais, bet otrās kārtas centrālais moments ir dispersija. Turpmāk parādīsim, ka no trešās kārtas centrālā momenta iegūst asimetrijas, bet no ceturtās kārtas centrālā momenta - ekscesa rādītājus.

Sākuma momentus un nosacītos momentus lieto kā starprezultātus centrālo momentu aprēķināšanai. Izmantojot datoru, nav grūti izpildīt darbības ar lieliem skaitļiem, tāpēc rēķina sākuma momentus.

Centrālos momentus iegūst no nosacītajiem momentiem, izmantojot šādas formulas (dažas no tām iepriekš pamatotajām):

                                    = 1;

                                                = 0;

                                                = m2-;                                                                         (1.51)

                                                ;

                                                .

 

Formulās (1.51) nosacīto momentu vietā var ņemt sākuma momentus, jo nosacīto momentu aprēķināšanas formulā var likt c=0. Parasti tā arī dara.

 

 

1.4.6. Momentu aprēķināšanas piemēri

 

1.2.tabulā bija dotas variācijas rindas: pirmās un otrās ekoloģiskās grupas saimniecību un graudaugu sējumu platību sadalījumi pēc graudaugu ražības. Aprēķināsim abiem šiem sadalījumiem pirmo četru kārtu momentus. Pirmās variācijas rindas momentu aprēķinu tehniku parādīsim pilnīgi, bet otrai variāciju rindai dosim gatavus rezultātus. Lai gūtu iespēju salīdzināt aprēķinātos rādītājus un tos novērtēt, abi uzdevumi tiek risināti vienlaikus. Novērtējot tos rādītājus, kuriem ir iespējama tieša ekonomiska interpretācija, ir lietderīgi izmantot abu sadalījuma rindu grafiskos attēlus, kuri redzami 1.3. attēlā.

Pirms aprēķinu uzsākšanas mums vēlreiz jāatgriežas pie jautājuma par statistisko svaru izvēli. Jautājums par statistisko svaru izvēli momentu aprēķinos statistikas teorijā līdz galam nav atrisināts. Rēķinot aritmētisko vidējo, kas vienlaikus ir pirmās kārtas sākuma moments, vienprātīgi tiek ieteikts izmantot svarus, kuri nodrošina summu  un  reālu ekonomisku saturu. Piemēram, rēķinot vidējo ražību, par statistiskajiem svariem ir jāizmanto sējumu platības. Rēķinot otrās kārtas centrālo momentu, kas vienlaikus ir variācijas rindas dispersija, vairums autoru saglabā to pašu svaru sistēmu. Turpretī, rēķinot augstāku kārtu momentus, gandrīz visās mācību grāmatās bez īpaša pamatojuma tiek izmantots kopas vienību (novērojumu) skaits.

Dažādu statistisko svaru izmantošana zemāko un augstāko kārtu momentu aprēķinos noved pie tā, ka vairs nav spēkā aplūkotās momentu sakarības. Tādēļ tāda rīcība nav ieteicama. Reiz izvēlētā statistisko svaru sistēma ir jāsaglabā.

Pēc mūsu domām, izvēloties statistisko svaru sistēmu, varētu vadīties no šādiem apsvērumiem.

 

1. Analīzē svarīgākais ir aritmētiskais vidējais, kurš jāaprēķina maksimāli precīzi. Augstāko kārtu momenti veido papildinformāciju. Tad statistiskie svari ir jāizvēlās atbilstoši iepiekš aprādītajiem nosacījumiem. Piemēram, rēķinot vidējo ražību, svaru sistēmu veido sējumu platības. saglabājot šo svaru sistēmu augstāko kārtu momentu aprēķinos, interpretācijā jāievēro, ka esam raksturojuši nevis saimniecību, bet sējumu platību sadalījuma pēc ražības variāciju, asimetriju un ekscesu.

2. Analīzē svarīgākais ir izpētīt tieši kopas vienību(saimniecību) nevis sējumu platību sadalījuma īpašības. Precīza aritmētiskā vidējā sasaiste ar absolūtajiem un relatīvajiem lielumiem nav obligāta. Tad par statistiskajiem svariem varam izvēlēties variācijas rindas absolūtos vai relatīvos biežumus. Ja visas kopas vienības ir kvalitatīvi vienveidīgas un to ir daudz, aritmētiskais vidējais parasti iegūst pilnīgi pieņemamu tuvinājumu un ērtāka ir citu variācijas rindas raksturotāju interpretācija.

Tā kā ražības analīzē izšķiroša nozīme ir vidējam lielumam un to iepriekš aprēķinājām, izmantojot par statistiskajiem svariem sējumu platību īpatsvarus, šo svaru sistēmu saglabāsim arī turpmāk. Līdz ar to jāievēro, ka īstenībā pētījam nevis saimniecību, bet gan sējumu platību sadalījumu pēc ražības5.

Satistikā visvairāk vajadzīgos centrālos momentus var aprēķināt vai nu tieši, vai iepriekš kā starprezultātus aprēķinot sākuma momentus, vai nosacītos momentus6.

1.10. tabula

 

Centrālo momentu tieša aprēķināšana ar noviržu metodi pirmās ekoloģiskās grupas saimniecību sējumu platību sadalījumam pēc graudaugu ražības .

 

x

x-

f

12

16

20

24

28

32

-10,48

-6,48

-2,48

1,52

5,52

9,52

2

16

30

28

18

6

-20,96

-103,68

-74,40

42,56

99,36

57,12

219,6608

671,8464

184,5120

64,6912

548,4672

543,7824

-2302,0451

-4353,5646

-457,5898

98,3306

3027,5389

5176,8084

24 125,432

28 211,098

1 134,823

149,463

16 712,014

49 283,215

Kopā

100

+199,04

0

2232,9600

+8302,6779

+1189,4784

119 616,040

________________________

5  Vispārējā gadījumā ģeometriskās ilustrācijas nolūkā vajadzētu izgatavot arī citu attēlu, kurš var atšķirties no attēla 1.3. Konkrētajā uzdevumā abi sadalījumi ir samērā līdzīgi. Abu attēlu atšķirība vizuāli grūti pamanāma. Tādēļ turpināsim izmantot 1.3. attēlu.

6  Tāpat kā aprēķinot aritmētisko vidējo, arī visu pārējo momentu vērtības ir precīzākas, ja tās aprēķina pēc sākotnējiem, nesagrupētiem datiem.

 

1.11 tabula

 

Sākuma momentu aprēķināšana pirmās ekoloģiskās grupas saimniecību sējumu platību sadalījumam pēc graudaugu ražības.

 

x

f

xf

x2f

x3f

x4f

12

16

20

24

28

32

144

256

400

576

784

1 024

1 728

4 096

8 000

13 824

21 952

32 768

20 736

65 536

160 000

331 776

614 656

1 048 576

2

16

30

28

18

6

24

256

600

672

504

192

288

4 096

12 000

16 128

14 122

6 144

3 456

65 536

240 000

387 072

395 136

196 608

41 472

1 048 576

4 800 000

9 289 728

11 063 808

6 291 456

Kopā

100

2248

52 768

1 287 808

32 535 040

 

Centrālo momentu tieša aprēķināšana ir parādīta 1.10. tabulā. Aprēķināšanas metodi, kas atainota šai tabulā, var saukt par noviržu metodi. Tās trūkums ir tāds, ka vispirms ir jāaprēķina aritmētiskais vidējais un novirzes no tā.

 

Centrālos momentus aprēķina, izmantojot 1.9. tabulas pēdējā ailē parādītās formulas:

 

                                   

                                   

                                    ;

                                   

 

No centrālajiem momentiem tieša ekonomiska interpretācija ir otrās kārtas momentam, kurš vienlaikus ir sadalījuma dispersija. Pirmajā ekoloģiskajā grupā  otrajā - 22,5584. Abas dispersijas pēc noapaļošanas ir praktiski vienādas. Aprēķinot kvadrātsakni no dispersijas, iegūst standartnovirzi jeb vidējo kvadrātisko novirzi, kura pēc noapaļošanas abās grupās ir 4,7 cnt/ha.

Dati sākuma momentu aprēķināšanai ir izskaitļoti un parādīti 1.11. tabulā. Tabulas aiļu virsraksti vienlaikus uzskatāmi par formulām, kuras jāizmanto to aizpildīšanai. Izmantojot šīs tabulas datus un iepriekš minētās formulas, var izskaitļot vispirms sākuma momentus, bet izmantojot tos kā starprezultātus, var atrast centrālos momentus. Lai neuzkrātos skaitļošanas kļūdas, starprezultāti kā vienmēr jāfiksē ar pietiekami lielu zīmīgo ciparu skaitu. Gala rezultāti ekonomiskajā interpretācijā jānoapaļo līdz tādai precizitātei, kādu nodrošina sākotnējie dati.

 

 

 

 

 

 

 

Sākuma dati:

                       

                       

                       

                       

 

Centrālie momenti:

                       

.

Redzam, ka centrālie momenti, kurus aprēķinājām izmantojot kā starprezultātus sākuma momentus, samērā precīzi sakrīt ar centrālajiem momentiem, kurus aprēķinājām ar t.s. noviržu metodi. Nelielas atšķirības pēdējos zīmīgajos ciparos izskaidrojamas ar starprezultātu noapaļošanu. Ja abos gadījumos darbs izpildīts ar vienu un to pašu zīmīgo ciparu skaitu, par precīzākiem jāuzlūko rezultāti, kuri iegūti ar metodi, kuras realizācija prasa izpildīt mazāk skaitļošanas operāciju un darbu veic ar mazākiem skaitļiem.

Atcerēsimies, ka pirmās kārtas sākuma moments ir aritmētiskais vidējais. Pirmās ekoloģiskās grupas saimniecībās 22,48 (otrās - 20,04). Citiem sākuma momentiem tieša statistiska satura nav. Tos ērti izmantot kā starprezultātus centrālo momentu aprēķināšanai īpaši tad, ja darbu veic ar datoru.

Otrās kārtas centrālais moments ir dispersija.

Augstāko kārtu centrāliem momentiem tiešas ekonomiskās interpretācijas nav, bet no tiem viegli aprēķināt tālākos variācijas rindas raksturotājus: asimetrijas un ekscesa rādītājus.

Nosacītos momentus aprēķina un izmanto kā starprezultātus centrālo momentu aprēķināšanai ja darbu izpilda ar nelielas jaudas skaitļošanas tehniku. Nosacītie momenti dod iespēju strādāt ar “mazākiem” skaitļiem, bet lietojamās formulas ir nedaudz sarežģītākas. Tā kā patreiz lietojamās skaitļošanas mašīnas bez grūtībām izpilda darbības ar daudzzīmju skaitļiem, nosacītie momenti zaudē praktisku nozīmi. Tādēļ attiecīgs piemērs šajā grāmatā nav parādīts7.

 

 

 

 

 

 

________________________

1  Vajadzības gadījumā nosacīto momentu aprēķināšanas un izmantošanas piemērus var atrast autora mācību grāmatā “Varbūtību teorija un matemātiskā statistika”. R.:1985.

1.4.7. Standartizētie momenti

 

Augstāko kārtu momenti iegūst statistisku interpretāciju, ja tos standartizē. Par standartu pieņem sadalījuma standartnovirzi s, t.i., kvadrātsakni no otrās kārtas centrālā momenta . Tādā gadījumā standartizētos momentus aprēķina pēc formulas

                                                                                                        (1.52)

 

Standartizētos momentus literatūrā diezgan bieži apzīmē ar mazo burtu r. Tas nav izdevīgi, jo ar šo burtu vienmēr apzīmē korelācijas koeficientu.

 

Pirmo četru kārtu standartizētie momenti ir šādi:

                                                           

                                                           

                                                           

                                                           

Pirmās un otrās kārtas standartizētie momenti ir konstantes. Statistiska interpretācija ir trešās un ceturtās kārtas standartizētajiem momentiem. Trešās kārtas standartizētais moments ir asimetrijas koeficients, ceturtās kārtas standartizēto momentu izmanto ekscesa koeficienta aprēķināšanai.

 

 

1.5. Asimetrijas un ekscesa rādītāji

 

1.5.1. Momentu asimetrijas un ekscesa koeficienti

 

Visbiežāk lietotie asimetrijas un ekscesa rādītāji ir trešās un ceturtās kārtas standartizētie momenti. Trešās kārtas standartizēto momentu K3 sauc par asimetrijas koeficientu:

 

                                                                                                                             (1.54)

 

Ja sadalījums ir simetrisks pret aritmētisko vidējo, asimetrijas koeficients K3 ir vienāds ar 0. Ja koeficients nav vienāds ar 0, sadalījums ir vairāk vai mazāk asimetrisks. Asimetrija ir lielāka, ja lielāka ir koeficienta absolūtā vērtība. Koeficienta zīme rāda asimetrijas virzienu.

 

Ja sadalījuma kreisā puse, kura atbilst pazīmes mazākajām vērtībām, ir izstiepta, bet labā puse aprauta, asimetrijas koeficients ir negatīvs un otrādi.

 

 

 

 

 

Asimetrijas un ekscesa rādītāji piemēriem.

 

 

Pirmai ekoloģiskai grupai

Otrai ekoloģiskai grupai

 

Kā rāda trešās kārtas standartizētie momenti (asimetrijas koeficienti), abiem sadalījumiem ir neliela pozitīvā asimetrija - izstiepts labais, bet aprauts kreisais zars. Atgriežoties pie 1.3 grafiskā attēla, var pārliecināties, ka histogrammai, kura attēlo otrās ekoloģiskās grupas saimniecību sadalījumu, šī īpašība ir izteiktāka, tādēļ asimetrijas koeficients ir lielāks. Pilnīgi simetriskam sadalījumam asimetrijas koeficients ir nulle. Abi piemēram izmantotie sadalījumi ir samērā tuvi simetriskam, īpaši pirmais.

Ceturtās kārtas standartizēto momentu K4 tieša izmantošana nav ērta, jo normāla ekscesa gadījumā K4 nav 0, bet 3. Tādēļ praksē biežāk izmanto ekscesa koeficientu, ko aprēķina ar formulu

 

                                                                                                                (1.55)

 

Ekscesa koeficienta skaitlisko lielumu novērtē, salīdzinot to ar normālā sadalījuma koeficientu, kurš ir vienāds ar nulli.

Ja empīriskais ekscesa koeficients ir lielāks par 0, tad sadalījums ir stāvāks, kopas vienību koncentrācija ap vidējo lielāka nekā normālā sadalījuma gadījumā. Ja ekscesa koeficients ir mazāks par 0, kopas vienību koncentrācija ap vidējo ir mazāka nekā normālā sadalījuma gadījumā.

Atgriežoties pie piemēra, redzam, ka abu sadalījumu ekscesa koeficienti ir mazāki par 0. Pirmai grupai - 0,601 (2,399 - 3), otrai - 0,428 (2,572 - 3). Otrās grupas sadalījums pēc ekscesa īpašības ir tuvāks normālam sadalījumam (attēlā histogrammai ir nedaudz smailāka virsotne) nekā pirmās grupās. Kā novērtēt, vai šīs atšķirības ir statistiski nozīmīgas, būs parādīts turpmāk.

Momentu asimetrijas un ekscesa koeficienti nav lietojami, ja statistiskajā kopā ir t.s. krasi atšķirīgās vienības. Tādā gadījumā šo vienību datu novirzes no vidējā , kāpinātas kubā vai ceturtajā pakāpē, sastāda lielāko daļu no attiecīgās noviržu pakāpju summas. Līdz ar to asimetrijas un ekscesa rādītāju lielumu nosaka tikai šīs krasi atšķirīgās vienības. Tādā gadījumā trešās un ceturtās kārtas standartizētie momenti pārstāj raksturot asimetriju un ekscesu, bet atspoguļo vienkārši kopas neviendabību.

Ja krasi atšķirīgās vienības no apstrādājamo datu kopas izslēgt nav vēlams vai nav iespējams, sadalījuma asimetriju labāk raksturot ar struktūras asimetrijas rādītājiem, kaut arī tie ir vienkāršāki nekā attiecīgie momentu raksturotāji.

 

 

 

 

 

 

 

1.5.2. Struktūras asimetrijas koeficienti

 

Struktūras asimetrijas rādītājus aprēķina, savstarpēji salīdzinot aritmētisko vidējo, modu un mediānu.

Ja sadalījums ir simetrisks un ar vienu modālo lielumu, tad =Mo=Me. Aritmētiskais vidējais, moda un mediāna sakrīt.

Attiecību

                                                                                                                                (1.56)

 

var izmantot sadalījuma simetrijas aptuvenai novērtēšanai. Simetriskam sadalījumam šī attiecība ir vienāda ar nulli. Mēreni asimetriska sadalījuma gadījumā tā nepārniedz trīs.

Labākus rezultātus dod struktūras asimetrijas koeficients, kuru aprēķinot izmanto standartnovirzi. Struktūras asimetrijas koeficienta KA formula ir šāda:

                                                            .                                                        (1.57)

Ja KA > 0,          sadalījuma histogrammai labais zars izstiepts, bet kreisais - aprauts (pozitīva
                                     asimetrija);

ja KA < 0,           sadalījuma histogrammai kreisais zars iztiepts, bet labais - aprauts (negatīva
                                     asimetrija);

ja KA » 0,           sadalījums ir tuva simetriskam.

 

Aprēķināsim struktūras asimetrijas koeficientu pirmās ekoloģiskās grupas saimniecību sadalījumam pēc graudaugu ražības. No iepriekšējiem aprēķiniem zinām, ka = 22,48, Mo = 21,5, s = 4,725. Tad

KA=

 

KA = 0,207 > 0, līdz ar to jāsecina, ka sadalījumam ir izstiepts labais, bet aprauts kreisais zars (sk. 1.3. grafisko attēlu). Lai spriestu, vai asimetrija ir “liela” vai “maza”, ir nepieciešama zināma pieredze, kas uzkrājas, aprēķinot asimetrijas koeficientus vairākiem sadalījumiem. Līdzīga pieredze ir vajadzīga, lai ātri novērtētu arī citus koeficientus, piemēram, variācijas koeficientu. Struktūras ekscesa rādītājus matemātiskajā statistikā nelieto.