Bude vaše mzda průměrná?

Slovní spojení "průměrná mzda" je používané ve zprávách a informacích o aktuálním ekonomickém dění. Nejen v hospodách lze vyslechnout bouřlivé diskuse, v nichž účastníci své příjmy shledávají podprůměrnými. Jak je to možné? Proč a čím je a může být průměr zavádějící?

Průměr a průměrná hodnota

S průměrem se běžně setkáváme v každodenním životě. Slyšíme o průměrné ceně benzínu, průměrné spotřebě alkoholu na osobu, před zakoupením automobilu se zajímáme o průměrnou spotřebu pohonných hmot a jiných provozních médií, před přijetím pracovní nabídky se zajímáme o typický plat pracovníka zastávajícího takovou pozici. Otázky podobné těmto směřují pozornost k určení jednoho čísla, které hůře či lépe dokáže popsat typickou hodnotu reality, která je středem pozornosti. Tímto číslem nebo měřítkem je nejčastěji průměr, ale může jím být i medián, popřípadě i „ořezaný“ průměr.

Říkáme-li například, že naše domácnost spotřebuje měsíčně tak 10 m3 vody, nemíníme tím, že každý měsíc máme stejnou spotřebu vody. Uváděných 10 m3 vyjadřuje naši typickou spotřebu, která se nachází mezi největší a nejmenší měsíční spotřebou. Jde vlastně o jakýsi odhad naší typické měsíční spotřeby.

Uvažujme, že máme k dispozici záznamy o spotřebě vody v naší domácnosti za poslední rok: 9,5; 5; 7,8; 13,3; 8,4; 15,1; 18,6; 18,4; 5,1; 10,2; 11; 10,5. Průměrnou spotřebu lze spočítat sečtením všech hodnot a vydělením výsledku celkovým počtem hodnot:

(9,5 + 5 + 7,8 + 13,3 + 8,4 + 15,1 + 8,6 + 18,4 + 5,1 + 10,2 + 11 + 10,5) / 12 = 11 m3/měsíc.
Spotřeba vody v jednotlivých měsících a průměrná spotřeba

Obr. 1: Spotřeba vody v jednotlivých měsících a průměrná spotřeba

Při použití průměrné hodnoty je zapotřebí mít neustále na vědomí, že skutečné hodnoty se od hodnoty průměrné více či méně liší. Jak ukazuje obrázek (Obr. 1), v případě spotřeby vody spotřeba v jednotlivých měsících kolísá a více či méně se odchyluje od spotřeby průměrné. Statistika dokáže míru tohoto kolísání zachytit některým z měřítek variability (například směrodatnou odchylkou nebo rozpětím). Čím vyšší bude míra kolísání, tím vyšší bude hodnota měřítka variability.

Stanovená průměrná hodnota může být užitečná v mnoha ohledech. Kupříkladu lze plánovat, s jakými výdaji na vodu je zapotřebí počítat, lze porovnat spotřebu vody s jinými domácnostmi nebo lze srovnávat spotřebu v různých obdobích. I když je průměr měřítko, které je v populárním použití statistiky nejčastěji používáno, může být bez adekvátní interpretace zavádějící. Populárně lze říci, že s průměrem je to asi tak, že když dva poobědvají a jeden sní dvě kuřata a druhý nic, tak se v průměru oba dobře najedí.

Problémy s použitím průměru

Vypočtený průměr je značně ovlivněn přítomností extrémně malých nebo velkých hodnot. Hodnotu průměrné mzdy budou například zvyšovat lidé s vysokými platy, kterých není moc. Výše jejich platů ovšem posunuje průměr směrem k vyšším hodnotám. Jako příklad uvažujme fiktivní podnik, ve které pracuje 10 zaměstnanců. Devět z nich pobírá měsíční plat 10 000 Kč a jeden (majitel) 100 000 Kč. Průměrný plat v našem fiktivním podniku je potom 19 000 Kč.

Příklad ukazuje, že jedna odlehlá hodnota hodnotu průměru natolik ovlivňuje, že hodnota průměrné mzdy je poněkud zavádějící. Tato skutečnost je ilustrována i na tečkovém diagramu, uvedeném na obrázku (Obr. 2).

Tečkový diagram poukazující na existenci odlehlé hodnoty

Obr. 2: Tečkový diagram poukazující na existenci odlehlé hodnoty

Pokud budeme různé analyzované soubory dat většího rozsahu vynášet do takovýchto tečkových diagramů, zjistíme, že data jsou podél osy nějak rozdělena. Rozdělení hodnot může vypadat symetricky (jedna polovina tvaru rozdělení vypadá jako druhá), popřípadě je nesymetrické (je zešikmeno na pravou nebo levou stranu).

Pro přibližně symetrická rozdělení hodnota průměru odpovídá pomyslnému středu, ve kterém se vyskytuje většina skutečných výsledných hodnot (Obr. 3). Z diagramu naznačujícího rozdělení lze zjistit, že určité hodnoty se vyskytují častěji než jiné. Do některých oblastí hodnot spadá vysoký podíl pozorování a tyto oblasti pak odpovídají „typické“ hodnotě pozorované skutečnosti. Takový případ je ilustrován i na obrázku rozdělení popisujícího spotřebu vody sledované domácnosti (Obr. 3).

Rozdělení dat popisujících spotřebu dat sledované domácnosti

Obr. 3: Rozdělení dat popisujících spotřebu dat sledované domácnosti

Čím více bude rozdělení zešikmené, tím více schopnost průměru zachytit adekvátně typickou (střední) hodnotu klesá. Právě rozdělení platů je obecně považováno za kladně zešikmené rozdělení (OBR.4), protože většina platů se nachází v oblasti hodnot nižších a existuje daleko méně jednotlivců s platy extrémně velkými.

Průměr u nesešikmeného a zešikmeného rozdělení

Obr. 4: Průměr u nezešikmeného a zešikmeného rozdělení

Účinnost průměru se vzrůstající asymetrií (zešikmením) klesá a rostou důvody pro použití jiného měřítka – mediánu.

Celostátní průměrná mzda stírá rozdíly mezi profesemi, oborem a odvětvím, ve kterém je práce vykonávána, věkem, rozdílem mezi mzdami mužů a žen, podnikatelskou a nepodnikatelskou sférou nebo regionálními odlišnostmi. Toto všechno jsou stratifikační faktory, které by měly být při důkladné analýze typických mezd zvažovány.

Následující dva diagramy (Obr. 5 a Obr. 6 ) uvádějí rozdělení mezd v odvětví zemědělství a veřejné správy. Z grafu je zřejmé, že hrubé mzdy v obou sektorech vykazují poněkud odlišné rozdělení a průměrná mzda v daném sektoru se od celostátní průměrné mzdy liší.

Příklad rozdělení hrubých mezd v odvětví zemědělství a rybolovu

Obr. 5: Příklad rozdělení hrubých mezd v odvětví zemědělství a rybolovu v roce 2005
Zdroj: ČSÚ

Příklad rozdělení hrubých mezd v odvětví veřejné správy 2005

Obr. 6: Příklad rozdělení hrubých mezd v odvětví veřejné správy v roce 2005
Zdroj: ČSÚ

Použití mediánu pro stanovení typické hodnoty

Pro zešikmené rozdělení je vhodnější typickou (střední) hodnotu popisovat s použitím mediánu. Medián je prostřední hodnota, která rozděluje číselné rozdělení v půlce, kdy je 50 % hodnot sledované proměnné nižších než hodnota mediánu a 50 % hodnot naopak vyšších. Pokud byla například v roce 2002 celostátní mediánová hrubá mzda 15 542 Kč, potom polovina pracovníků pobírala mzdu (před zdaněním a odvody) menší než tato částka a polovina pracovníků naopak částku vyšší.

Medián se určí tak, že

  1. všechny analyzované hodnoty se uspořádají do číselného pořadí (vzestupně nebo sestupně),
  2. určí se prostřední element vytvořeného pořadí (pokud je zde lichý počet hodnot) nebo průměr dvou prostředních elementů (jestliže soupis obsahuje sudý počet datových hodnot).

Jako příklad můžeme uvést průzkum ceny půl litru stejné limonády v různých obchodech. Dejme tomu, že jsme zjistili, že ceny v různých obchodech jsou následující: 6; 6,70; 3,80; 7; 5,80. Uspořádáním hodnot do číselného pořadí dostáváme: 3,80; 5,80; 6; 6,70; 7. Nyní snadno určíme prostřední hodnotu, odpovídající mediánu: 3,80; 5,80; 6; 6,70; 7. Mediánová cena je 6 Kč.

Odlišná situace může nastat, pokud má datový soubor sudý počet hodnot: 3,80; 5,80; 6; 6,70; 6,9; 7. Potom se medián stanoví jako průměr dvou prostředních hodnot, tj.

(6 + 6,70)/2 = 6,35

V podniku, kde pracuje deset zaměstnanců, z nichž devět pobírá měsíční plat 10 000 Kč a jeden (majitel) 100 000 Kč, vychází mediánová mzda 10 000 Kč, zatímco průměrná mzda vychází 19000 Kč. Medián je tedy v porovnání s průměrem méně citlivý na extrémně malé nebo extrémně velké hodnoty, což z něj dělá lepší měřítko pro zešikmená rozdělení. Aby se například omezily výjimečné hodnoty cen velkých bytů, může být používána „mediánová cena bytů“.

Pro symetrické rozdělení bude mít průměr i medián stejnou hodnotu, právě ve středu rozdělení (Obr. 7a). Čím více bude rozdělení symetričtější, tím větší tendence k přibližování hodnoty průměru a mediánu bude existovat. Naopak jakmile se bude zvyšovat asymetrie a šikmost rozdělení, tím více se budou hodnoty průměru a mediánu rozcházet. Pokud bude mít průměr vyšší hodnotu než medián, bude rozdělení zešikmeno napravo a naopak. Skutečnost, že u kladně zešikmeného rozdělení je průměr vyšší než medián, zatímco v případě záporně zešikmených rozdělení je hodnota průměru menší než hodnota mediánu, je ilustrováno na obrázku (Obr. 7). Čím více se rozdělení bude odchylovat od symetrie (čím více bude zešikmené), tím vhodnější bude použít medián.

Průměr a medián u nezešikmeného a zešikmeného rozdělení

Obr. 7: Průměr a medián u nezešikmeného a zešikmeného rozdělení

widgety

Pro ilustraci vztahu mezi průměrem a mediánem uveďme výtah z tiskové zprávy Českého statistického úřadu: Průměrná hrubá měsíční mzda […] za celý rok 2002 činila po dopočtech 18 133 Kč, mzda prostředního zaměstnance (medián) byla jen 15 542 Kč. Rozdíl mezi mediánem a aritmetickým průměrem (průměrnou mzdou) vypovídá o tom, že rozdělení mezd je velmi zešikmené. Aritmetický průměr je silně ovlivňován velmi vysokými výdělky vcelku malé skupiny zaměstnanců, nevypovídá o mzdové úrovni běžného zaměstnance […] V roce 2002 již téměř dvě třetiny (66 %) zaměstnanců pobíraly podprůměrnou mzdu a jedna třetina nadprůměrnou.

Zdroj: tisková zpráva Českého statistického úřadu 6. 10. 2003

Situace je ilustrována na obrázku (Obr. 8).

Rozdělení mezd v roce 2002

Obr. 8: Rozdělení mezd v roce 2002
Zdroj: tisková zpráva Českého statistického úřadu 6. 10. 2003

Anketa

Jaká je vaše hrubá mzda?

8 názorů Vstoupit do diskuse
poslední názor přidán 18. 10. 2014 21:37