1 Studijní opory předmětu MT 003 STATISTIKA v kombinovaném studiu Vysoké školy hotelové v Praze, bakalářský studijní program všech oborů Předmět MT 003 STATISTIKA je složen ze dvou rovnocenných částí a to z části statistika a z části matematika a je určen studentům kombinovaného studia všech oborů VŠH. Výuka předmětu "MT 003 STATISTIKA" v kombinovaném studiu bakalářského studijního programu všech oborů probíhá ve třech modulech, celkem 15 hodin, každý modul je pětihodinový (5 - 5 -5). Poměr výuky části statistika a matematika je 50% pro statistiku a 50% pro matematiku. Formou atestace je zkouška (6 kreditů). Garant předmětu: Dr. Ing. Sylva Skupinová Přednášející: Dr. Ing. Sylva Skupinová; Doc. RNDr. Miloslav Malec, CSc. Cvičící: Dr. Ing. Sylva Skupinová; Doc. RNDr. Miloslav Malec, CSc. (podle počtu studentů zapsaných v tutoriálu) Zkoušející: Dr. Ing. Sylva Skupinová; Doc. RNDr. Miloslav Malec, CSc. Úvodní tutoriál Obsahová náplň předmětu MT003 část statistika 1. Statistika - zajímavosti a historie statistiky 2. Statistika - vědní disciplína, základní statistické pojmy 3. Rozdělení statistických charakteristik, míry polohy 4. Míry variability 5. Typy proměnných, rozdělení četností 6. Statistické třídění 7. Metody zkoumání závislosti – kontingence, asociace 8. Metody zkoumání závislosti – regrese 9. Metody zkoumání závislosti – korelace 10. Absolutní přírůstek a index 11. Indexy úrovně a množství, indexní řady 12. Souhrnné indexy 2 Obsahová náplň předmětu MT003 část matematika 1. Algebra reálných čísel 2. Pojem funkce, elementární funkce a její grafy 3. Základní vlastnosti funkcí, algebraické operace s funkcemi, funkce složená 4. Posloupnosti 5. Rovnice a nerovnice 6. Pojem derivace, její význam a výpočet 7. Lokální extrémy funkce 8. Průběh funkce – použití první derivace ke konstrukci grafů jednodušších funkcí 9. Neurčitý a určitý integrál, jednoduché metody 10. Aplikace určitého integrálu – výpočet velikosti plochy 11. Pravděpodobnost – její výpočet 12. Distribuční funkce, normální rozdělení, jeho vlastnosti 13. Opakování základních pojmů a vzorových příkladů Studijní literatura Základní: Novák, I.: Statistika. 2001,VŠH, ISBN 80-86578-56-9 Malec, M.: Elementární matematika. VŠH, 2008, Vysoká škola hotelová, ISBN 978-80- 86578-62-0 Doporučená: Jirásek, F.; Benda J.: Matematika pro bakalářské studium. Ekopress Praha, 2006, Tiskárny Havlíčkův Brod, ISBN 80-86929-02-7 Pecáková, I., Novák, I., Herzmann, J.:Pořizování a vyhodnocování dat. VŠE Praha, 2004,Oeconomica ISBN 80-245-0753-6 Hindls, R., Hronová, S., Novák, I.: Analýza dat v manažérském rozhodování. VŠE Praha, 1999 ,Grada, ISBN 80-7169-255-7 Kaňka, M., Henzler, J.: Matematika pro ekonomy. Ekopress, Praha 1997. Hindls, R. a kol.: Statistika pro ekonomy. Professional Publishing, Praha 2007. Cíle výuky předmětu MT003 3 Studenti budou seznámeni se základními i nadstavbovými matematickými a statistickými operacemi a postupy používanými v ekonomické a hospodářské praxi. Předmět je zaměřen rovněž na problémy vznikající při aplikacích těchto metod. Získané poznatky studenti využijí v nadstavbových předmětech bakalářského a následně magisterského studia popřípadě při zpracování dat v bakalářské práci. Osvojené postupy z oblasti statistiky a matematiky umožní studentovi pochopit základní principy ekonomických modelů používaných v praxi. Požadavky ke zkoušce Předmět MT 003 Statistika je ukončen písemnou a ústní zkouškou. Předpokladem pro její složení je: • aktivní účast na výuce v jednotlivých modulech (soustředění) • prostudování základní literatury a studijních opor • splnění korespondenčních úkolů • úspěšné absolvování závěrečných testů a ústní části zkoušky Organizace studia Výuka předmětu "MT 003 Statistika" (semestrální kurz) je rozdělena na kontaktní a distanční část a probíhá ve třech modulech. Kontaktní výuka (15 hodin) je realizována v rámci tří soustředění, jde o 5 + 5 + 5 hodin přímé výuky. Části statistika a matematika jsou rovnocenné, každá část zaujímá 50% výuky. V každém soustředění se uskuteční výuka jednoho modulu, který tvoří dvě povinné části: "tutoriál" a "průvodce studiem". Převážná část kombinovaného studia předmětu MT 003 má sice distanční formu, avšak z hlediska pedagogického přístupu ke studentům a jejich možnostem spolupracovat s vyučujícím (tutorem), jde o průběžnou výuku. Na tutoriálech a ve studijních materiálech jsou zadávány úkoly, jejichž splněním student dokládá průběžnost svého studia. Komunikace s vyučujícím je zajištěna přes Internet (skupinova@vsh.cz; malec@vsh.cz) a v průběhu semestru může student navštívit konzultační hodiny učitele. V případě problémového tématu má možnost navštívit přednášky či semináře prezenčního studia. Pokud mu nestačí konzultace telefonická či prostřednictvím výukového prostředí (IS), může si student domluvit individuální (event. kolektivní) konzultaci. Administrativu studia zajišťuje příslušná referentka studijního oddělení. Všechny kontakty mezi učitelem a studujícím probíhají v rámci informačního systému VŠH. 4 Časový harmonogram výuky a obsahové zaměření modulů část statistika: 1. modul (únor) = Základní statistické charakteristiky (téma 1 - 6) 2. modul (březen) = Metody zkoumání závislosti (téma 7 - 9) 3. modul (květen) = Absolutní přírůstek a index (téma 10 - 12) Časový harmonogram výuky a obsahové zaměření modulů část matematika: Obsahová náplň matematické části předmětu: 1. modul (únor) = Vybrané kapitoly z elementární matematiky – výroky, množiny, algebra reálných čísel, rovnice, nerovnice, reálné funkce – základní vlastnosti, funkce elementární. 2. modul (březen) = Zavedení pojmu derivace a integrálu, jejich aplikace. 3. modul (květen) = Elementy pravděpodobnosti. Tutoriály: Na úvodním tutoriálu na začátku semestru jsou studenti seznámeni, v rámci tzv. průvodce kurzu, s obsahem předmětu, s časovým rozvržením výuky jednotlivých tématických okruhů, s místem předmětu ve studijním plánu oboru, s povinnou literaturou, cílem výuky a s požadavky ke zkoušce. Je zde vysvětlen přístup k tzv. studijním oporám (studijní materiály, metodické listy) a způsob odevzdávání kontrolních úkolů (testů) v informačním systému VŠH. Studentům je objasněn způsob hodnocení kontrolních úkolů a termíny jejich odevzdávání. Je probrána celková organizace výuky. Na průběžném tutoriálu (uprostřed semestru) učitel vyhodnocuje dosavadní práci studentů. Studenti musí zaslat vyřešené úkoly elektronicky před zahájením týdne konzultací. Učitel upozorní na závažné nedostatky a v případě potřeby obtížná témata vysvětlí. Na závěrečném tutoriálu na konci semestru učitel vyhodnotí uložené úkoly z minulého tutoriálu a práci studentů za celý semestr. Upozorní na problémové otázky tématických okruhů ke zkoušce. Podle potřeby proběhne společná konzultace. Studenti jsou seznámeni s časovým harmonogramem zkoušek. Průvodce studiem: V této kontaktní části studia je proveden metodický výklad (přednáška) daného tématického celku. Studenti jsou seznámeni s tím, co budou studovat z povinné literatury (musí být k dispozici pro studenty), jaká úskalí je čekají při samostudiu a jak jim bude učitel pomáhat při studiu. Velká pozornost je věnována jejich práci se studijními oporami, které jim nahrazují 5 bezprostřední kontakt s vyučujícím na cvičeních (seminářích). Studijní opory jsou připraveny pro každý tématický okruh (kapitolu učebnice). Jejich součástí jsou: cíle, úvod, vlastní výklad tématu, shrnutí vyložené problematiky, klíčové pojmy, úkoly k zopakování a procvičení, odkazy na další studijní zdroje a hodnocení. Studijní opory jsou vloženy v rámci IS do části studijní materiály předmětu MT003. Zpětnovazební prvky výuky (korespondenční úkoly) vyučující vkládají v informačním systému do položky odpovědníky. Jejich zadání musí být jednoznačné a nesmí umožňovat různá řešení (pokud to ale není záměr vyučujícího). Vypracované úkoly studenti vkládají do odevzdavárny, event. přímo vyučujícímu. Při studiu předmětu MT003 student využívá tři informační zdroje: metodologický výklad učitele, který vychází z předepsané literatury kontaktní výuku v rámci tutoriálu a samostudia; předepsanou literaturu a metodické materiály Průvodce studiem jednotlivých MODULŮ A) ČÁST STATISTIKA 1. Modul Modul tvoří tři tématické okruhy. Každý je probírán samostatně, jako kapitola v učebním materiálu. Tématické okruhy: 1.1. Pojem statistika; Historie statistiky; Český statistický úřad 1.2 Statistické charakteristiky 1.3. Statistické třídění Studijní cíle V této kapitole se studenti seznámí se základními statistickými pojmy a historickými základy vědní disciplíny „statistika“. Bude objasněna práce a význam Českého statistického úřadu včetně uvedení kontaktních údajů na tuto státní organizaci. Dále budou studenti seznámeni se základními statistickými charakteristikami, postupy výpočtu a metodami statistického třídění. 6 Klíčová slova: pojem statistika, historie statistiky, ČSÚ, statistický soubor, normované normální rozdělení, typy proměnných, míry polohy, míry variability, četnostní tabulky 1.1. Pojem statistika, Historie statistiky, Český statistický úřad Slovo statistika vzniklo z latinského slova „status“ = stav Pod pojmem statistika lze rozlišit následující významy: •Číselné údaje •Praktická činnost •Vědní disciplína V povědomí lidí se běžně vyskytují výrazy: statistický úřad, statistický vzorec, statistický výpočet. Statistika se zabývá zkoumáním pravidelností a zákonitostí, projevujících se v tzv. hromadných jevech a vyjadřuje je číselně. Řada symbolů ve statistice čerpá z řecké abecedy. Statistika jako vědní disciplína: •Pracuje s hromadnými jevy •Hledá zákonitosti hromadných jevů, ke kterým využívá hromadná pozorování •Používá kvantitativní metody hodnocení s využitím matematiky • Je aplikovatelná ve většině oborů kvantitativního výzkumu Statistika zahrnuje: •Sběr dat –Průzkum •Prezentování dat –Grafy –tabulky •Popis dat –Rozptyl –Modus… 1.2. Historie statistiky •Úřední zjišťování 7 - Vojenské a finanční účely panovníků, sčítání obyvatel (Egypt 3000 let př.n. l., Čína) •Univerzitní statistika - 18.století, pouze slovní výrazy;německý prof. Gottfried Achenwall (1719-1772) – rozšíření slova „statistika“ (státní zvaláštnosti) •Politická aritmetika - Nestačí jevy pouze popisovat, je nutné hledat zákonitosti jejich fungování Adolphe Jacques Quételet (1796-1874) – zavedl pojem průměrný (ideální) typ člověka, koncept normálního rozdělení, střední hodnoty a rozptylu •Teorie pravděpodobnosti + Matematická statistika Matematici 17-19. století - Ve 20. století dochází k výběrovému zjišťování s využitím teorie pravděpodobnosti - Karl Pearson (1857-1936) Statistika 19. a počátku 20. století Þ vytváření rozsáhlých souboru dat, sběr mnoha informací od co nejširšího okruhu respondentů, se zjevným cílem: obsáhnout ve svém šetření celou populaci a tím získat maximálně přesný obraz stavu společnosti Úvaha z časových a finančních důvodů: je opravdu třeba zkoumat celou populaci, nebo postačí vybrat pouze její reprezentativní vzorek??? Na základe této myšlenky se počátkem 20. století zrodila matematická statistika, disciplína, jejímž charakteristickým rysem je hledání metod, jež by umožnily vytvoření závěru o celku na základě výběru Česká republika má z historického hlediska ve statistice velmi silné kořeny. Za vůbec nejstarší dochovaný soupis je považován soupis majetku litoměřického kostela z roku 1058, který je součástí zakládací listiny knížete Spytihněva II. Významné osobnosti ve statistice lze nalézt na následujících www stránkách:http://www.economics.soton.ac.uk/staff/aldrich/Figures.htm Český statistický úřad (ČSÚ) K 1. 1. 1993 se vznikem ČR převzal ČSÚ všechny kompetence národního statistického úřadu (zákon č. 89/1995 Sb., O státní statistické službě, novelizace k 1. 1. 2001, ve znění pozdějších předpisů) ČSÚ nabízí přístup k mnoha významným statistickým informacím, klientům je k dispozici knihovna, studovna. ČSÚ poskytuje zásadní literární prameny se statistickými výstupy ve formě ročenek i necyklických publikací. Adresa a kontaktní údaje ČSÚ: 8 Na padesátém 81 100 82 Praha 10 Tel: 274 051 111 (ústředna) http://www.czso.cz/ 1.2. Statistické charakteristiky Základní pojmy •Hromadný jev – předmět statistiky: Hromadné jevy = jakékoliv přírodní nebo společenské jevy (skutečnosti), týkající se souboru prvků určitým způsobem definovaných – neboli jevy, které se vyskytují u velkého počtu jednotek, přičemž jejich konkrétní forma na individuální jednotce je výsledkem působení určitého seskupení činitelů •Soubory = statistické soubory – množina statistických jednotek (mající společné vlastnosti) •Prvky statistických souborů = statistické jednotky – základní objekt pozorování, na kterém je možné zkoumat konkrétní projevy sledovaného hromadného jevu (osoba, hotel, domácnost, událost…) Rozsah souboru – počet jednotek, tvořících statistický soubor Statistický soubor •Vymezení: –Věcné (druhové) (Příklad: průměrná měsíční mzda žen) –Prostorové (Příklad: zaměstnankyně hotelu „Sen“ ) –Časové (Příklad: srpen 200n) •Rozsah: –Základní soubor (populace), rozsah N –Výběrový soubor (vzorek), rozsah n•Obsah –Je určen znaky statistických jednotek Statistický znak = proměnná – vnější, pozorovatelný, měřitelný projev vlastností statistické jednotky. Variabilní statistický znak – vlastnosti, v nichž se jednotky souboru mohou lišit 9 Statistické třídění Třídění jednotek podle jednoho znaku v rámci statistického souboru umožňuje popis jeho charakteristických skupin Třídění jednoduché = jednostupňové (Příklad: rozdělení populace na muže a ženy) vícestupňové (vícenásobné) (Příklad: muži do 50 let…) Třídící znaky (kriteria) - znaky umožňující roztřídění souboru do skupin (věk…) Statistické charakteristiky – charakteristika vlastnosti množiny hodnot = charakteristika vlastnosti souboru daných jednotek, například aritmetický průměr Techniky pořizování dat •Dotazování - ústní – přesné odpovědi, minimalizace odmítání - písemné – levné, nízká návratnost dotazníků - telefonické – mnoho dotazovaných odmítá odpovědět - elektronické… •Měření (laboratorní výsledky…) Proměnné ve statistice Nejčastější typy proměnných ve statistických výpočtech 10 Spojité proměnné – mohou nabývat všech hodnot z konečného nebo nekonečného intervalu (tělesná teplota, cena zboží) Diskrétní (nespojité) proměnné - nabývají konečně nebo spočetně mnoha od sebe vzájemně oddělených hodnot (počet srdečních stahů za minutu, počet míst v restauraci) Nejčastěji využívaný typ rozdělení ve statistice je Gaussovo rozdělení, které po transformaci převedeme na N(0; 1) normované normální rozdělení s následujícími vlastnostmi: – zásadní význam ve statistické teorii i aplikacích – je nejdůležitějším a nejfrekventovanějším rozdělením spojitých náhodných veličin – lze jím nahradit i rozdělení diskrétní – určujeme pravděpodobnost, že náhodná veličina X z normálního rozdělení bude nabývat hodnot z nějakého intervalu (a, b) (Převzato z http://someonecz.blogspot.com/2009/10/iq-aneb-proc-je-chytry-kluk-sam.html) Grafické znázornění normálního rozdělení je dáno touto symetrickou jednovrcholovou hustotou, která je zvonovitého tvaru a nikde neprotíná vodorovnou osu. Normované normální rozdělení je tabelizované vis část matematika kapitola Normální rozdělení. Tabulky bývají součástí základní statistické literatury nebo PC programů. Průměr µ - parametr ležící pod vrcholem hustoty. Parametr σ - směrodatná odchylka a jeho druhá mocnina σ2 je rozptyl veličiny X. Plocha pod křivkou hustoty normálního rozdělení je rovna jedné. Pravděpodobnost, že náhodná veličina nabude hodnot z určitého intervalu, je rovna ploše pod hustotou nad tímto intervalem. Příklad: Pro interval s hranicemi µ-1,96σ a µ+1,96σ má tato plocha velikost 0,95. Náhodná veličina X nabývá tedy hodnot z tohoto intervalu s 95% pravděpodobností a pouze s 5% pravděpodobností leží její hodnoty mimo uvedený interval 2 2 2 )( 2 1 )( σ µ πσ −− = x exf 11 Statistické charakteristiky Základní statistické charakteristiky studujeme u dvou typů statistických souborů: •Základní statistický soubor (symbolika je vyjádřena řeckou abecedou) – nekonečné (hypotetické) nebo velmi rozsáhlé konečné soubory (statisíce jednotek) •Výběrový statistický soubor(symbolika je vyjádřena latinskou abecedou) – malé (desítky jednotek) a velké výběry (stovky až tisíce jednotek) Na základě údajů o výběrovém souboru, na základě výběrových dat, formulujeme závěry o základním souboru! Míry polohy Rozsah statistického souboru - n •Aritmetický průměr x – střední hodnota kvantitativního statistického znaku (součet hodnot, dělený jejich počtem) •Medián x~ – je-li n (rozsah souboru) liché číslo, medián je prostřední hodnota; je-li n sudé číslo je medián aritmetickým průměrem dvou prostředních hodnot •Modus xˆ – hodnota nejčastěji se v souboru vyskytující •Kvantily Kvantily jsou míry polohy rozdělení pravděpodobnosti náhodné veličiny. Popisují body, ve kterých distribuční funkce náhodné proměnné prochází danou hodnotou. V statistice kvantily rozdělují seřazený soubor na několik (zhruba) stejně velkých částí. Kvantily pro některé význačné hodnoty jsou označovány zvláštními jmény a pro nejdůležitější rozdělení jsou hodnoty základních kvantilů uváděny v tabulkách. Percentil - dělí statistický soubor na setiny. 1% kvantil je 1. percentil. n x x i∑= 12 Decil - dělí statistický soubor na desetiny. 10% kvantil je 1. decil. Kvartily - oddělují ze statistického souboru čtvrtiny. Rozlišuje se dolní kvartil a horní kvartil. 25% kvantil je 1. kvartil (dolní kvartil) a 75% kvantil je 3 kvartil (horní kvartil). Medián - kvantil rozdělující statistický soubor na dvě stejně početné množiny. Medián je totéž co 50% kvantil, 2. kvartil, 5. decil nebo 50. percentil. Dobrý popis rozdělení pravděpodobnosti dostaneme stanovením dostatečného počtu kvantilů. Příklad: Kvantily lze používat např. pro vyhodnocování přijímacích testů: bodové výsledky všech zájemců tvoří statistický soubor, zatímco příslušné kvantily označují, jaká část zájemců dosáhla daného výsledku. Pokud například kvantil 90 % má hodnotu 150 bodů a některý student v testu získal právě 150 bodů, ví, že má lepší hodnocení než 90 % všech studentů (je tedy mezi 10 % nejlepších a pokud má být přijato např. 15 % zájemců, měl by se kvalifikovat). •Dolní kvartil – horní mez jedné čtvrtiny nejmenších hodnot v uspořádaném výběru Výpočet n/4 - je-li výsledek celé číslo, kvartil je aritmetický průměr hodnoty n/4-té a n/4+1-ní -není-li výsledek celé číslo, hledáme nejmenší celé číslo větší než n/4 a kvartilem je hodnota s tímto pořadovým číslem v uspořádaném výběru •Horní kvartil – dolní mez jedné čtvrtiny největších hodnot v uspořádaném výběru Výpočet 3n/4, postup stejný jako pro dolní kvartil Poznámka: Při výpočtu charakteristik míry polohy, vyjma aritmetického průměru, je nezbytné data seřadit do tzv. uspořádaného výběru, kdy data řadíme od minimální po maximální hodnotu. Rozsah souboru n musí být po seřazení zachován. Míry variability nedefinující proměnlivost uvnitř souboru dat Variační rozpětí R - je rozdílem mezi maximální a minimální hodnotou znaku: R = xmax – xmin Používá se jako základní informace pro návrh hranic intervalů při statistickém třídění. 13 Mezikvartilové rozpětí – rozdíl mezi horníma dolním kvartilem. Udává délku intervalu, ve kterém leží zhruba polovina pozorovaných hodnot. Míry variability definující proměnlivost uvnitř souboru dat •Rozptyl – nejpoužívanější míra variability. Rozptyl je průměrná hodnota ze součtu čtverců odchylek jednotlivých hodnot souboru od aritmetického průměru (µrespektive x ); charakterizuje střední stupeň kolísání hodnot v souboru kolem aritmetického průměru. Je vyjádřen ve druhých mocninách jednotek sledovaného znaku. Pro základní statistický soubor se označuje σ2 , 2 nσ s 2 , pro výběrový statistický soubor 2 1-nσ , S 2 . x – numerická proměnná, xi – hodnoty numerické proměnné u vybraných jednotek, i = 1,2…n •Směrodatná odchylka σ (základní soubor) respektive S (výběrový soubor) – je kladná hodnota druhé odmocniny rozptylu. Vyjadřuje střední kolísání hodnot znaku v souboru okolo aritmetického průměru ve stejných jednotkách v jakých je vyjádřen aritmetický průměr. 2 σσ = 2 SS = •Variační koeficient Vk – je relativní charakteristikou variability. Vyjadřuje variabilitu ve srovnatelném měřítku. Využívá se pro porovnání variabilit většího počtu u znaků, které často nabývají nejen rozdílné úrovně hodnot, ale jsou i v rozdílných jednotkách. 2 2 i2 x n x −= ∑σ 1n n )x( Σx S 2 i2 i 2 − Σ − = 14 Poznámka: pro statistické výpočty je nezbytné využívat vědecký kalkulátor s alespoň jednorozměrnou statistickou funkcí. Pro ovládání kalkulátoru využijte návod přikládaný výrobcem. 1.3. Statistické třídění – rozdělení četností Pod pojmem rozdělení četností chápeme uspořádání dat (hodnot) do skupin za účelem vyniknutí charakteristické vlastnosti sledovaných jevů. Nejčastěji se při statistickém třídění spojitých a diskrétních proměnných využívají tzv. četnostní tabulky. Četnostní tabulky: Četnostní tabulka diskrétní číselné proměnné zahrnuje: Absolutní četnosti – hodnoty proměnné se řadí do tabulky od nejmenší k největší, každé hodnotě se připíše počet statistických jednotek ve výběru s danou hodnotou Modus – hodnota proměnné s největší četností Relativní četnosti – poměr četnosti a rozsahu výběru Relativní četnosti nezávisí na rozsahu výběru, lze porovnávat dva výběry různého rozsahu. Kumulativní četnosti a kumulativní relativní četnosti – kolik statistických jednotek nebo jaká část souboru má hodnoty nanejvýše rovné hodnotě, k níž jsou přiřazeny Četnostní tabulka spojité číselné je principiálně podobná tabulce pro diskrétní proměnné s následujícími odlišnostmi: •Hodnoty spojité proměnné se nemusí opakovat, proto se četnosti jednotlivých hodnot se nahradí četnostmi, patřících do jednotlivých intervalů – intervalové četnosti •Intervaly volíme stejného rozsahu •Nízký počet intervalů zkresluje výsledky, příliš vysoký počet intervalů výsledky znepřehledňuje. .100% x S Vk =.100% x σ Vk = 15 Při statistickém třídění s využitím četnostních tabulek s výhodou počítáme vážený aritmetický průměr a vážený rozptyl. Vážený aritmetický průměr: Vážený rozptyl Poznámka: U diskrétní proměnné jsou váhou hodnot proměnné četnosti, u spojité proměnné jsou váhou hodnot proměnné četnosti ni, vlastní hodnoty xi jsou nahrazeny hodnotou „střed intervalu“. Grafické výstupy z četnostních tabulek Pro znázornění četností u spojitých proměnných se používají histogramy (četnosti se přiřazují intervalům). Pro znázornění četností u diskrétních proměnných se používají polygony (četnosti se přiřazují jednotlivým hodnotám). Shrnutí kapitoly V kapitole byly vysvětleny základní statistické pojmy a nejzajímavější historické mezníky. Z práce ČSÚ vyplývá, že statistika nás provází dnes a denně doslova na každém kroku. Podmínkou úspěšného řešení statistických výpočtů je získávání kvalitních výběrových dat v dostatečném množství. Na základě zásadních statistických výpočtů lze popsat data získaná statistickým šetřením základními statistickými charakteristikami a je možné tato data dále hlouběji analyzovat. Rovněž statistické třídění, sestrojování četnostních tabulek, je nedílnou součástí před hlubší analýzou dat nadstavbovými statistickými metodami. Pojmy k zapamatování: 2 i ii i 2 i Σn xΣn Σn xΣn i       −= i i Σn xΣn i = 16 Hromadný jev, statistický soubor, statistické šetření a třídění, proměnná, normované normální rozdělení, rozsah souboru, míry polohy (aritmetický průměr, kvantil, modus, medián), míry variability (variační a mezikvartilové rozpětí, rozptyl, směrodatná odchylka, variační koeficient), četnostní tabulky spojité a diskrétní proměnné, histogram a polygon. Úkoly k zopakování a procvičení Příklad 1.1. Historie statistiky na území České republiky se datuje od: a) středověku b) novověku c) 20 století Řešení: a Hlavní sídlo Českého statistického úřadu se nachází: a) ve Zlíně b) v Ostravě c) v Praze Řešení: c Modus je: a) hodnota nejčastěji se v souboru vyskytující b) střední hodnota kvantitativního statistického znaku c) prostřední hodnota kvantitativního statistického znaku Řešení: a Příklad 1.2.: Rozhodněte, zda uvedené náhodné veličiny jsou diskrétní nebo spojité: 1. Počet servírek na území obce Plzeň 2. Obsah vitamínu B v pivu 3. Počet 5* hotelů na území Evropské unie 4. Procentické zastoupení bílkovin v hovězím mase Řešení: 1. diskrétní proměnná, 2. spojitá proměnná, 3. diskrétní proměnná, 4. spojitá proměnná 17 Příklad 1.3.: V obchodních řetězcích byla zjišťována cena vepřové plece v Kč. Byly získány následujíce data: 98,00; 94, 50; 89,50; 101,00; 92,00; 89,50; 90,50. Určete typ souboru a proměnné, minimální a maximální hodnotu a vypočítejte aritmetický průměr, modus, medián, dolní kvartil, horní kvartil, variační rozpětí, mezikvartilové rozpětí, směrodatnou odchylku, rozptyl, variační koeficient u daného souboru dat. Řešení: Jedná se o výběrový statistický soubor. Typ proměnné: spojitá proměnná Uspořádaný výběr: 89,50; 89,50; 90,50;92,00; 94, 50; 98,00; 101,00 Minimum = 89,50 Maximum = 101,00 Dolní kvartil: n/4 = 7/4 = 1,75 → 2 hodnota = 89,50 Horní kvartil: 3n/4 = 21/4 = 5,25 → 6 hodnota = 98,00. Variační rozpětí: max. – min. = 101,00 – 89,50 = 11,50 Mezikvartilové rozpětí: horní kvartil – dolní kvartil = 98,00 – 89,50 = 8,50 Aritmetický průměr: 93,57,-Kč Modus: 89,50,-Kč Medián: 92,00,-Kč Směrodatná odchylka S: 4,49,-Kč Rozptyl S2 : 20,12,-Kč2 Variační koeficient Vk: 0,048 = 4,8% Příklad 1.4.: Sestavte četnostní tabulku z následujících dat diskrétní proměnné -počty míst k sezení: 2, 4, 4, 8, 2, 2, 4, 4, 4, 3, 6, 2, 4, 4, 3, 4, 4, 8, 6, 4, 3, 8, 1, 2, 1. Vypočítejte vážený aritmetický průměr a vážený rozptyl. Řešení: Uspořádaný výběr: 1, 1, 2, 2, 2, 2, 2, 3, 3, 3, 4, 4, 4, 4, 4, 4, 4, 4, 4, 4, 6, 6, 8, 8, 8 Četnostní tabulka diskrétní proměnné: 18 Poslední dva sloupce tabulky slouží jako pomocné výpočty pro zjištění váženého aritmetického průměru a váženého rozptylu. Vážený aritmetický průměr = 3,88 míst, vážený rozptyl = 3,87míst 2 . Sestavte četnostní tabulku z následujících dat spojité proměnné – cena zboží v Kč: 15,50; 21,0; 18,50; 16,0; 28,50; 14,50; 24,0; 19,50; 25,50; 16,0; 17,50; 17,0; 29,0; 21,50; 22,0; 11,0;13,0; 24,50;23,50;25,0. Vypočítejte vážený aritmetický průměr a vážený rozptyl. Řešení: Uspořádaný výběr: 11,0; 13,0; 14,50; 15,50; 16,0; 16,0; 17,0; 17,50; 18,50; 19,50; 21,0; 21,50; 22,0; 23,50; 24,0; 24,50; 25,0; 25,50; 28,50; 29,0 Četnostní tabulka spojité proměnné: Hodnota xi Četnost ni Relativní četnost ni/n Kumul. četnost Kumu. relativní četnost nixi nixi 2 1 2 2/25=0,08 2 0,08 1.2=2 1.2=2 2 5 5/25=0,20 2+5=7 0,28 2.5=10 4.5=20 3 3 3/25=0,12 7+3=10 0,40 3.3=9 9.3=27 4 10 10/25=0,40 10+10=20 0,80 4.10=40 16.10=160 6 2 2/25=0,08 20+2=22 0,88 6.2=12 36.2=72 8 3 3/25=0,12 22+3=25 1 8.3=24 64.3=192 Σ n=25 1 97 473 Hodnota xi Četnost ni Relativní četnost ni/n Kumul. četnost Kumu. relativní četnost nixi nixi 2 1 2 2/25=0,08 2 0,08 1.2=2 1.2=2 2 5 5/25=0,20 2+5=7 0,28 2.5=10 4.5=20 3 3 3/25=0,12 7+3=10 0,40 3.3=9 9.3=27 4 10 10/25=0,40 10+10=20 0,80 4.10=40 16.10=160 6 2 2/25=0,08 20+2=22 0,88 6.2=12 36.2=72 8 3 3/25=0,12 22+3=25 1 8.3=24 64.3=192 Σ n=25 1 97 473 Dolní mez < Horní mez ) Střed intervalu xi Četnost ni nixi nixi 2 10,0 15,0 12,5 3 3.12,5=37,5 468,75 15,0 20,0 17,5 7 7.17,5=122,5 2143,75 20,0 25,0 22,5 6 6.22,5=135,0 3037,50 25,0 30,0 27,5 4 4.27,5=110,0 3025,00 - - - Σ20 Σ405,0 Σ8675,00 Dolní mez < Horní mez ) Střed intervalu xi Četnost ni nixi nixi 2 10,0 15,0 12,5 3 3.12,5=37,5 468,75 15,0 20,0 17,5 7 7.17,5=122,5 2143,75 20,0 25,0 22,5 6 6.22,5=135,0 3037,50 25,0 30,0 27,5 4 4.27,5=110,0 3025,00 - - - Σ20 Σ405,0 Σ8675,00 19 Poslední dva sloupce tabulky slouží jako pomocné výpočty pro zjištění váženého aritmetického průměru a váženého rozptylu. Vážený aritmetický průměr = 20,25,-Kč, vážený rozptyl =. 23,69,-Kč 2 . Hodnocení Každá správná odpověď nebo výsledek výpočtu je hodnoceno jedním bodem. Sebehodnocením je žádoucí dosáhnout alespoň 70% úspěšnost správných odpovědí, výsledků výpočtů. Jestliže jste nedosáhli požadované úspěšnosti, pokuste se zlepšit svůj studijní výsledek pozornějším studiem kapitoly, popřípadě se spojit s tutorem předmětu. Další studijní zdroje http://new.euromise.org/czech/tajne/ucebnice/html/html/node9.html http://www.economics.soton.ac.uk/staff/aldrich/Figures.htm http://www.czso.cz/ Korespondenční úkol Následující korespondenční úkoly přinese student na následující soustředění (soustředění číslo 2). Korespondenční úkoly jsou rovněž umístěny v odpovědníku IS VŠH. S hodnocením se student seznámí během tutoriálu. Je požadována 70% úspěšnost v řešených úkolech. Příklad: Byly získány následující data výběrového statistického souboru – jedná se o ceny zboží v Kč: 15,70; 16,30; 16,90; 16,90; 16,90; 17,00; 17,00; 18,00; 18,30; 19,50; 19,60; 19,90; 20,50; 20,50; 21,40; 21,80; 22,10. Určete typ souboru a proměnné, minimální a maximální hodnotu a vypočítejte aritmetický průměr, modus, medián, dolní kvartil, horní kvartil, variační rozpětí, mezikvartilové rozpětí, směrodatnou odchylku, rozptyl, variační koeficient u daného souboru dat. Jednotlivé statistické charakteristiky slovně okomentujte. Sestrojte četnostní tabulku a vypočítejte vážený aritmetický průměr a vážený rozptyl. Sestavte vhodný grafický výstup z četnostní tabulky. 20 2. Modul Modul tvoří tři tématické okruhy. Každý je probírán samostatně, jako kapitola v učebním materiálu. Tématické okruhy: 2.1. Metody zkoumání závislosti 2.2. Kontingenční koeficienty, koeficient asociace 2.3. Regresní a korelační analýza Studijní cíle V této kapitole se studenti seznámí se zásadními metodami zkoumání závislosti. Upřesní si pojmy závisle a nezávisle proměnné. Kromě orientačních metodických výpočtů koeficientů kontingence a asociace se studenti seznámí se základy stěžejní statistické metody a to regresní a korelační analýzy. Uvedená metoda je vysvětlena na klasickém lineárním modelu. Rovněž jsou uvedeny a vysvětleny metody hodnocení těsnosti závislosti a další doplňkové definice vztahující se k této, v praxi často využívané, problematice. Klíčová slova: závisle a nezávisle proměnná, dvojrozměrné tabulky, kontingenční koeficient, koeficient asociace, regrese a korelace, regresní přímka, korelační koeficient, koeficient determinace, index determinace 2.1. Metody zkoumání závislosti Při zkoumání závislosti mezi proměnnými je nejdříve nutné posoudit, zda závislost existuje, tedy lze-li vysvětlovat změny hodnot jedné proměnné –vysvětlované = závisle proměnné, změnami hodnot proměnné druhé – vysvětlující = nezávisle proměnné. U systému dvou proměnných obecně platí následující symbolika: x – nezávisle proměnná (vysvětlující proměnná) y – závisle proměnná (vysvětlovaná proměnná) Typy závislostí dvou proměnných: Jednostranná závislost – závisle proměnnou může být pouze jedna z řešených proměnných (závislost velikosti mzdy na počtu odpracovaných hodin).Vzájemná závislost – 21 obě proměnné lze volit za závisle nebo nezávisle proměnnou (výdaje domácnosti na cestování a na vzdělání). Síla závislosti Mezi proměnnými se zkoumá síla – těsnost závislosti. Závislost lze považovat za silnou – velmi těsnou, jestliže změny hodnot jedné proměnné jsou plně vysvětlitelné změnami druhé proměnné. Síla závislosti se popisuje různými koeficienty.Při nezávislosti proměnných jsou hodnoty koeficientů rovné nule, s růstem závislosti rostou jejich absolutní hodnoty (maximální hodnotou je jednička). Dvojrozměrné tabulky Naměřené (zjištěné) údaje – hodnoty závisle a nezávisle proměnné se uspořádávají do dvojrozměrné tabulky. V záhlaví tabulek se uvedou hodnoty proměnných, buňky tabulek obsahují četnosti kombinací obou proměnných (sdružené četnosti). Tabulky se doplňují součty za řádky a za sloupce (okrajové četnosti). Můžeme rozlišit dva typy dvojrozměrných tabulek: • Kontingenční tabulky – dvojrozměrná tabulka slovních proměnných. • Korelační tabulky – dvojrozměrné tabulky číselných proměnných. Příklad kontingenční tabulky s rozsahem souboru n = 130: Spokojenost s novým vozidlem Věková kategorie Ano Ne Celkem ΣΣΣΣ 18 - 40 let 35 12 47 41- 60 let 42 11 53 nad 60 let 16 14 30 Celkem ΣΣΣΣ 93 37 130 Spokojenost s novým vozidlem Věková kategorie Ano Ne Celkem ΣΣΣΣ 18 - 40 let 35 12 47 41- 60 let 42 11 53 nad 60 let 16 14 30 Celkem ΣΣΣΣ 93 37 130 22 2.2. Kontingenční koeficienty, koeficient asociace Kontingenční koeficienty se používají k měření závislosti. Některé kontingenční koeficienty jsou založeny na výpočtu hodnoty χ2 (čti chí-kvadrát): Výpočet hodnoty χ2 : s – sdružené četnosti e - teoreticky očekávané četnosti, za předpokladu nezávislosti proměnných. e = (součet četností řádku . součet četností sloupce) / rozsah výběru n Koeficient asociace Asociační závislost stanovujeme mezi kvalitativními znaky . Typicky se analýza asociace provádí pro dichotomické znaky, což jsou znaky, které principiálně nabývají pouze dvou hodnot, (ano, ne) a které se navzájem vylučují. Asociační výpočet má za úkol: • ze známých variant jednoho znaku odhadnout varianty znaku druhého. 2 2 e e)(s χ − ∑= 23 • změřit intenzitu (stupeň těsnosti) vlastní asociace. Hodnoceni koeficientu asociace:RA ∈<-1;1>; přímá závislost: RA > 0, nepřímá závislost: RA < 0, nezávislost RA = 0. Čím více se hodnota RA blíží k 1, tím je asociace silnější. Formálně se jedná o koeficient korelace pro 0,1 hodnoty proměnných.Asociační tabulka obsahuje četnosti výskytu jednotlivých kombinací uspořádané do čtyřpolní tabulky. Je to tedy speciální případ kontingenční tabulky typu 2x2 . Příklad asociační tabulky: (ab); (aβ); (αb); (αβ) – sdružené četnosti (a); (α); (b); (β) – okrajové četnosti n – rozsah souboru Výpočet koeficientu asociace RA: 24 2.3. Regresní a korelační analýza Regresní analýzou zkoumáme průběh a korelační analýzou zkoumáme těsnost závislosti mezi kvantitativními znaky - vztahy závisle proměnných (y) na nezávisle proměnných (x). Před každým výpočtem, je nezbytné se ujistit, že mezi proměnnými závislost existuje! Regrese je vyjádřena matematickou funkcí, která udává vlastní průměrný průběh sledované závislosti mezi proměnnými x a y. Parametry regresní funkce jsou počítány. Před vlastním výpočtem regresní funkce je nutno zvolit vhodný typ funkce pro vyjádření průměrného průběhu závislosti. Základním modelem je lineární regrese, kde matematickou funkcí je přímky s obecnou rovnicí y = a + bx. Data, získaná statistickým šetřením, vytvářejí uspořádané dvojice [x; y]. Jednotlivé body se vynášejí do pravoúhlého osového systému a vzniká tak tzv. korelační pole. Příklad korelačního pole: 25 U lineárních regresních funkcí, kam řadíme rovněž přímku, se číselné hodnoty parametrů počítají metodou nejmenších čtverců. (Detailní postup této metody nespadá do rámce předmětu statistika pro bakalářské studium. Zájemci se o metodě mohou dozvědět více v doporučené literatuře). Výpočet parametrů regresní přímky Níže uvedené pracovní vzorce jsou výstupem metody nejmenších čtverců a umožňují výpočet parametrů a, b regresní přímky s obecnou rovnicí y = a + bx. b- regresní koeficient - udává, o kolik se v průměru změní hodnota závisle proměnné yi v rovnici, jestliže hodnotu nezávisle proměnné xi zvýšíme o jednotku. Znaménko před hodnotou regresního koeficientu určuje průběh funkce. Je-li b kladné číslo, funkce je lineárně rostoucí, je-li b záporné číslo, funkce je lineárně klesající. Regresní koeficient je směrnicí přímky. 26 Korelační analýza Pro hodnocení těsnosti lineární závislosti mezi proměnnými x, y, vyjádřené regresní funkcí například rovnicí přímky y = a + bx, je používán koeficient korelace - r.Koeficient korelace může nabývat hodnot z uzavřeného intervalu od (-1) do (+1), tj. r ∈ <-1;+1>. Znaménko před hodnotou korelačního koeficientu (stejně jako před hodnotou regresního koeficientu) určuje směr závislosti. Je-li r kladné číslo, je regresní funkce lineárně rostoucí, mezi proměnnými x, y je přímo úměrná závislost. Je-li r záporné číslo, je regresní funkce lineárně klesající, mezi proměnnými x, y je nepřímo úměrná závislost. Poznámka: Znaménko před hodnotou regresního a korelačního koeficientu se vždy shoduje. 27 Absolutní hodnota korelačního koeficientu |r| udává těsnost hodnocené závislosti. Čím je absolutní hodnota koeficientu korelace blíže k 1, tím je závislost silnější. Závislost lze hodnotit podle 3-5 bodové stupnice: r = 0 – závislost neexistuje |r| ∈ (0; 0,3) - slabá závislost |r| ∈ <0,3; 0,6) - střední závislost |r| ∈ <0,6; 0,8) – silná (těsná závislost) |r| ∈ <0,8; 1) – velmi silná (velmi těsná závislost) |r| = 1 – perfektní závislost Pracovní tvar vzorce pro výpočet korelačního koeficientu: xi ; yi - proměnné n - počet uspořádaných dvojic [xi;yi] [ ] [ ]2 i 2 i 2 i 2 i iiii )y(yn.)x(xn yxyxn r ∑−∑∑−∑ ∑∑−∑ = 28 Pro výpočet korelačního koeficientu lze využít i následující vzorec: Výsledky výpočtu hodnoty r, za použití obou výše uvedených rovnocenných vzorců, jsou vždy shodné. Koeficient determinace - r2 Je druhou mocninou hodnoty koeficientu korelace. Koeficient determinace vyjádřený v procentech (r2.100%) udává, z kolika procent jsou změny hodnot závisle proměnné y v regresní rovnici vysvětlovány hodnotami nezávisle proměnné x. Index determinace I2 hodnotí kvalitu regresního modelu. Udává kolik procent rozptylu závisle (vysvětlované) proměnné y je vysvětleno modelem a kolik zůstalo nevysvětleno. Nabývá hodnot od nuly do jedné (teoreticky i včetně těchto krajních mezí), přičemž hodnoty blízké nule značí špatnou kvalitu regresního modelu; hodnoty blízké jedné značí dobrou kvalitu regresního modelu. Index determinace se udává se většinou v procentech. Shrnutí kapitoly V této kapitole byli studenti detailně seznámeni se základními statistickými metodami zkoumání závislostí a přípravou dat pro tyto statistické analýzy jako je například třídění dat do dvourozměrných tabulek. Byly nastíněny základní matematicko statistické operace v oblasti kontingence, asociace a zejména lineární regrese a korelace. Kapitola rovněž ukazuje práci s náročnějším početními postupy. Pojmy k zapamatování Dvojrozměrné statistické tabulky, kontingence, asociace, korelační pole, regrese, rovnice přímky, lineární regrese, metoda nejmenších čtverců, korelace, koeficient korelace, hodnocení těsnosti závislosti, koeficient determinace, index determinace. yrozptyl.xrozptyl xykovariance r = y.x n yΣx xykovariancekde, ii −= 29 Úkoly k zopakování a procvičení Příklad 2.1. Uveďte příklady koeficientů, které se ve statistické praxi užívají pro hodnocení těsnosti závislosti. Řešení: Cramerův kontingenční koeficient, Pearsonův kontingenční koeficient, koeficient asociace, korelační koeficient Výpočet Cramerova kontingenčního koeficientu je založen na hodnotě: a) aritmetického průměru b) χ2 (chí-kvadrát) c) směrodatné odchylky Řešení: b 30 Příklad 2.2. Byla sledována závislost spokojenosti hostů se službami bazénového baru hotelu na jejich věku. Na základě výpočtu Pearsonova a Cramerova kontingenčního koeficientu určete těsnost závislosti. Zdrojová data jsou uvedena v následující tabulce: Řešení: Nejdříve je nutné vypočítat okrajové četnosti. Dále je nutné vypočítat teoreticky očekávané četnosti e, kdy spokojenost hosta nebude záviset na jejich věku (četnosti odpovědí za předpokladu nezávislosti obou proměnných). e = (Součet četností řádku.součet četností sloupce) / rozsah výběru n s - skutečně zjištěné četnosti Spokojenost Věk Ano Ne Celkem ΣΣΣΣ Do 45 let 25 7 Nad 45 let 12 21 Celkem ΣΣΣΣ Spokojenost Věk Ano Ne Celkem ΣΣΣΣ Do 45 let 25 7 Nad 45 let 12 21 Celkem ΣΣΣΣ Spokojenost Věk Ano Ne Celkem ΣΣΣΣ Do 45 let 25 7 32 Nad 45 let 12 21 33 Celkem ΣΣΣΣ 37 28 65 Spokojenost Věk Ano Ne Celkem ΣΣΣΣ Do 45 let 25 7 32 Nad 45 let 12 21 33 Celkem ΣΣΣΣ 37 28 65 31 e - teoretické sdružené četnosti – spokojenost hosta nezávisí na jeho věku e= (Součet četností řádku.součet četností sloupce) / rozsah výběru n Spokojenost Věk Ano - s (e) Ne - s (e) Celkem ΣΣΣΣ Do 45 let 25 (18,215) 7 (13,785) 32 Nad 45 let 12 (18,785) 21 (14,215) 33 Celkem ΣΣΣΣ 37 28 65 Spokojenost Věk Ano - s (e) Ne - s (e) Celkem ΣΣΣΣ Do 45 let 25 (18,215) 7 (13,785) 32 Nad 45 let 12 (18,785) 21 (14,215) 33 Celkem ΣΣΣΣ 37 28 65 n=65 χχχχ2 = 2,527+3,340+2,451+3,239 = 11,557 32 Vypočítané hodnoty obou kontingenčních koeficientů svědčí o střední závislosti studovaných proměnných. Spokojenost hostů s bazénovým barem středně závisí na jejich věku. Příklad 2.3.: Byla studována závislost mezi spokojeností hostů se stravováním a s čistotou v hotelu. Celkem bylo osloveno 20 hostů. Vypočítejte hodnotu koeficientu asociace a okomentujte těsnost závislosti Data (odpovědi) jsou shrnuty v kontingenční tabulce: Řešení: 0,389 6511,557 11,557 P = + = 0,422 65.1 11,557 V == Čistota Stravování Ano Ne Celkem Ano 11 1 12 Ne 5 3 8 Celkem 16 4 20 Čistota Stravování Ano Ne Celkem Ano 11 1 12 Ne 5 3 8 Celkem 16 4 20 0,36 78,38 28 6144 28 12.16.8.4 12.1620.11 RA === − = 33 Závislost mezi spokojeností hostů se stravováním a čistotou je slabá – nepříliš těsná asociační závislost. Příklad 2.4.: Byla studována závislost mezi měsíčním příjmem domácnosti a měsíčními výdaji za kosmetické výrobky. Předpokládáme, že regresní funkcí je přímka. Získaná data jsou uvedena v následující tabulce: Měsíční příjem domácnosti v tisících Kč 15 20 23 26 30 35 40 45 Měsíční výdaje za kosmetiku v tisících Kč 0,6 1,2 2,3 2,4 3,0 3,0 3,6 3,7 Měsíční příjem domácnosti v tisících Kč 15 20 23 26 30 35 40 45 Měsíční výdaje za kosmetiku v tisících Kč 0,6 1,2 2,3 2,4 3,0 3,0 3,6 3,7 34 Určete závisle a nezávisle proměnnou Zakreslete korelační pole Vypočítejte parametry rovnice funkce Sestavte rovnici přímky Vypočítejte odhad, kolik korun měsíčně vydá domácnost s příjmem 29000,-Kč Vypočítejte hodnotu korelačního koeficientu Určete těsnost závislosti Určete typ úměry závislosti Vypočítejte a okomentujte koeficient determinace Řešení: Nezávisle proměnná x – měsíční příjem v domácnosti v Kč Závisle proměnná y – měsíční výdaje za kosmetiku v Kč Domácnost s příjmem 29000,-Kč v průměru vydá 2450,-Kč za kosmetiku. Hodnota korelačního koeficientu r = 0,944 svědčí o velmi silné závislosti průměrných výdajů za kosmetiku na průměrných příjmech domácnost. Mezi proměnnými platí přímá úměra. Změny hodnot závisle proměnné – průměrné měsíční výdaje jsou z 89,19% vysvětlovány hodnotami nezávisle proměnné – průměrné měsíční příjem. y = 0,1015x - 493,75 R2 = 0,8919 0 500 1000 1500 2000 2500 3000 3500 4000 4500 0 10000 20000 30000 40000 50000 Měsíční příjem domácnosti Měsíčnívýdajezakosmetiku 35 Hodnocení Každá správná odpověď nebo výsledek výpočtu je hodnoceno jedním bodem. Sebehodnocením je žádoucí dosáhnout alespoň 70% úspěšnost správných odpovědí, výsledků výpočtů. Jestliže jste nedosáhli požadované úspěšnosti, pokuste se zlepšit svůj studijní výsledek pozornějším studiem kapitoly, popřípadě se spojit s tutorem předmětu. Další studijní zdroje: http://iastat.vse.cz/ Korespondenční úkol Následující korespondenční úkoly přinese student na následující soustředění (soustředění číslo 3). Korespondenční úkoly jsou rovněž umístěny v odpovědníku IS VŠH. S hodnocením se student seznámí během tutoriálu. Je požadována 70% úspěšnost v řešených úkolech. 36 Příklad: Byla sledována závislost spokojenosti hostů hotelu na jejich vzdělání. Na základě výpočtu Cramerova a Pearsonova kontingenčního koeficientu určete těsnost závislosti. Data jsou uvedena v následující tabulce. Spokojenost Vzdělání Ano Ne Celkem Středoškolské 10 5 Vysokoškolské 15 8 Celkem Příklad Byla studována závislost velikosti tržby v milionech Kč na počtu hotelových hostů. Data jsou uvedena v následující tabulce: Tržba 5,2 5,8 6,4 6,5 6,8 7,0 7,3 7,5 7,8 8,1 Počet hostů 250 300 330 336 350 359 369 375 383 390 a) Určete závisle a nezávisle proměnnou b) Zakreslete korelační pole c) Vypočítejte parametry rovnice funkce d) Sestavte rovnici přímky e) Vypočítejte, jaká je tržba, jestliže byl počet hotelových hostů 370 f) Vypočítejte hodnotu korelačního koeficientu g) Určete těsnost závislosti h) Určete typ úměry závislosti i) Vypočítejte a okomentujte koeficient determinace 37 3. Modul Modul tvoří tři tématické okruhy. Každý je probírán samostatně, jako kapitola v učebním materiálu. Tématické okruhy: 3.1. Absolutní přírůstek a index 3.2 Indexní řady 3.3. Souhrnné indexy Studijní cíle V závěrečné kapitole se studenti seznámí se zásadní terminologií a statistickými výpočty z problematiky absolutních přírůstků a indexů, kde nedílnou součástí kapitoly je rovněž klasifikace indexů. Pracovní tvary vzorců jsou, z důvodů snadnější orientaci studenta v problematice, detailně rozepsány. Kapitola řeší rovněž problematiku indexních řad a postupových možností práce s pouze bazickými nebo pouze řetězovými indexy. Ze složitějších metod jsou uvedeny zásady v klasifikaci a výpočtových postupech v oblasti souhrnných indexů s důrazem na agregátní cenové indexy. Klíčová slova: absolutní přírůstek, index, klasifikace indexů, indexy množství, indexy úrovně, extenzitní ukazatel, intenzitní ukazatel, individuální indexy, indexní řady, souhrnné indexy ( Laspeyresův, Paascheho, Fisherův souhrnný index ), vážený průměr, cenový index 3.1. Absolutní přírůstek a index Starší období = základní období (základ pro porovnávání) Porovnávané období = běžné období Absolutní přírůstek ∆∆∆∆ = rozdíl mezi dvěma časovými ukazateli – o kolik jednotek se změní (+zvětší, -zmenší) hodnota v běžném období oproti základnímu období Index I = podíl mezi dvěma ukazateli – kolik procent hodnoty základního období činí hodnota běžného období Indexy a absolutní přírůstky se vzájemně doplňují a měly by být uváděny společně. 38 Klasifikace indexů Indexy množství – porovnávají hodnoty extenzitních ukazatelů - q, tj. ukazatelů vyjadřujících množství, velikost, objem ( počet hostů, tržba, prodané množství zboží určitého druhu) Indexy úrovně – porovnávají hodnoty intenzitních ukazatelů - p, tj ukazatelů vyjadřujících úroveň, hladinu, intenzitu (cena, tržba na pracovníka) Každý intenzitní ukazatel je poměrem ukazatelů extenzitních: Tržba na pracovníka = tržba / počet pracovníků Jmenovatel je extenzivní ukazatel - nositel intenzity Indexy lze rovněž rozdělit na: Indexy individuální Indexy souhrnné Individuální indexy – indexy stejnorodých ukazatelů a) dílčí hodnoty lze druhově a prostorově shrnout součtem – extenzitní ukazatele (počet hostů restaurací řetězce „Eurest“) b) dílčí ukazatele lze druhově a prostorově shrnout průměrem – intenzitní ukazatele (cena 0,5l piva v hotelech „Holiday Inn“) Souhrnné indexy – popisují změny množství či úrovně v celku, složeném z nestejnorodých částí (změna ceny mléčných výrobků v síti „Tesco“) Jednoduchý index množství: Symbolika: Základní období q0Běžné období q1 I (qi) = q1i/q0i Odpovídající absolutní přírůstek: ∆ (qi) = q1i- q0i Složený index množství:- je váženým průměrem jednoduchých indexů, váhou jsou dílčí hodnoty ze základního období q0iI (Σqi) = Σq1i/Σq0iOdpovídající absolutní přírůstek: ∆ (Σqi) = Σq1i-Σq0i - je součtem jednoduchých absolutních přírůstků 39 Individuální jednoduché indexy úrovně Každý intenzitní ukazatel je poměrem ukazatelů extenzitních: p = Q/q p - intenzitní ukazatel Q - extenzitní ukazatel q - extenzitní ukazatel nositel intenzity Q = pq Intenzitní ukazatel je stejnorodý jsou-li stejnorodé oba extenzitní ukazatele Q, q (jejich dílčí hodnoty lze sčítat). Dílčí hodnoty stejnorodého intenzitního ukazatele pi = Qi/qi lze shrnout poměrem součtů dílčích extenzitních ukazatelů ΣSQi/Sqi Qi=pi.qi ΣQi/Σqi =Σ piqi/Σqi= Základní období: Běžné období: Jednoduchý index úrovně a jemu odpovídající absolutní přírůstek I(pi) = p1i/p0i∆ (pi) = p1i - p0i Individuální složené indexy úrovně Složený index úrovně odráží změny dílčích hodnot ukazatele, ale i změny ve struktuře nositele intenzity – je indexem proměnlivého složení Složený index úrovně a jemu odpovídající absolutní přírůstek: p 0 0 0 q Q p ∑ ∑ = 1 1 1 q Q p ∑ ∑ = 40 Odpovídající absolutní přírůstek: 0i 0i0i 1i 1i1i 0 1 Σq qΣp Σq qΣp p p )pI( == 0i 0i0i 1i 1i1i 01 Σq qΣp Σq qΣp pp)p∆( −=−= 41 3.2. Indexní řady Indexní řady jsou tvořeny bazickými a řetězovými indexy.Bazické indexy ukazují změnu průměrné hodnoty proměnné x (například počet zaměstnanců) ve srovnání s rokem výchozím – srovnávací období. Řetězové indexy ukazují jak se změní hodnota proměnné x (například počet pracovníků pivovarů) ve srovnání s předcházejícím rokem. Pro období 200n – 200n+i, kde i = 1, 2…, platí pro hodnoty x: Bazické indexy: x200n/x200n; x200n+1/x200n; x200n+2/x200n…. Řetězové indexy: x200n+1/x200n; x200n+2/x200n+1; x200n+3/x200n+2… Z řetězových indexů lze vypočítat indexy bazické a naopak: Řetězové indexy jsou podílem dvou za sebou jdoucích bazických indexů, čitatelem je bazický index pro vyšší (mladší) ročník. Bazické indexy lze vypočítat postupným násobením řetězových indexů. 3.3. Souhrnné indexy Souhrnný index množství Souhrnný index množství - popisuje změny množství či úrovně v celku, složeném z nestejnorodých částí. Souhrnný index množství lze vypočítat jako: •Vážený aritmetický průměr individuálních indexů množství •Laspeyresův souhrnný index množství •Paascheho souhrnný index množství •Fisherův souhrnný index množství Souhrnný index množství vyjádřený jako vážený aritmetický průměr individuálních indexů množstvíIq = ΣI(qi)viI(qi) =q1i/q0iI(qi) – individuální index množství q1i – prodané množství v běžném období q0i – prodané množství v základním období vi – „váha“ jednotlivých druhů zboží zvolená tak, aby její součet byl roven jednéLaspeyresův souhrnný index množstvíIq,L = Σq1ip0i/Σq0ip0iq1i – prodané množství v běžném období q0i – prodané množství v základním období 42 p0i – cena v základním období Paascheho souhrnný index množstvíIq,P = Σq1ip1i/Σq0ip1iq1i – prodané množství v běžném období q0i – prodané množství v základním období p1i – cena v běžném období Fisherův souhrnný index množství Fisherův souhrnný index množství je geometrickým průměrem indexů Laspeyresova a Paascheho: Souhrnné indexy úrovně Nejčastěji užívané jsou souhrnné indexy cenové. Souhrnné indexy cenové jako vážené aritmetické průměry individuálních cenových indexů Ip = ΣΣΣΣI(pi)vi I(pi) – individuální cenové indexy vi - „váhy“, jejichž součet je roven jedné Index souhrnně charakterizuje změnu cen zboží prodávaného například obchodním řetězcem – váhou je podíl tržby za jednotlivé druhy zboží na tržbě z prodeje, zjištěné za určité období. Agregátní cenové indexy: Prodaná množství za určité období se ocení nejdříve cenami základního a poté cenami běžného období a výsledky se pak porovnávají Zvolí-li se prodaná množství ze základního období je indexem Laspeyresův souhrnný cenový index: Iq,L =Σp1iq0i/Σp0iq0iZvolí-li se prodaná množství z běžného období je indexem Paascheho cenový index: Iq,P =Σp1iq1i/Σp0iq1iKombinací je Fisherův souhrnný cenový index Pq,Lq,Fq, .III = 43 Shrnutí kapitoly Poslední kapitola seznámila studenty se zásadami v klasifikaci a výpočtech absolutních přírůstků a indexů využívaných v ekonomické praxi. Detailní výklady vzorců umožňují studentovi realizovat výpočty ze zdrojových dat získaných statistickým šetřením a aplikovat dané výstupy v navazujících studijních úkolech. Student je podrobně seznámen s problematikou a praktickým využitím indexních řad. V závěru kapitoly je řešena náročná problematika souhrnných indexů s uvedením zásadních postupových výpočtů. Pozornost je věnována rovněž agregátním cenovým indexům. Pojmy k zapamatování Absolutní přírůstek, index, základní a běžné období, extenzitní a intenzitní ukazatel, nositel intenzity, individuální a souhrnný index, indexní řady, bazický a řetězový index, vážený aritmetický průměr, Laspeyresův, Paascheho, Fisherův souhrnný index, cenový index Úkoly k zopakování a procvičení Příklad: 3.1. Indexy množství porovnávají hodnoty: a) extenzitních ukazatelů b) intenzitních ukazatelů c) absolutních přírůstků Řešení: a 44 Příklad 3.2.: Byl studován počet hostů v pěti hotelech ve dvou po sobě jdoucích letech. Zjištěné hodnoty jsou uvedeny v tabulce: Vypočítejte:-jednoduché absolutní přírůstky a indexy -složený absolutní přírůstek a index Dokažte, že složený index je váženým aritmetickým průměrem jednoduchých indexůŘešení: Hotel Počet hostů v roce 200n Počet hostů v roce 200n+1 Absolutní přírůstky ∆∆∆∆ (qi) Indexy I (qi) Aida 721 895 Bílý Lev 452 521 Libuše 529 498 Platan 890 948 U Staré Paní 356 326 Všechny hotely Hotel Počet hostů v roce 200n Počet hostů v roce 200n+1 Absolutní přírůstky ∆∆∆∆ (qi) Indexy I (qi) Aida 721 895 Bílý Lev 452 521 Libuše 529 498 Platan 890 948 U Staré Paní 356 326 Všechny hotely Hotel Počet hostů v roce 200n q0i Počet hostů v roce 200n+1 q1i Absolutní přírůstky ∆∆∆∆ qi) Indexy I (qi) Aida 721 895 174 1,24 Bílý Lev 452 521 69 1,15 Libuše 529 498 -31 0,94 Platan 890 948 58 1,07 U Staré Paní 356 326 -30 0,92 Všechny hotely 2948 3188 240 1,08 Hotel Počet hostů v roce 200n q0i Počet hostů v roce 200n+1 q1i Absolutní přírůstky ∆∆∆∆ qi) Indexy I (qi) Aida 721 895 174 1,24 Bílý Lev 452 521 69 1,15 Libuše 529 498 -31 0,94 Platan 890 948 58 1,07 U Staré Paní 356 326 -30 0,92 Všechny hotely 2948 3188 240 1,08 45 Složený absolutní přírůstek = 240 Složený absolutní index = 1,08 Důkaz: Složený absolutní přírůstek je součtem jednoduchých absolutních přírůstků: 240 = 3188 - 2948 = 174+69-31+58-30. Příklad 3.3. Byly zjištěny průměrné počty zaměstnanců pivovarů v České republice v posledních pěti letech. Z následujících hodnot uvedených v tabulce sestavte bazické a řetězové indexy. Pro bazické indexy zvolte základ ročník 200n. Vysvětlete význam obou typů indexů. Řešení: Bazické indexy ukazují změnu průměrného počtu zaměstnanců ve srovnání s rokem 200n. Řetězové indexy ukazují jak se změnil počet pracovníků pivovarů ve srovnání s předcházejícím rokem. Ročník Počet zaměstnanců -x Indexy bazické Indexy řetězové 200n 6932 200n+1 6280 200n+2 6364 200n+3 7205 200n+4 7186 46 Příklad 3.4: V odborné literatuře byly publikovány bazické indexy pro období 200n-200n+4 pro počty pokojských v penzionech: 1,00; 1,15; 1,07; 0,96; 1,11. Vypočítejte hodnoty řetězových indexů.Řešení: Řetězové indexy jsou podílem dvou za sebou jdoucích bazických indexů, čitatelem je bazický index pro vyšší ročník. Hledané řetězové indexy: 200n: -; 200n+1: 1,15/1 = 1,15; 200n+2:1,07/1,15 = 0,93; 200n+3:0,96/1,07 = 0,90; 200n+4:1,11/0,96 = 1,16 Hodnocení Každá správná odpověď nebo výsledek výpočtu je hodnoceno jedním bodem. Sebehodnocením je žádoucí dosáhnout alespoň 70% úspěšnost správných odpovědí, výsledků výpočtů. Jestliže jste nedosáhli požadované úspěšnosti, pokuste se zlepšit svůj studijní výsledek pozornějším studiem kapitoly, popřípadě se spojit s tutorem předmětu. Další studijní zdroje: Hindls, R., Hronová, S., Seger, J.: Statistika pro ekonomy. Professional Publishing, Praha 2002, druhé vydání, ISBN 80-86419-30-4 Korespondenční úkol Následující korespondenční úkoly odešle student do odevzdávárny. Korespondenční úkoly jsou rovněž umístěny v odpovědníku IS VŠH. S hodnocením se student seznámí na základě elektronické komunikace případně konzultace. Je požadována 70% úspěšnost v řešených úkolech. Příklad: Průměrná délka pobytu hosta v penzionu ve dnech (p) je poměrem celkového počtu pobytových dnů (Q) a počtu hostů (q). Zjištěné hodnoty za dva roky jdoucí po sobě jsou uvedeny v následující tabulce: 47 Vypočítejte: a) jednoduché absolutní přírůstky a indexy b) složený absolutní přírůstek a indexPříklad Ve sborníku byly publikovány řetězové indexy pro období 200n-200n+4 pro počet kuchařů v závodních podnikových jídelnách: -; 0,98; 1,05; 1,19; 0,91. Vypočítejte hodnoty bazických indexů. Penzion Pobytové dny Počet hostů Délka pobytu hosta Přírůstek délky pobytu Index délky pobytu Q0i Q1i q0i q1i p0i p1i ∆(pi) I(pi) Babka 1950 2390 490 580 Merlin 2980 2650 489 434 Oba penziony Penzion Pobytové dny Počet hostů Délka pobytu hosta Přírůstek délky pobytu Index délky pobytu Q0i Q1i q0i q1i p0i p1i ∆(pi) I(pi) Babka 1950 2390 490 580 Merlin 2980 2650 489 434 Oba penziony 48 B) ČÁST MATEMATIKA Obsahová náplň předmětu MT003 část matematika Obsahová náplň matematické části předmětu: 1. Vybrané kapitoly z elementární matematiky – výroky, množiny, algebra reálných čísel, rovnice, nerovnice, reálné funkce – základní vlastnosti, funkce elementární. 2. Zavedení pojmu derivace a integrálu, jejich aplikace. 3. Elementy pravděpodobnosti. Cíle výuky matematické části: Úkolem výuky matematiky na vysokých školách ekonomického a technického zaměření je jednak rozvíjet logické a analytické myšlení studenta a dále poukázat na možnosti aplikace matematiky při kvantitativním popisu zákonitostí v různých ekonomických disciplínách a statistice v rozsahu, který se vyučuje na VŠH. Cílem výuky matematické části předmětu jsou následující oblasti: a) Stanovit rozsah, zopakovat a případné rozšířit tu část elementární matematiky, jejíž znalost je nezbytná ve výuce ostatních předmětů ekonomického zaměření a statistiky. (S touto problematikou se student již setkal prakticky na všech typech středních škol. Jedná se tedy z velké části o opakování látky ze střední školy. V dostatečném rozsahu je požadované učivo obsaženo v kap. 1, 2, 3 a 4 publ. (Malec, 2007), dále jen skripta. b) Seznámit studenta s pojmem derivace a integrál a jejich aplikacemi. Zde je situace složitější. Většina studentů VŠH se s těmito pojmy na střední škole nesetkala, jedná se o obtížnější látku vyžadující hlubší a časově náročné studium. Přihlédneme-li k zaměření studia na VŠH a hodinovému rozsahu předmětu, je nutné volit intuitivní přístup k výkladu látky založený na názorném probírání látky a jednoduchých možnostech aplikace. Učivo je obsaženo v kap. 5 a 6 skript. c) Elementy pravděpodobnosti. Probírané učivo je matematickým úvodem ke studiu statistických metod, probíraných ve druhé části předmětu, ale i předmětu Kvantitativní metody ve studiu magisterském. K výkladu popisné statistiky postačí partie z elementární matematiky. Pokud se ale mají vyložit alespoň základní metody matematické statistiky, např. popsat vlastnosti výběrových charakteristik, testovat hypotézy, studovat statistické závislosti náhodných veličin, pak se nabízí dvě možnosti: Uvedené metody jen formálně popsat (bez odvození a užití matematiky) – pak ale může 49 nastat situace, že při formulaci metody je užito např. pojmu „kvantily normovaného normálního rozdělení“, kde význam daného sousloví není studentovi znám. Druhou možností je nejzákladnější pojmy vyložit. Proto je ve skriptech zařazena kap. 7, kde je diskutována pravděpodobnost náhodného jevu, její vlastnosti a informace o tom, co je to náhodná veličina a distribuční funkce. Pozornost je věnována normálnímu rozdělení, které má rozsáhlá uplatnění v aplikačních oblastech. V kombinovaném studiu je kladen zásadní důraz na samostatné studium (viz metodický list předmětu MT003). Jednotlivá soustředění odpovídají uvedeným odstavcům obsahové náplně předmětu. Výklad látky ve skriptech je názorný, důraz je kladen na základní pojmy a jejich aplikaci. Publikace obsahuje dostatek řešených příkladů. Při jistém úsilí zvládne probíraná témata s úspěchem velká část studentů. Způsob ověření znalostí studentů je následující: 1. Po skončení prvního soustředění proběhne vstupní test z matematiky v rozsahu výuky probíraného na většině středních škol (25 min.). 2. Na konci druhého soustředění se píše průběžný test (30 min.). Bude obsahovat jednoduché příklady na aplikaci derivace a integrálu. 3. Po ukončení třetího soustředění se lze přihlásit na závěrečný test (45 min.). Termínů je k dispozici množství, není nutné skládat zkoušku na prvních termínech. Lépe je zažít probíranou látku a ponechat si dostatek času na procvičování. Ukázka testů je uvedena v oddíle zabývajícím se studijními oporami. Složitější vzorce i znění pouček budou mít studenti na všech uvedených testech k dispozici. Výsledky testů budou vždy v přiměřeném čase k dispozici na informačním systému VŠH. Nakonec proběhne ústní zkouška (cca 15 min.), kde předmětem diskuse bude závěrečné posouzení analytického uvažování studenta. Výsledná klasifikace je stanovena na základě hodnocení testů a ústní části zkoušky. Dotazy a diskuse k vstupnímu a průběžnému testu se řeší na konzultacích, resp. pomocí informačního systému VŠH. Konzultace se konají dvakrát týdně, doba konání je vždy k dispozici na informačním systému školy. Důraz je kladen na samostatné studium. Uvedená skripta obsahují probíranou látku a jsou svým obsahem dostatečná. K hlubšímu studiu je uvedena doporučená literatura. Jedná se o učebnice matematiky a statistiky dlouhodobě užívané na VŠE Praha. 50 Průvodce studiem matematické části předmětu MT003. Níže uvedeme přehled základních pojmů, jejich vlastnosti a použití té části základů matematiky, která je obsahem předmětu a kterou je třeba zvládnout pro úspěšné vykonání dílčí zkoušky. Probíraná látka patří k základním informacím, které by měl student vysoké školy zvládat. Téma je v podstatě totožné s obsahem skript. Ad 1. Vybrané kapitoly z elementární matematiky – viz skripta, kap. 1, 2,3 a 4 Výrok, výrok složený. Jedná se o elementy matematické logiky. Je nutné zcela rozumět logickým operacím ⋁, mezi dvěma výroky A a B. Např. formulaci: pro libovolná reálná čísla a a b platí a.b = 0 ⇔ a = 0 ⋁ b = 0; je-li b ≠ 0, pak = 0 ⇔ a = 0. Množina, operace s množinami. Označení např. a ϵ M. Algebra reálných čísel. Samozřejmostí je počítání se zlomky, kde je nutné mít na paměti, že = 0, neexistuje. Dále 109 je miliarda, 10-9 = je číslo blízké nule, a0 = 1. Pro a ≠ 0 platí = , n ϵ N. Znát definice n-té odmocniny a vzorce pro počítání s mocninami a odmocninami, tj. = , je-li a ≥ 0, pak rovnice x2 = a má řešení x = ± . Statistická část předpokládá znalost počítání se sumačním symbolem ∑: a1 + a2 + … + an = . Zřejmě platí = + . Příklad. Jsou dány dva soubory dat Jejich kovariance je dána vzorcem kde a jsou jejich aritmetické průměry. Úpravou dostáváme tj. výpočtový vzorec pro kovarianci. Reálné funkce. Definice funkce, její definiční obor – zápis Konstrukce bodu v souřadném systému. Graf funkce, obor hodnot Každá přímka rovnoběžná s osou y, která prochází na ose x číslem protíná graf funkce právě v jednom bodě. Elementární funkce. Jedná se o základní funkce, které se nejčastěji vyskytují v různých aplikacích, kde lze pozorovat nějakou funkční závislost mezi sledovanými veličinami. Elementární funkce jsou dány jednoduchým analytickým tvarem, tj. vzorcem, jejich hodnoty jsou základní výbavou matematických programů, lze je nalézt na kalkulátoru. Jedná se o funkce lineární, polynomické (příp. kvadratické), lomené, mocninné, exponenciální 51 a logaritmické. Jejich grafy jsou ve skriptech uvedeny na str. 26 až 28. a těchto funkcí je zřejmý. K názvu elementární funkce musí student znát její vzorec a graf, který by měl umět (přibližně, ale výstižně) v souřadném systému načrtnout od ruky. Potíže činí zejména funkce logaritmická, o které se více zmíníme u hesla inverzní funkce. Tedy např. vzorec je předpis pro funkci exponenciální. Její graf pro a > 1 viz str. 27. Nakreslete si graf této funkce pro 0 < a < 1. Vzorec představuje funkci mocninnou. Např. pro dostáváme , Pro máme Grafy těchto funkcí viz skripta, str. 26. Operace s funkcemi. Jsou-li dány dvě libovolné funkce a lze mezi nimi definovat algebraické operace , Další operací je skládání funkcí: Vždy v konkrétním případě je nutné stanovit definiční obor výsledné funkce. Získáme jej řešením příslušných nerovností – viz skripta, kap. 4. Např. nalézt složené funkce vede na řešení nerovnosti Nalezněte řešení této nerovnosti. Jsou-li zadané funkce elementární (základní – viz výše), patří i funkce získané uvedenými operacemi ke třídě funkcí elementárních, které jsou dány analytickým výrazem – vzorcem. Např. funkce je opět funkce elementární. Sudé a liché funkce. Definice těchto pojmů (vyjadřujících symetrii) je nutné spojit s grafickým vyjádřením. Rozumíme zápisu: je sudá (na příslušném definičním oboru) jsou-li obě sudé nebo liché. Podobné závěry lze učinit i v dalších operacích. Např. funkce je lichá na Monotonní funkce. Tento pojem zahrnuje čtyři podmnožiny funkcí monotonních, a to: rostoucí, neklesající, klesající a nerostoucí. Tato vlastnost lze psát užitím nerovností. Funkce je rostoucí na funkce je na funkcí klesající. Načrtněte si jejich grafy. Periodické funkce. Funkce je periodická, pokud existuje číslo (volíme to nejmenší) takové, že platí Funkce je lichá a má periodu , je lichou funkcí a má periodu 52 Prosté funkce. Funkce je na množině prostá, pokud pro platí Funkce je na prostá, Inverzní funkce. Každá prostá funkce definuje novou funkci, která se nazývá inverzní a označuje se symbolem Platí pro ni předpis Graficky viz skripta, obr. 3.11, str. 36. Funkce je prostá, k ní inverzní funkce se označuje „log“, tedy Dosazením získáváme což lze popsat slovy: Dekadický logaritmus kladného čísla x při základu 10 je takové číslo, kterým musíme umocnit základ 10, abychom dostali původní číslo x, tedy např. Pokud sestrojíme grafy původní funkce a inverzní funkce do jednoho souřadného systému (nezávisle proměnnou vynášíme v obou případech na osu x), pak zjišťujeme, že oba grafy jsou symetrické podle přímky Analogicky platí kde číslo e značí Eulerovu konstantu. Bezpodmínečně se vyžaduje znalost vzorců, popisujících vlastnosti logaritmů, viz skripta, str. 29. Logaritmováním výrazu (přirozeným logaritmem) získáváme důležitý vzorec Ten říká, že dekadický logaritmus je násobkem přirozeného – viz skripta, str. 27. Příklad. Veličina závisí na čase t exponenciálně: kde λ > 0 je daná kladná konstanta, Spočítejte dobu (označme ji T), při které bude hodnota veličiny dvojnásobná oproti hodnotě v čase Platí tedy odkud Načrtněte graf této funkce. Posloupnost. Posloupnost aritmetická a geometrická (viz dodatek 1 tohoto textu), geometrická řada. Rovnice. Řešení rovnic, úpravy rovnic. Rovnice o jedné neznámé má tvar kde a jsou dané funkce. Uvedenou rovnici lze anulováním převést na tvar Uvědomte si geometrický význam řešení rovnice Její kořeny se nazývají nulové body funkce a jsou to body, ve kterých graf této funkce protíná (resp. se dotýká) osu x. 53 Řešit rovnici geometricky znamená nalézt x-ové souřadnice průsečíků (resp. dotyky) grafů funkcí a Klasickým příkladem je úloha z ekonomie, kdy jde o nalezení rovnováhy mezi nabídkou a poptávkou. Student bude bez problémů umět řešit rovnice lineární, kvadratické (v reálném oboru) a jednodušší rovnice iracionální exponenciální a logaritmické (příp. goniometrické). Problémy nebude činit řešení soustavy dvou rovnic lineárních, lineární a kvadratické. Poznamenejme, že řešení všech zde uvedených typů rovnic lze nalézt v kap. 4 skript. Řešení těchto rovnic lze vždy získat analyticky (vzorcem), použitím úprav rovnice a z vlastností elementárních funkcí. Poznamenejme, že ne všechny rovnice lze vyřešit uvedeným postupem. Tak např. rovnici (což je kubická rovnice) nebo rovnice (rovnice transcendentní) lze vyřešit pouze přibližně užitím numerických metod. (O tom více v magisterském studiu.) Úloha. Nalezněte průsečíky grafu funkce s osou x. Úloha. Nalezněte souřadnice průsečíků grafů funkcí a Jedná se tedy o řešení jedné kvadratické a jedné lineární rovnice. Ukázka vstupního testu: 1. Nakreslete grafy funkcí a do jednoho souřadného systému. (Volte Zjistěte souřadnice jejich průsečíků. 2. Nakreslete graf funkce (Volte Zjistěte, pro která x nabude funkce hodnoty Ad 2. Zavedení pojmu derivace a integrálu. Aplikace. Derivace funkce. Derivace funkce lze přesně definovat pouze užitím pojmu „limity“ funkce. Jedná se o základní pojem celé oblasti matematiky – matematické analýzy a nepatří k pojmům snadným. Proto je derivace ve skriptech zavedena intuitivně při použití geometrického názoru. Důležitým a motivujícím příkladem použití pojmu derivace je zavedení okamžité rychlosti hmotného bodu (I. Newton, 1643 – 1727, anglický fyzik, matematik a astronom), pohybujícího se nerovnoměrně po přímce. Nechť se tento bod nachází v čase t v jistém bodě přímky. Během přírůstku času vykoná dráhu délky Zlomek vyjadřuje jeho průměrnou rychlost během času na dráze Tento zlomek závisí na přírůstku času 54 není obecně konstantou a nevystihuje tedy veličinu, která by vyjadřovala okamžitou rychlost bodu v čase t. Tu poskytuje „mezní“ hodnota zlomku Je to hodnota (závislá pouze na t), ke které se tento zlomek blíží, pokud přírůstek se neomezeně (stále více) blíží k nule. Píšeme Podle označení, které zavedeme níže, lze psát což říká, že okamžitá rychlost je derivací dráhy podle času. Buď tedy dána funkce Derivací funkce v bodě x nazýváme hodnotu, ke které se „neomezeně“ blíží (pokud existuje) zlomek pokud (pro zlomek nemá smysl, ale toto omezení nemá na výsledek vliv). Výraz je podíl přírůstku funkce (který odpovídá přírůstku h nezávisle proměnné x) a přírůstku h. Derivace funkce se obvykle značí (x). V některých příkladech výpočet derivace nečiní velký problém. Např. pro funkci se zabýváme výrazem . Lze snadno usoudit, že pokud pak (pro libovolné x) i Tedy Derivace funkce je pravidlo, které dané funkci přiřadí novou funkci – její derivaci . V tabulce II na str. 62 skript naleznete pravidla, jak se derivují některé základní elementární funkce. Na str. 63 skript jsou poučky, jak derivovat algebraické operace libovolných dvou funkcí. Tak např. funkce je součinem dvou funkcí a Použijeme tedy pravidlo pro derivaci součinu V našem případě Ve všech testech budou zadány pouze lehčí příklady na derivaci a její aplikaci. Geometrický význam derivace. Platí tedy derivace funkce v bodě x je rovna směrnici tečny sestrojené v bodě ke grafu funkce Odtud lze usoudit, že funkce nemá derivaci v bodech, ve kterých nelze sestrojit tečnu (v těch bodech má graf funkce zlom, není hladký). Aplikace derivace. Funkce monotonní. Platí např. Věta 1: Je-li derivace kladná ve všech bodech intervalu I, pak je na tomto intervalu rostoucí. Analogicky další alternativy. Jde o velmi užitečnou poučku. Ve složitějších příkladech není jiná možnost, než pomocí derivace rozhodnout o monotonnosti funkce. 55 Např. funkce má derivaci Protože platí pro je naše funkce na tomto intervalu klesající. Důležitou aplikaci má Věta 2: Má-li funkce v bodě x lokální extrém, pak nutně v tomto bodě je Tedy kořeny rovnice jsou body „podezřelé“ z extrému. Např. funkce má derivaci pro nulovou, ale extrém v tomto bodě nevykazuje. Ovšem pokud funkce v bodě x mění znaménko a platí pak zde extrém nastává. Stačí užít Větu 1. Rozmyslete obě situace a rozhodněte, zdali jde o lokální maximum nebo minimum. Funkce má derivaci kladnou na ápornou na tedy v bodě e má ostré lokální maximum, které je „globálním“ maximem. Neurčitý integrál. Jedná se o operaci opačnou k derivaci: Je dána funkce na intervalu I. Hledáme funkci pro kterou Funkce F se nazývá primitivní funkcí k funkci f na intervalu I, též neurčitým integrálem. Funkce F nemusí existovat (existuje, pokud f je spojitá). Metod výpočtu je více, my se omezíme na několik příkladů integrace elementárních funkcí daných tab. III str. 67 a použijeme poučky, str. 66 skript. O správnosti výpočtu integrálu se tedy lze přesvědčit derivací. Integrace je obtížnější operace než derivace. Integrál z funkce který existuje na R, se nedá vyjádřit vzorcem pomocí elementárních funkcí. Určitý integrál. Určitý integrál budeme definovat použitím Newtonovy formule. Ta dává elegantní metodu výpočtu hodnoty určitého integrálu, nemá však geometrickou názornost. Ta je formulována poučkou uvedenou níže. Určitý integrál se označuje symbolem kde a je dolní, b je horní mez integrálu ∫ je symbol integrace, význam symbolu dx nespecifikujeme. Newtonova formule: kde funkce F je primitivní k f na tedy Geometrický význam určitého integrálu. Pokud je funkce f na intervalu nezáporná, pak číslo udává velikost plochy obrazce, který je znázorněn na obr. 6.1 na str. 69 skript. Nevlastní integrál. Jeho zavedení je nutné k definici distribuční funkce v pravděpodobnosti. Vystačíme s případem, kdy alespoň jedna mez integrálu je nevlastní, tj. 56 rovna Pro jeho výpočet platí opět Newtonova formule s tou korekcí, že pokud je např. horní mez pak hodnotu chápeme ve smyslu mezní hodnoty (limity), tj. čísla, ke kterému se blíží pokud číslo Příklad. Spočtěte nevlastní integrál (načrtněte si obrázek): protože pokud Při testech budou vždy k dispozici vzorce pro výpočet derivací a integrálů. Hodnoty určitých integrálů se v praxi počítají numericky na počítačích, zejména neníli k dispozici primitivní funkce. Ukázka průběžného testu: 1. Nakreslete graf funkce (Volte např. Nalezněte její lokální extrémy. 2. Vypočtěte určitý integrál Načrtněte obrazec, jehož velikost plochy je dána tímto integrálem. Ad. 3 Elementy pravděpodobnosti. Existuje více způsobů, jak definovat pravděpodobnost náhodného jevu. Zobecněním těchto přístupů lze říci, že pravděpodobnost je funkce definovaná na množině náhodných jevů, která má vždy vlastnosti uvedené na str. 74 skript. Operace mezi náhodnými jevy, které jsou analogické jako operace mezi množinami, jsou uvedeny na str. 71 skript. Zejména pro každý náhodný jev A platí, Základním pojmem teorie pravděpodobnosti je pojem náhodné veličiny. V učebnicích je uvedený pojem popsán většinou jen přibližně, jeho přesná definice je náročná. Pokusíme se ji naznačit. Výchozí je pojem – prostor elementárních jevů. Označuje se a jeho prvky, tj. elementární jevy jsou všechny možné výsledky náhodného pokusu. Označují se ω, viz skripta str. 72. Náhodné veličiny se označují velkými písmeny X, Y. Jsou kvantitativním (číselným) popisem náhodných pokusů. Je to funkce, která každému elementárnímu jevu ω přiřadí číselnou hodnotu jeho realizace dále se požaduje, aby pro každé reálné číslo x podmnožina těch elementárních jevů, pro které byla náhodným jevem, kterému je přiřazena jeho pravděpodobnost Distribuční funkce. Distribuční funkcí náhodné veličiny X rozumíme funkci definovanou předpisem Je definována na R, je neklesající a platí Popisuje rozdělení pravděpodobnosti (viz níže): přiřazuje pravděpodobnost všem podmnožinám z , které se funkcí X zobrazí na interval. Náhodná veličina se spojitým rozdělením pravděpodobnosti. 57 Poznámka. Tato situace odpovídá případu, kdy prostor elementárních jevů je nespočetný (počet jeho prvků je roven počtu prvků množiny R). Spojité rozdělení má náhodná veličina X, pro kterou existuje nezáporná funkce f nazývaná hustotou pravděpodobnosti, pro kterou Zásadní význam má vzorec Rovnost zůstane v platnosti, i když interval vlevo je kteréhokoliv typu, např. platí Výše uvedená vlastnost plyne z vlastností integrálu. Kvantily náhodné veličiny se spojitým rozdělením pravděpodobnosti. 100α % kvantilem náhodné veličiny X s distribuční funkcí F je číslo které je dáno vztahem Často se volí Normální rozdělení. Náhodná veličina X má normální rozdělení s parametry µ a σ, pokud její hustota pravděpodobnosti je dána výrazem na str. 80 skript. Jeho označení Její graf je znám pod názvem Gaussova křivka. Příslušná distribuční funkce je dána integrálem, který není elementární, viz odstavec o neurčitém integrálu. Navíc je zde závislost na parametrech µ a σ. Lineární substituce převádí náhodnou veličinu X na náhodnou veličinu XN, která se nazývá normovaná a označuje se Má parametry Hodnoty její distribuční funkce lze nalézt v tabulkách, resp. jako součást statistických programů. Uvedeme nakonec důležitý vzorec výpočtu pravděpodobnosti náhodné veličiny Kvantily rozdělení se označují uα, jsou rovněž uvedeny v tabulkách. Uvědomte si, že platí vztah kde jsou kritické hodnoty, viz skripta str. 82. Jejich geometrický význam viz obr. 7.3 str. 82 skript. Ukázka závěrečného testu: 1. Načrtněte graf funkce Nalezněte průsečíky grafu s osou x a lokální extrémy funkce. 2. Vypočtěte integrál Nakreslete jeho geometrický význam. 3. Náhodná veličina X má rozdělení Spočtěte pravděpodobnost Příklady z oddílu 3 se budou týkat pouze normálního rozdělení. Tabulky distribuční funkce Φ budou dispozici. 58 Dodatky 1. Na jednoduchém středoškolském pojmu geometrické posloupnosti ukážeme na deduktivní postup v matematice, kdy z definice sledovaného pojmu se odvozují jeho další vlastnosti, příp. vzorce. Geometrická posloupnost. Jsou dána reálná čísla a1 a Číslo a1 se nazývá první člen geometrické posloupnosti, q je její kvocient. Geometrická posloupnost je definovaná rekurentní formulí Tedy odtud zřejmě což je vzorec pro n-tý člen této posloupnosti. Částečný součet geometrické posloupnosti (označme jej Sn) je definován výrazem: Odtud Odečtením získáme tedy což je vzorec pro částečný součet geometrické posloupnosti. Je-li pak pokud což znamená, že číslo je libovolné blízké číslu 0 pokud číslo n je dostatečně velké. Nekonečnou geometrickou řadou se nazývá výraz tento výraz má smysl pokud a jeho hodnota je dána číslem, ke kterému se blíží Sn, pokud Z výše uvedené úvahy snadno usoudíme, že platí, Příklad. Složené úročení. Označíme-li i roční úrokovou sazbu vyjádřenou desetinným číslem a Q0 počáteční hodnotu, pak hodnota za jeden rok činí: Analogicky po n letech dostáváme hodnotu Čísla Qn, n = 0, 1, … tvoří tedy geometrickou posloupnost s nultým členem Q0 a kvocientem 1 + i. Příklad. Vyjádřete racionální číslo zlomkem. . Další příklady viz skripta. Úloha. Stanovte chybu, tedy velikost čísla které se dopustíme, pokud číslo Sn nahradíme číslem S∞. 2. Příklad na aplikaci derivace funkce při popisu jedné zajímavé ekonomické zákonitosti z neoklasické teorie. Z mikroekonomie je známá funkce, která v dané firmě popisuje závislost celkových nákladů TC na vyráběném množství Q při zvoleném časovém úseku: 59 Graf této funkce viz literatura na konci tohoto odstavce, str. 19. Zmíněný graf je „kvantitativně“ závislý na zvolené firmě, ale jeho „kvalitativní tvar“ je na ní víceméně nezávislý. Z matematického hlediska se jedná o funkci definovanou na intervalu je zde rostoucí, obecně není lineární a má zde derivaci. Její další vlastnosti nespecifikujeme. Její analytický vzorec pro danou firmu lze získat z naměřených, resp. napozorovaných diskrétních hodnot matematicko-statistickými metodami. Více o tomto tématu se lze dozvědět v magisterském studiu. Funkce udává průměrné náklady. Lze předpokládat, že je definovaná na intervalu pro a pro Dále, že je na intervalu klesající, na roste, v má minimum. Důležitou roli v neoklasické teorii má pojem „mezních nákladů“. K posouzení jeho důležitosti ve sledovaných zákonitostech není nutné použít diferenciálního počtu, pak ale výklad není zcela přesný. Mezní náklady MC(Q) v ekonomické interpretaci ukazují o kolik je třeba zvýšit celkové náklady TC na výrobu další jednotky produkce, tj. proměnné Q. Tedy symbol označuje přírůstek celkových nákladů TC odpovídající přírůstku proměnné Q. Pokud pak jsou mezní náklady číselně rovny přírůstku veličina ale závisí na velikosti a tedy nevystihuje okamžitou „míru změny“ funkce TC v bodě Q. (Srovnejte s pojmy okamžitá a průměrná rychlost u odstavce derivace.) Zcela vyhovuje „mezní hodnota“ tohoto zlomku, tj. hodnota, ke které se blíží, pokud To znamená, že účelné je definovat mezní náklady jako derivaci celkových nákladů: Tato definice dává shodnou ekonomickou interpretaci. Stačí si uvědomit platnost aproximace a volit Vyslovte tuto interpretaci. Navíc je nám k dispozici celý kalkulus diferenciálního počtu. Obvyklé tvary grafů funkcí AC(Q) a MC(Q) jsou uvedeny v literatuře uvedené níže. Z jejich průběhů se usuzuje, že graf mezních nákladů protíná graf průměrných nákladů v jeho minimu. Tento fakt má důležitou ekonomickou interpretaci. (Opět viz literatura.) Exaktní platnost tohoto tvrzení dostaneme snadno aplikací diferenciálního počtu za zcela obecných předpokladů o funkci TC. Zřejmé platí: . 60 V minimu je tato derivace nulová, tedy což je naše tvrzení. Literatura: Vlček, J., a kol.: Ekonomie a ekonomika, Praha, ASPI, 2005. Název: Studijní opory předmětu MT 003 STATISTIKA v kombinovaném studiu Vysoké školy hotelové v Praze, magisterský studijní program všech oborů Autor: Doc. RNDr. Miloslav Malec, CSc.; Dr. Ing. Sylva Skupinová Zveřejnění: Elektronická verze uveřejněna v informačním systému VŠH ISBN: 978-80-87411-22-3