Empirijska funkcija distribucije. Empirijska funkcija distribucije, svojstva Kako pronaći empirijsku funkciju distribucije i nacrtati je

Kao što je poznato, zakon raspodjele slučajne varijable može se specificirati na različite načine. Diskretna slučajna varijabla se može specificirati korištenjem distribucijske serije ili integralne funkcije, a kontinuirana slučajna varijabla može se specificirati korištenjem integralne ili diferencijalne funkcije. Razmotrimo selektivne analoge ove dvije funkcije.

Neka postoji uzorak skupa vrijednosti neke slučajne varijable volumena i svaka opcija iz ovog skupa je povezana sa svojom frekvencijom. Pustite dalje je neki realan broj, i – broj uzoraka vrijednosti slučajne varijable
, manji .Onda broj je učestalost kvantitativnih vrijednosti uočenih u uzorku X, manji , one. učestalost pojavljivanja događaja
. Prilikom promjene x u opštem slučaju, vrednost će se takođe promeniti . To znači da je relativna frekvencija je funkcija argumenta . A budući da se ova funkcija nalazi iz uzoraka podataka dobivenih kao rezultat eksperimenata, naziva se selektivnim ili empirijski.

Definicija 10.15. Empirijska funkcija distribucije(funkcija distribucije uzorkovanja) je funkcija
, definirajući za svaku vrijednost x relativna učestalost događaja
.

(10.19)

Za razliku od empirijske funkcije distribucije uzorkovanja, funkcija distribucije F(x) opšte populacije naziva se teorijska funkcija raspodjele. Razlika između njih je u teorijskoj funkciji F(x) određuje vjerovatnoću događaja
, a empirijski je relativna učestalost istog događaja. Iz Bernoullijeve teoreme slijedi

,
(10.20)

one. na slobodi vjerovatnoća
i relativnu učestalost događaja
, tj.
malo se razlikuju jedno od drugog. Iz ovoga slijedi da je preporučljivo koristiti empirijsku funkciju distribucije uzorka za aproksimaciju teorijske (integralne) funkcije raspodjele opće populacije.

Funkcija
I
imaju ista svojstva. Ovo slijedi iz definicije funkcije.

Svojstva
:


Primjer 10.4. Konstruirajte empirijsku funkciju na osnovu date distribucije uzorka:

Opcije

Frekvencije

Rješenje: Nađimo veličinu uzorka n= 12+18+30=60. Najmanja opcija
, dakle,
at
. Značenje
, naime
posmatrano 12 puta, dakle:

=
at
.

Značenje x< 10, naime
I
posmatrano 12+18=30 puta, dakle,
=
at
. At

.

Tražena empirijska funkcija distribucije:

=

Raspored
prikazano na sl. 10.2

R
je. 10.2

Sigurnosna pitanja

1. Koje glavne probleme rješava matematička statistika? 2. Opća i uzorkovana populacija? 3. Definirajte veličinu uzorka. 4. Koji se uzorci nazivaju reprezentativnim? 5. Greške reprezentativnosti. 6. Osnovne metode uzorkovanja. 7. Koncepti frekvencije, relativne frekvencije. 8. Koncept statističkih serija. 9. Zapišite Sturgesovu formulu. 10. Formulirajte koncepte raspona uzorka, medijana i moda. 11. Frekvencijski poligon, histogram. 12. Koncept bodovne procjene populacije uzorka. 13. Pristrasna i nepristrasna procjena bodova. 14. Formulirajte koncept prosjeka uzorka. 15. Formulirajte koncept varijanse uzorka. 16. Formulirajte koncept standardne devijacije uzorka. 17. Formulirati koncept koeficijenta varijacije uzorka. 18. Formulirajte koncept uzorka geometrijske sredine.

Predavanje 13. Koncept statističkih procjena slučajnih varijabli

Neka je poznata statistička frekvencijska distribucija kvantitativne karakteristike X. Označimo sa brojem opažanja u kojima je uočena vrijednost karakteristike manja od x i sa n ukupan broj opservacija. Očigledno, relativna učestalost događaja X< x равна и является функцией x. Так как эта функция находится эмпирическим (опытным) путем, то ее называют эмпирической.

Empirijska funkcija distribucije(funkcija distribucije uzorkovanja) je funkcija koja za svaku vrijednost x određuje relativnu frekvenciju događaja X< x. Таким образом, по определению ,где - число вариант, меньших x, n – объем выборки.

Za razliku od empirijske funkcije distribucije uzorka, naziva se funkcija raspodjele populacije teorijska funkcija raspodjele. Razlika između ovih funkcija je u tome što teorijska funkcija određuje vjerovatnoća događaji X< x, тогда как эмпирическая – relativna frekvencija isti događaj.

Kako n raste, relativna frekvencija događaja X< x, т.е. стремится по вероятности к вероятности этого события. Иными словами

Svojstva empirijske funkcije distribucije:

1) Vrijednosti empirijske funkcije pripadaju segmentu

2) - neopadajuća funkcija

3) Ako je najmanja opcija, onda = 0 za , ako je najveća opcija, onda = 1 za .

Empirijska funkcija distribucije uzorka služi za procjenu teorijske funkcije distribucije populacije.

Primjer. Konstruirajmo empirijsku funkciju na osnovu distribucije uzorka:

Opcije
Frekvencije

Nađimo veličinu uzorka: 12+18+30=60. Najmanja opcija je 2, dakle =0 za x £ 2. Vrijednost x<6, т.е. , наблюдалось 12 раз, следовательно, =12/60=0,2 при 2< x £6. Аналогично, значения X < 10, т.е. и наблюдались 12+18=30 раз, поэтому =30/60 =0,5 при 6< x £10. Так как x=10 – наибольшая варианта, то =1 при x>10. Dakle, željena empirijska funkcija ima oblik:

Najvažnija svojstva statističkih procjena

Neka je potrebno proučiti neke kvantitativne karakteristike opšte populacije. Pretpostavimo da je iz teorijskih razmatranja to bilo moguće utvrditi koji tačno raspodjela ima predznak i potrebno je procijeniti parametre po kojima se ona određuje. Na primjer, ako je karakteristika koja se proučava normalno raspoređena u populaciji, tada je potrebno procijeniti matematičko očekivanje i standardnu ​​devijaciju; ako karakteristika ima Poissonovu distribuciju, tada je potrebno procijeniti parametar l.

Obično su dostupni samo uzorci podataka, na primjer, vrijednosti kvantitativne karakteristike dobivene kao rezultat n neovisnih promatranja. Uzimajući u obzir nezavisne slučajne varijable možemo to reći pronaći statističku procjenu nepoznatog parametra teorijske distribucije znači pronaći funkciju promatranih slučajnih varijabli koja daje približnu vrijednost procijenjenog parametra. Na primjer, da bi se procijenilo matematičko očekivanje normalne distribucije, ulogu funkcije igra aritmetička sredina



Da bi statističke procjene dale ispravne aproksimacije procijenjenih parametara, one moraju zadovoljiti određene zahtjeve, među kojima su najvažniji zahtjevi undisplaced I solventnost procjene.

Neka je statistička procjena nepoznatog parametra teorijske distribucije. Neka se procjena nađe iz uzorka veličine n. Ponovimo eksperiment, tj. hajde da izdvojimo drugi uzorak iste veličine iz opšte populacije i na osnovu njegovih podataka dobijemo drugačiju procenu. Ponavljajući eksperiment mnogo puta, dobijamo različite brojeve. Rezultat se može posmatrati kao slučajna varijabla, a brojevi kao njene moguće vrijednosti.

Ako procjena daje približnu vrijednost u izobilju, tj. svaki broj je veći od prave vrijednosti, i kao posljedica toga, matematičko očekivanje (prosječna vrijednost) slučajne varijable je veće od:. Isto tako, ako daje procjenu sa nedostatkom, To .

Dakle, upotreba statističke procjene, čije matematičko očekivanje nije jednako procijenjenom parametru, dovela bi do sistematskih (istog predznaka) grešaka. Ako, naprotiv, onda to garantuje od sistematskih grešaka.

Nepristrasan naziva se statistička procjena, čije je matematičko očekivanje jednako procijenjenom parametru za bilo koju veličinu uzorka.

Displaced naziva se procjena koja ne zadovoljava ovaj uslov.

Nepristranost procjene još ne garantuje dobru aproksimaciju procijenjenog parametra, budući da se moguće vrijednosti mogu veoma raštrkano oko svoje prosječne vrijednosti, tj. varijansa može biti značajna. U ovom slučaju, procjena pronađena iz podataka jednog uzorka, na primjer, može se pokazati značajno udaljenom od prosječne vrijednosti, a samim tim i od parametra koji se procjenjuje.

Efektivno je statistička procjena koju, za datu veličinu uzorka n, ima najmanju moguću varijaciju .

Kada se razmatraju veliki uzorci, potrebne su statističke procjene solventnost .

Bogati naziva se statistička procjena, koja, kako n®¥ teži po vjerovatnoći procijenjenom parametru. Na primjer, ako varijansa nepristrasne procjene teži nuli kao n®¥, onda se takva procjena ispostavi da je konzistentna.

Određivanje empirijske funkcije distribucije

Neka je $X$ slučajna varijabla. $F(x)$ je funkcija distribucije date slučajne varijable. Provešćemo $n$ eksperimente na datoj slučajnoj promenljivoj pod istim uslovima, nezavisno jedan od drugog. U ovom slučaju dobijamo niz vrijednosti $x_1,\ x_2\ $, ... ,$\ x_n$, koji se naziva uzorak.

Definicija 1

Svaka vrijednost $x_i$ ($i=1,2\ $, ... ,$ \ n$) naziva se varijanta.

Jedna procjena teorijske funkcije distribucije je empirijska funkcija distribucije.

Definicija 3

Empirijska funkcija distribucije $F_n(x)$ je funkcija koja za svaku vrijednost $x$ određuje relativnu frekvenciju događaja $X \

gdje je $n_x$ broj opcija manji od $x$, $n$ je veličina uzorka.

Razlika između empirijske funkcije i teorijske je u tome što teorijska funkcija određuje vjerovatnoću događaja $X

Svojstva empirijske funkcije distribucije

Razmotrimo sada nekoliko osnovnih svojstava funkcije distribucije.

    Opseg funkcije $F_n\left(x\right)$ je segment $$.

    $F_n\left(x\right)$ je neopadajuća funkcija.

    $F_n\left(x\right)$ je lijeva kontinuirana funkcija.

    $F_n\left(x\right)$ je konstantna funkcija po komadima i raste samo u tačkama vrijednosti slučajne varijable $X$

    Neka je $X_1$ najmanja, a $X_n$ najveća varijanta. Tada je $F_n\left(x\right)=0$ za $(x\le X)_1$ i $F_n\left(x\right)=1$ za $x\ge X_n$.

Hajde da uvedemo teoremu koja povezuje teorijske i empirijske funkcije.

Teorema 1

Neka je $F_n\left(x\right)$ empirijska funkcija raspodjele, a $F\left(x\right)$ teorijska funkcija raspodjele općeg uzorka. Tada vrijedi jednakost:

\[(\mathop(lim)_(n\to \infty ) (|F)_n\left(x\right)-F\left(x\right)|=0\ )\]

Primjeri problema za pronalaženje empirijske funkcije raspodjele

Primjer 1

Neka distribucija uzorkovanja ima sljedeće podatke zabilježene pomoću tabele:

Slika 1.

Pronađite veličinu uzorka, kreirajte empirijsku funkciju distribucije i nacrtajte je.

Veličina uzorka: $n=5+10+15+20=50$.

Prema svojstvu 5, imamo da je za $x\le 1$ $F_n\left(x\right)=0$, a za $x>4$ $F_n\left(x\right)=1$.

$x vrijednost

$x vrijednost

$x vrijednost

Tako dobijamo:

Slika 2.

Slika 3.

Primjer 2

Iz gradova centralnog dela Rusije nasumično je odabrano 20 gradova za koje su dobijeni sledeći podaci o cenama prevoza: 14, 15, 12, 12, 13, 15, 15, 13, 15, 12, 15, 14 , 15, 13 , 13, 12, 12, 15, 14, 14.

Kreirajte empirijsku funkciju distribucije za ovaj uzorak i nacrtajte je.

Zapišimo vrijednosti uzorka uzlaznim redoslijedom i izračunajmo učestalost svake vrijednosti. Dobijamo sledeću tabelu:

Slika 4.

Veličina uzorka: $n=20$.

Prema svojstvu 5, imamo da je za $x\le 12$ $F_n\left(x\right)=0$, a za $x>15$ $F_n\left(x\right)=1$.

$x vrijednost

$x vrijednost

$x vrijednost

Tako dobijamo:

Slika 5.

Nacrtajmo empirijsku distribuciju:

Slika 6.

Originalnost: $92,12\%$.

Saznajte koja je empirijska formula. U hemiji, EP je najjednostavniji način da se opiše jedinjenje – u suštini lista elemenata koji čine jedinjenje na osnovu njihovog procenta. Treba napomenuti da ova jednostavna formula ne opisuje red atoma u jedinjenju, jednostavno ukazuje od kojih se elemenata sastoji. na primjer:

  • Jedinjenje koje se sastoji od 40,92% ugljika; 4,58% vodonika i 54,5% kiseonika imaće empirijsku formulu C 3 H 4 O 3 (primer kako pronaći EF ovog jedinjenja biće razmatran u drugom delu).
  • Shvatite pojam "procentualni sastav"."Procentualni sastav" je postotak svakog pojedinačnog atoma u cijelom spoju o kojem je riječ. Da biste pronašli empirijsku formulu jedinjenja, morate znati procentualni sastav jedinjenja. Ako tražite empirijsku formulu za domaći zadatak, tada će se najvjerovatnije dati procenti.

    • Da bi se u laboratoriji utvrdio procentualni sastav hemijskog jedinjenja, on se podvrgava nekim fizičkim eksperimentima, a zatim kvantitativnoj analizi. Ako niste u laboratoriji, ne morate raditi ove eksperimente.
  • Imajte na umu da ćete morati da se nosite sa gram atomima. Gram atom je određena količina supstance čija je masa jednaka njenoj atomskoj masi. Da biste pronašli gram atom, trebate koristiti sljedeću jednačinu: Postotak elementa u spoju podijeljen je s atomskom masom elementa.

    • Recimo, na primjer, da imamo spoj koji sadrži 40,92% ugljika. Atomska masa ugljenika je 12, tako da bi naša jednadžba bila 40,92 / 12 = 3,41.
  • Znati kako pronaći atomske omjere. Kada radite sa jedinjenjem, na kraju ćete dobiti više od jednog atoma grama. Nakon što pronađete sve gram atoma vašeg spoja, pogledajte ih. Da biste pronašli atomski omjer, morat ćete odabrati najmanju vrijednost gram-atoma koju ste izračunali. Tada ćete morati podijeliti sve gram atome na najmanji gram atom. na primjer:

    • Recimo da radite sa jedinjenjem koje sadrži tri grama atoma: 1,5; 2 i 2.5. Najmanji od ovih brojeva je 1,5. Stoga, da biste pronašli omjer atoma, morate podijeliti sve brojeve sa 1,5 i staviti znak omjera između njih : .
    • 1,5 / 1,5 = 1, 2 / 1,5 = 1,33. 2,5 / 1,5 = 1,66. Dakle, odnos atoma je 1: 1,33: 1,66 .
  • Shvatite kako pretvoriti vrijednosti atomskog omjera u cijele brojeve. Kada pišete empirijsku formulu, morate koristiti cijele brojeve. To znači da ne možete koristiti brojeve poput 1,33. Nakon što pronađete omjer atoma, trebate pretvoriti razlomke (poput 1,33) u cijele brojeve (kao 3). Da biste to učinili, morate pronaći cijeli broj, množeći svaki broj atomskog omjera kojim ćete dobiti cijele brojeve. na primjer:

    • Pokušajte 2. Pomnožite brojeve atomskog omjera (1, 1,33 i 1,66) sa 2. Dobićete 2, 2,66 i 3,32. Ovo nisu cijeli brojevi, tako da 2 nije prikladno.
    • Pokušajte 3. Ako pomnožite 1, 1,33 i 1,66 sa 3, dobićete 3, 4 i 5. Dakle, atomski omjer cijelih brojeva ima oblik 3: 4: 5 .