Statistična pomembnost. Pogosta vprašanja: Kako se določi pomembnost? Statistična značilnost in vrednost p

Statistična pomembnost rezultata (p-vrednost) je ocenjena mera zaupanja v njegovo »resničnost« (v smislu »reprezentativnosti vzorca«). Bolj tehnično rečeno, je p-vrednost mera, ki se spreminja v padajočem vrstnem redu z zanesljivostjo rezultata. Višja p-vrednost ustreza nižji stopnji zaupanja v razmerje med spremenljivkami, najdenimi v vzorcu. Natančneje, p-vrednost predstavlja verjetnost napake, povezane s posploševanjem opazovanega rezultata na celotno populacijo. Na primer, p-vrednost 0,05 (tj. 1/20) pomeni, da obstaja 5-odstotna verjetnost, da je razmerje med spremenljivkami, najdenimi v vzorcu, le naključna lastnost vzorca. Z drugimi besedami, če določeno razmerje ne obstaja v populaciji in podobne poskuse izvajate večkrat, potem bi v približno eni od dvajsetih ponovitev poskusa pričakovali enako ali močnejšo povezavo med spremenljivkami.

V številnih študijah se p-vrednost 0,05 šteje za "sprejemljivo mejo" za stopnjo napake.

Nikakor se ne moremo izogniti samovolji pri odločanju, katera raven pomembnosti se resnično šteje za "pomembno". Izbira določene ravni pomembnosti, nad katero so rezultati zavrnjeni kot napačni, je precej poljubna. V praksi je končna odločitev običajno odvisna od tega, ali je bil rezultat napovedan a priori (tj. pred izvedbo poskusa) ali odkrit posteriori kot rezultat številnih analiz in primerjav, opravljenih na različnih podatkih, pa tudi na podlagi tradicija študijskega področja. Običajno je na mnogih področjih rezultat p 0,05 sprejemljiva meja za statistično pomembnost, vendar je treba zapomniti, da ta raven še vedno vključuje precej visoko stopnjo napak (5 %). Rezultati, pomembni pri ravni p 0,01, se na splošno štejejo za statistično pomembne, rezultati z ravnjo p 0,005 ali p 0,001 pa se na splošno štejejo za zelo pomembne. Vendar je treba razumeti, da je ta klasifikacija stopenj pomembnosti precej poljubna in je le neformalen dogovor, sprejet na podlagi praktičnih izkušenj na določenem področju raziskav.

Kot že omenjeno, obseg odnosa in zanesljivost predstavljata dve različni značilnosti razmerij med spremenljivkami. Vendar pa ni mogoče reči, da so popolnoma neodvisni. Na splošno velja, da večja kot je velikost razmerja (razmerja) med spremenljivkami v vzorcu normalne velikosti, bolj zanesljiv je.

Če predpostavimo, da med pripadajočimi spremenljivkami v populaciji ni povezave, je najverjetneje pričakovati, da tudi v proučevanem vzorcu ne bo povezave med temi spremenljivkami. Torej, močnejša kot je povezava v vzorcu, manjša je verjetnost, da povezava ne obstaja v populaciji, iz katere je vzeta.

Velikost vzorca vpliva na pomembnost razmerja. Če je opazovanj malo, potem je ustrezno malo možnih kombinacij vrednosti za te spremenljivke, zato je verjetnost, da po naključju odkrijete kombinacijo vrednosti, ki kaže močno povezavo, relativno visoka.

Kako se izračuna stopnja statistične pomembnosti. Predpostavimo, da ste že izračunali mero odvisnosti med dvema spremenljivkama (kot je razloženo zgoraj). Naslednje vprašanje, s katerim se soočate, je: "kako pomemben je ta odnos?" Na primer, ali je 40 % pojasnjene variance med dvema spremenljivkama dovolj, da se razmerje šteje za pomembno? Odgovor: "odvisno od okoliščin." Pomembnost je namreč odvisna predvsem od velikosti vzorca. Kot že pojasnjeno, bodo v zelo velikih vzorcih tudi zelo šibke povezave med spremenljivkami pomembne, medtem ko v majhnih vzorcih niti zelo močne povezave niso zanesljive. Za določitev stopnje statistične pomembnosti torej potrebujete funkcijo, ki predstavlja razmerje med "magnitudo" in "pomenom" razmerja med spremenljivkami za vsako velikost vzorca. Ta funkcija bi vam natančno povedala, "kako verjetno je pridobiti razmerje dane vrednosti (ali več) v vzorcu dane velikosti, ob predpostavki, da v populaciji ni takega razmerja." Z drugimi besedami, ta funkcija bi podala raven pomembnosti (p-vrednost) in s tem verjetnost napačne zavrnitve predpostavke, da dano razmerje ne obstaja v populaciji. To »alternativno« hipotezo (da v populaciji ni razmerja) običajno imenujemo ničelna hipoteza. Idealno bi bilo, če bi bila funkcija, ki izračuna verjetnost napake, linearna in bi imela samo različne naklone za različne velikosti vzorcev. Na žalost je ta funkcija veliko bolj zapletena in ni vedno popolnoma enaka. Vendar je v večini primerov njegova oblika znana in se lahko uporablja za določanje stopenj pomembnosti v študijah vzorcev dane velikosti. Večina teh funkcij je povezanih z zelo pomembnim razredom porazdelitev, imenovanim normalne.

Pri izdelavi regresijskega modela se postavlja vprašanje določitve pomembnosti dejavnikov, vključenih v regresijsko enačbo (1). Določanje pomembnosti faktorja pomeni razjasnitev vprašanja o moči vpliva faktorja na odzivno funkcijo. Če se med reševanjem problema preverjanja pomembnosti faktorja izkaže, da je faktor nepomemben, ga lahko izključimo iz enačbe. V tem primeru se šteje, da faktor nima pomembnega vpliva na odzivno funkcijo. Če je pomembnost faktorja potrjena, potem ostane v regresijskem modelu. Menijo, da ima v tem primeru faktor vpliv na odzivno funkcijo, ki ga ni mogoče zanemariti. Reševanje vprašanja o pomembnosti dejavnikov je enakovredno preverjanju hipoteze, da so regresijski koeficienti za te dejavnike enaki nič. Tako bo imela ničelna hipoteza obliko: , kjer je subvektor dimenzijskega vektorja (l*1). Zapišimo regresijsko enačbo v matrični obliki:

Y = Xb+e,(2)

Y– vektor velikosti n;

X- matrika velikosti (p*n);

b je vektor velikosti p.

Enačbo (2) lahko prepišemo kot:

Kje X l in X p - l - matrike velikosti (n,l) oziroma (n,p-l). Potem je hipoteza H 0 enakovredna predpostavki, da

Določimo minimum funkcije . Ker so pod ustreznima hipotezama H 0 in H 1 = 1 - H 0 ocenjeni vsi parametri določenega linearnega modela, je minimum pod hipotezo H 0 enak

medtem ko je za H 1 enako

Za preizkus ničelne hipoteze izračunamo statistiko , ki ima Fisherjevo porazdelitev z (l,n-p) prostostnimi stopnjami, kritično območje za H 0 pa tvori 100*a odstotkov največjih vrednosti F. Če je F F cr - hipoteza je zavrnjena.

Pomembnost dejavnikov lahko preverimo z drugo metodo, neodvisno drug od drugega. Ta metoda temelji na študiji intervalov zaupanja za koeficiente regresijske enačbe. Določimo variance koeficientov, Vrednosti so diagonalni elementi matrike . Po določitvi ocen varianc koeficientov je mogoče konstruirati intervale zaupanja za ocene koeficientov regresijske enačbe. Interval zaupanja za vsako oceno bo , kjer je tabelarična vrednost Studentovega kriterija za število prostostnih stopinj, s katerimi je bil določen element in izbrano stopnjo pomembnosti. Faktor s številko i je pomemben, če je absolutna vrednost koeficienta za ta faktor večja od odstopanja, izračunanega pri konstruiranju intervala zaupanja. Z drugimi besedami, faktor s številko i je pomemben, če 0 ne pripada intervalu zaupanja, izdelanem za to oceno koeficienta. V praksi velja, da čim ožji je interval zaupanja na dani ravni pomembnosti, bolj smo lahko prepričani o pomembnosti faktorja. Če želite preveriti pomembnost dejavnika s pomočjo Studentovega testa, lahko uporabite formulo . Izračunana vrednost t-testa se primerja z vrednostjo tabele pri dani ravni pomembnosti in ustreznem številu prostostnih stopinj. Ta metoda preverjanja pomembnosti dejavnikov se lahko uporablja le, če so dejavniki neodvisni. Če obstaja razlog za upoštevanje številnih dejavnikov, ki so odvisni drug od drugega, se ta metoda lahko uporabi samo za razvrščanje dejavnikov glede na stopnjo njihovega vpliva na funkcijo odziva. Test pomembnosti v tej situaciji je treba dopolniti z metodo, ki temelji na Fisherjevem kriteriju.

Tako je obravnavan problem preverjanja pomembnosti dejavnikov in zmanjšanja dimenzije modela v primeru nepomembnega vpliva dejavnikov na odzivno funkcijo. Nadalje bi bilo logično razmisliti o vprašanju uvedbe dodatnih dejavnikov v model, ki po mnenju raziskovalca med poskusom niso bili upoštevani, vendar je njihov vpliv na funkcijo odziva pomemben. Predpostavimo, da potem, ko je bil izbran regresijski model

, ,

pojavila se je naloga, da v model vključimo dodatne faktorje x j, tako da model z uvedbo teh faktorjev dobi obliko:

, (3)

kjer je X matrika velikosti n*p ranga p, Z je matrika velikosti n*g ranga g in stolpci matrike Z so linearno neodvisni od stolpcev matrike X, tj. matrika W velikosti n*(p+g) ima rang (p+g). Izraz (3) uporablja zapis (X,Z)=W, . Obstajata dve možnosti za določitev ocen novouvedenih koeficientov modela. Prvič, oceno in njeno disperzijsko matriko lahko najdete neposredno iz relacij

Statistika je že dolgo postala sestavni del življenja. Ljudje se srečujejo povsod. Na podlagi statističnih podatkov se sklepa o tem, kje in katere bolezni so pogoste, kaj je bolj povpraševanje v določeni regiji ali med določenim segmentom prebivalstva. Na tem temeljijo celo politični programi kandidatov za vlado. Uporabljajo jih tudi trgovske verige pri nakupu blaga, proizvajalci pa se po teh podatkih vodijo v svojih ponudbah.

Statistika igra pomembno vlogo v življenju družbe in vpliva na vsakega posameznega člana že v majhnih stvareh. Na primer, če ima večina ljudi raje temne barve v oblačilih v določenem mestu ali regiji, bo iskanje svetlo rumenega dežnega plašča s cvetličnim tiskom v lokalnih maloprodajnih mestih izjemno težko. Toda katere količine sestavljajo te podatke, ki imajo tak vpliv? Na primer, kaj je "statistična pomembnost"? Kaj točno je mišljeno s to definicijo?

Kaj je to?

Statistika kot znanost je sestavljena iz kombinacije različnih količin in konceptov. Eden od njih je koncept "statistične pomembnosti". To je ime vrednosti spremenljivk, pri katerih je verjetnost pojava drugih indikatorjev zanemarljiva.

Na primer, 9 od 10 ljudi si med jutranjim sprehodom po gobe v jesenski gozd po deževni noči na noge natakne gumijaste čevlje. Verjetnost, da jih bo nekoč 8 nosilo platnene mokasine, je zanemarljiva. Tako je v tem posebnem primeru številka 9 vrednost, ki se imenuje "statistična pomembnost".

V skladu s tem, če razvijemo naslednji praktični primer, trgovine s čevlji kupujejo gumijaste škornje v večjih količinah proti koncu poletne sezone kot v drugih obdobjih leta. Tako velikost statistične vrednosti vpliva na vsakdanje življenje.

Seveda se pri zapletenih izračunih, recimo pri napovedovanju širjenja virusov, upošteva veliko število spremenljivk. Toda samo bistvo določanja pomembnega kazalnika statističnih podatkov je podobno, ne glede na zahtevnost izračunov in število nekonstantnih vrednosti.

Kako se izračuna?

Uporabljajo se pri izračunu vrednosti indikatorja »statistične pomembnosti« enačbe. Se pravi, lahko trdimo, da v tem primeru o vsem odloča matematika. Najenostavnejša možnost izračuna je veriga matematičnih operacij, ki vključuje naslednje parametre:

dve vrsti rezultatov, pridobljenih z raziskavami ali študijo objektivnih podatkov, na primer zneski, za katere so opravljeni nakupi, označeni z a in b;
indikator za obe skupini - n;
vrednost deleža združenega vzorca - p;
koncept "standardne napake" - SE.

Naslednji korak je določitev splošnega kazalnika testa - t, njegova vrednost se primerja s številko 1,96. 1,96 je povprečna vrednost, ki predstavlja 95-odstotno območje glede na Studentovo t-porazdelitveno funkcijo.

Pogosto se postavlja vprašanje, kakšna je razlika med vrednostma n in p. Ta odtenek je mogoče enostavno razjasniti s pomočjo primera. Recimo, da izračunavamo statistično pomembnost zvestobe izdelku ali blagovni znamki za moške in ženske.

V tem primeru bo črkovnim oznakam sledilo naslednje:

n - število anketirancev;
p - število ljudi, ki so zadovoljni z izdelkom.

Število anketiranih žensk bo v tem primeru označeno kot n1. V skladu s tem obstaja n2 moških. Števili "1" in "2" za simbol p bosta imeli enak pomen.

Primerjava testnega indikatorja s povprečnimi vrednostmi študentovih tabel za izračun postane tako imenovana "statistična pomembnost".

Kaj pomeni preverjanje?

Rezultate katerega koli matematičnega izračuna lahko vedno preverimo, tega otroke učijo že v osnovni šoli. Logično je domnevati, da ker so statistični kazalci določeni z uporabo verige izračunov, se preverjajo.

Vendar pa testiranje statistične pomembnosti ne zadeva le matematike. Statistika se ukvarja z velikim številom spremenljivk in različnimi verjetnostmi, ki pa niso vedno izračunljive. To pomeni, če se vrnemo k primeru z gumijastimi čevlji, ki je bil podan na začetku članka, potem lahko logično konstrukcijo statističnih podatkov, na katere se bodo zanašali kupci blaga za trgovine, zmoti suho in vroče vreme, kar ni značilno za jesen. Zaradi tega pojava se bo število kupcev gumijastih škornjev zmanjšalo, maloprodajna mesta pa bodo utrpela izgube. Matematična formula seveda ne more napovedati vremenske anomalije. Ta trenutek se imenuje "napaka".

Prav verjetnost tovrstnih napak se upošteva pri preverjanju stopnje izračunane pomembnosti. Upošteva izračunane kazalnike in sprejete ravni pomembnosti ter vrednosti, ki se običajno imenujejo hipoteze.

Kakšna je stopnja pomembnosti?

Koncept "raven" je vključen v glavna merila za statistično pomembnost. Uporablja se v uporabni in praktični statistiki. To je neke vrste vrednost, ki upošteva verjetnost morebitnih odstopanj ali napak.

Raven temelji na prepoznavanju razlik v že pripravljenih vzorcih in nam omogoča ugotavljanje njihove pomembnosti ali, nasprotno, naključnosti. Ta koncept nima samo digitalnih pomenov, ampak tudi njihove edinstvene dekodacije. Pojasnjujejo, kako je treba vrednost razumeti, sama raven pa se določi s primerjavo rezultata s povprečnim indeksom, kar razkriva stopnjo zanesljivosti razlik.

Tako si lahko koncept ravni predstavljamo preprosto - je pokazatelj sprejemljive, verjetne napake ali napake v sklepih, ki izhajajo iz pridobljenih statističnih podatkov.

Katere ravni pomembnosti se uporabljajo?

Statistična pomembnost koeficientov verjetnosti napake v praksi temelji na treh osnovnih nivojih.

Za prvo raven se šteje prag, pri katerem je vrednost 5 %. To pomeni, da verjetnost napake ne presega ravni pomembnosti 5%. To pomeni, da je zaupanje v brezhibnost in brezhibnost zaključkov na podlagi podatkov statističnih raziskav 95-odstotno.

Druga raven je 1-odstotni prag. V skladu s tem ta številka pomeni, da se lahko z 99-odstotno zanesljivostjo ravnamo po podatkih, pridobljenih med statističnimi izračuni.

Tretja stopnja je 0,1 %. S to vrednostjo je verjetnost napake enaka delčku odstotka, to pomeni, da so napake praktično odpravljene.

Kaj je hipoteza v statistiki?

Napake kot koncept delimo v dve smeri, glede sprejemanja ali zavračanja ničelne hipoteze. Hipoteza je koncept, za katerim se po definiciji skriva niz drugih podatkov ali izjav. To je opis verjetnostne porazdelitve nečesa, kar je povezano s predmetom statističnega računovodstva.

Pri preprostih izračunih obstajata dve hipotezi - ničelna in alternativna. Razlika med njima je v tem, da ničelna hipoteza temelji na ideji, da med vzorci, ki sodelujejo pri določanju statistične pomembnosti, ni temeljnih razlik, alternativna hipoteza pa je povsem nasprotna. To pomeni, da alternativna hipoteza temelji na prisotnosti pomembne razlike v vzorčnih podatkih.

Kakšne so napake?

Napake kot pojem v statistiki so neposredno odvisne od sprejetja ene ali druge hipoteze kot resnične. Razdelimo jih lahko v dve smeri oziroma vrsti:

prvi tip je posledica sprejetja ničelne hipoteze, ki se izkaže za napačno;
drugo povzroči sledenje alternativi.

Prva vrsta napake se imenuje lažno pozitivna in se pojavlja precej pogosto na vseh področjih, kjer se uporabljajo statistični podatki. V skladu s tem se napaka druge vrste imenuje lažno negativna.

Za kaj se uporablja regresija v statistiki?

Statistični pomen regresije je v tem, da je z njo mogoče ugotoviti, kako dobro model različnih odvisnosti, izračunan na podlagi podatkov, ustreza realnosti; vam omogoča, da ugotovite zadostnost ali pomanjkanje dejavnikov, ki jih je treba upoštevati in pripraviti sklepe.

Regresijska vrednost se določi s primerjavo rezultatov s podatki, navedenimi v Fisherjevih tabelah. Ali z uporabo analize variance. Regresijski indikatorji so pomembni za kompleksne statistične študije in izračune, ki vključujejo veliko število spremenljivk, naključnih podatkov in verjetnih sprememb.

Pomen vpliva je v bistvu kompleksna (integralna) ocena. Ugotavljanje pomembnosti vpliva poteka v več fazah.

1. stopnja. Za ugotavljanje pomembnosti vplivov na posamezne sestavine naravnega okolja je potrebno uporabiti tabele s kriteriji vpliva (tabele 5-1, 5-2 in 5-3). Ocena pomembnosti vpliva je določena s formulo 1.

Q i = Q i t x Q jaz sem x Q jaz j

1 Aditivni sistem je bil uporabljen v socialno-ekonomski metodologiji zaradi prisotnosti ničelnih vrednosti, ki razveljavijo enačbo med množenjem v celoviti oceni učinka

naravno okolje

Q jaz

integr - kompleksna ocenjevalna ocena za obravnavani vpliv;

Qi t- ocena začasnega vpliva na i-ti sestavina naravnega okolja;

Qi s- ocena prostorskega vpliva na i-ti sestavina naravnega okolja;

Qi j- ocena intenzivnosti vpliva na i-ti sestavina naravnega okolja.

Kategorije pomembnosti so skladne med različnimi sestavinami naravnega okolja in so morda že primerljive za določitev sestavine naravnega okolja, ki bo doživela največje vplive.

Za izvedbo presoje vplivov na okolje so bile sprejete tri kategorije pomembnosti vpliva - manjše, zmerne in pomembne, kot je prikazano v besedilnem polju 5.

Besedilni okvir 5

Vpliv nizke pomembnosti se pojavi, ko so učinki izkušeni, vendar je obseg vpliva dovolj nizek (z ublažitvijo ali brez nje) in je znotraj sprejemljivih standardov ali pa so receptorji nizke občutljivosti/vrednosti.

Vpliv zmernega pomena ima lahko širok razpon, od praga, pod katerim je vpliv nizek, do ravni, ki je blizu kršitve zakonske meje. Kjer je mogoče, je treba dokazati zmerno pomembno zmanjšanje vpliva.

Vplivi visokega pomena se pojavijo, ko so presežene sprejemljive meje ali ko so opaženi vplivi velikega obsega, zlasti na dragocene/občutljive vire.

· vplivi na tla in podtalje;

· vplivi na površinske in morske vode;

· vpliv na podtalnico;

· vpliv na pridnene usedline;

· vpliv na kakovost zraka;

· vpliv na biološke vire morja in kopnega;

· vplivi na krajine;

· fizični dejavniki vpliva (vplivi hrupa, vibracije itd.).

Če je pomen ugotovljenega vpliva za posamezno sestavino naravnega okolja (zračni zrak, živalski in živalski svet ipd.) edini, se neposredno uporabi za oceno posledične pomembnosti vpliva.

V praksi je lahko ena sestavina naravnega okolja različno izpostavljena vplivom iz več virov, zato se za ugotavljanje pomembnosti vpliva uporablja pridobljena ocena pomembnosti za posamezno sestavino naravnega okolja. Glede na pridobljene ocene in merila pomembnosti je mogoče določiti posledično oceno pomembnosti vpliva. Primer določanja posledične pomembnosti vpliva je predstavljen v tabeli 5-5.

7. Okoljska presoja – ekonomsko orodje za ravnanje z okoljem

Okoljska presoja je ekonomsko orodje za ravnanje z okoljem.

Gospodarski mehanizem okoljske ureditve je zapleten večstopenjski sistem odnosov med poslovnimi subjekti med seboj in z višjimi organi. Povezovalni vzvod teh odnosov naj bo okoljska presoja (EO) - orodje, ki vključuje organizacijske in ekonomske dejavnike varstva okolja. Omogoča vam, da izberete najboljšo možnost za okoljevarstvene strukture, organizirate informacijski in analitični nadzor nad stanjem in stopnjo delovanja okoljske opreme ter podate ekonomsko oceno načrtovanih tehničnih in tehnoloških izboljšav.

Na podlagi ciljev, značilnosti razvoja programa in metodologije izvajanja predlagamo naslednjo definicijo: EA je neodvisna študija vseh vidikov gospodarske dejavnosti industrijskega podjetja katere koli oblike lastništva za določitev velikosti neposrednega ali posrednega vpliva. o stanju okolja. Njegov cilj je uskladiti okoljske dejavnosti z zahtevami zakonodaje in predpisov, optimizirati rabo naravnih virov, zmanjšati in racionalizirati porabo energije, zmanjšati količino odpadkov, preprečiti izredne izpuste, emisije in nesreče, ki jih povzroči človek.

Ker govorimo o preučevanju vseh vidikov gospodarske dejavnosti podjetja, mora EA združiti in razširiti programe in metode že obstoječih vrst revizij - proizvodnje, finančnih dejavnosti, revizij skladnosti.

Poročilo okoljskega presojevalca bo vsebovalo naslednje podatke:

o ugotovitve o skladnosti okoljskih in proizvodnih dejavnosti z zakonodajo in predpisi;

o ugotovitev o stanju finančno-ekonomskega poročanja, računovodstva, pravočasnosti in višine tekočih okoljskih plačil, namenskosti porabe sredstev kapitala, namenjenega varstvu okolja;

o ocena vpliva revidiranega podjetja na stanje okolja, zdravje proizvodnega osebja, ekologijo v regiji, podatki o prisotnosti in obsegu emisij (izpustov) onesnaževal, katerih proizvodnja je omejena ali prepovedana. z mednarodnimi obveznostmi države;

o rezultati analize stopnje rasti proizvodnje izdelkov ter količine emisij in izpustov onesnaževal, porabe energije in materialnih virov;

o rezultati primerjalne analize glavnih kazalnikov okoljskih in proizvodnih dejavnosti revidiranega podjetja in podobnih podjetij v Ukrajini in drugih državah;

o ocena možne nevarnosti revidiranega podjetja v primeru izrednih razmer, učinkovitost razvitega načrta dela za odpravo vira nesreče, razpoložljivost potrebnih materialnih in tehničnih sredstev;

o sklep o strokovni usposobljenosti zaposlenih v okoljskih službah podjetja, njihovi oskrbi s sodobnimi tehničnimi sredstvi za spremljanje skladnosti z dovoljenimi stopnjami onesnaževanja;

o ozaveščenost vodstva in proizvodnega osebja o količini in naravi onesnaževanja okolja s strani njihovega podjetja, razpoložljivosti materialnih in moralnih spodbud za zmanjšanje stopnje onesnaženosti ter energetske in materialne intenzivnosti proizvedenih izdelkov.

Na podlagi zaključka okoljskega presojevalca je mogoče določen problem (na primer zmanjšanje količine ali koncentracije določenega onesnaževala) rešiti z različnimi, pogosto alternativnimi metodami. Odvisno od radikalnosti sprejete odločitve in resnosti problema lahko potrebni okoljevarstveni ukrepi segajo od organizacijskih ukrepov in povečanega nadzora nad tehnološkim procesom in delovanjem okoljevarstvene opreme do zaprtja podjetja s kasnejšo preureditev. .

Eden od pomembnih dejavnikov, ki prispevajo k razvoju EA v svetu, je postopek izvajanja programa. V postopku izvajanja okoljskih presoj odkrivanje in kaznovanje odgovornih še zdaleč ni glavni cilj. Za vodstvo podjetja je veliko bolj pomembno, da prepozna ozka grla na vseh področjih delovanja objekta, ki tako ali drugače negativno vplivajo na okolje, in pomaga pri njihovem zmanjševanju. Izvedba objektivne študije je nemogoča brez tesnega sodelovanja z upravo in proizvodnim osebjem podjetja, tj. ne da bi se iz nadzorovane osebe spremenil v polnopravnega partnerja, katerega mnenje in argumentacijo upoštevamo v vseh fazah EZ.

EA opozarja na situacijo, ko okoljski problemi zadevajo le vodstvo podjetja, ki je prisiljeno na lastno odgovornost prikrivati negativne posledice proizvodnih dejavnosti do te mere, da bo njihovo prikrivanje postalo nemogoče, njihova odprava pa bo pomenila pravno postopkih in sankcijah. V ta namen je pri reševanju okoljskih problemov določenega podjetja priporočljivo vključiti znanstveni potencial regije, zaposlene v okoljskih službah in finančne institucije.

Po podatkih Svetovne banke se morebitno povečanje stroškov projekta, povezano s presojo vplivov na okolje in kasnejšim upoštevanjem okoljskih omejitev, povrne v povprečju v 5-7 letih. Vključitev okoljskih dejavnikov v postopek odločanja v fazi projektiranja je 3-4-krat cenejša od naknadne vgradnje dodatne čistilne opreme, stroški odprave posledic uporabe neekoloških tehnologij in opreme pa 30-35-krat. višji od stroškov, ki bi bili potrebni za razvoj okolju prijazne rešitve.čiste tehnologije in uporabe okolju prijazne opreme.

Objektivna študija celovitega vpliva okoljsko presojenega podjetja na stanje okolja, ob upoštevanju mnenj vseh zainteresiranih strani, bo pomagala preprečiti nadaljnje zaostrovanje okoljske in gospodarske krize ter določiti načine za upoštevanje dejavnik okolja pri razvoju strategij in taktik gospodarske dejavnosti. To bo povečalo industrijsko varnost podjetja in s tem njegovo naložbeno privlačnost.

Določanje indikatorjev pomembnosti preko gradienta

Dvojno delujoča nevronska mreža lahko izračuna gradient ocenjevalne funkcije iz vhodnih signalov in parametrov omrežja, ki jih je mogoče učiti.

Indikator pomembnosti parametra pri reševanju primera q-o bo vrednost, ki kaže, koliko se bo spremenila vrednost funkcije vrednotenja rešitve po omrežju primera q-o, če trenutno vrednost parametra w p zamenjamo z izbrano vrednost w p . To natančno vrednost je mogoče določiti z zamenjavo in izračunom ocene omrežja. Glede na veliko število parametrov omrežja pa bo izračun indikatorjev pomembnosti za vse parametre vzel veliko časa. Za pospešitev postopka ocenjevanja parametrov pomembnosti se namesto natančnih vrednosti uporabljajo različne ocene. Oglejmo si najpreprostejšo in najpogosteje uporabljeno linearno oceno kazalnikov pomembnosti. Razširimo funkcijo vrednotenja v Taylorjevo vrsto do členov prvega reda:

kjer je H 0 q vrednost ocenjevalne funkcije za rešitev primera q-o z w =w. Tako je indikator pomembnosti parametra p-o pri reševanju primera q-o določen z naslednjo formulo:

Indikator pomembnosti (1) je mogoče izračunati za različne objekte. Najpogosteje se izračuna za omrežne parametre, ki se usposabljajo. Vendar je indikator pomembnosti tipa (1) uporaben tudi za signale. Kot je bilo že omenjeno v poglavju, pri delovanju v obratni smeri omrežje vedno izračuna dva vektorja gradienta - gradient ocenjevalne funkcije na podlagi naučenih omrežnih parametrov in na podlagi vseh omrežnih signalov. Če se ocena pomembnosti izračuna za identifikacijo najmanj pomembnega nevrona, je treba izračunati oceno pomembnosti izhoda nevrona. Podobno je pri nalogi določanja najmanj pomembnega vhodnega signala potrebno izračunati pomembnost tega signala in ne vsote pomembnosti uteži povezav, na katere se ta signal nanaša.

Povprečje v vadbenem nizu

Indikator pomembnosti parametra X q p je odvisen od točke v prostoru parametrov, na kateri je izračunan, in od primera iz učne množice. Obstajata dva bistveno različna pristopa za pridobitev indikatorja pomembnosti parametra, ki ni odvisen od primera. Pri prvem pristopu se predpostavlja, da učni niz vsebuje popolne informacije o vseh možnih primerih. Indikator pomembnosti v tem primeru razumemo kot vrednost, ki kaže, koliko se bo spremenila vrednost ocenjevalne funkcije za vadbeno množico, če trenutno vrednost parametra w p zamenjamo z izbrano vrednostjo w p . Ta vrednost se izračuna po naslednji formuli:

Pri drugem pristopu se učna množica obravnava kot naključni vzorec v prostoru vhodnih parametrov. V tem primeru bo indikator pomembnosti za celoten niz za usposabljanje rezultat nekega povprečenja za niz za usposabljanje.

Obstaja veliko metod povprečenja. Poglejmo dva od njih. Če bi kazalnik pomembnosti zaradi povprečenja moral dati povprečno pomembnost, potem se tak indikator izračuna po naslednji formuli:

Če naj bi zaradi povprečenja indikator pomembnosti dal vrednost, ki ne presega indikatorjev pomembnosti za posamezne primere (pomembnost tega parametra za posamezen primer ni večja od O§ p), potem se tak indikator izračuna. z uporabo naslednje formule:

Kopičenje indikatorjev pomembnosti

Vsi kazalniki pomembnosti so odvisni od točke v prostoru parametrov omrežja, v kateri so izračunani, in se lahko zelo razlikujejo, ko se premikate od ene točke do druge. Za indekse pomembnosti, izračunane z uporabo gradienta, je ta odvisnost še močnejša, saj so pri usposabljanju z uporabo metode najstrmejšega spusta (glejte razdelek ) na dveh sosednjih točkah v prostoru parametrov, na katerem je bil izračunan gradient, gradienti pravokotni. Za odpravo odvisnosti od točke v prostoru se uporabljajo indikatorji pomembnosti, izračunani na več točkah. Nato se izračuna povprečje z uporabo formul, podobnih (3) in (4). Vprašanje izbire točk v prostoru parametrov, na katerih se izračunajo indikatorji pomembnosti, se običajno reši preprosto. Med več koraki usposabljanja za katero koli gradientno metodo se vsakič, ko se gradient izračuna, izračunajo tudi rezultati pomembnosti. Število korakov učenja, med katerimi se akumulirajo indikatorji pomembnosti, ne sme biti preveliko, saj pri velikem številu korakov učenja prvi izračunani indikatorji pomembnosti postanejo nesmiselni, še posebej pri uporabi povprečenja po formuli (4).

Iz analize literature in izkušenj skupine NeuroComp lahko oblikujemo naslednje naloge, ki jih je mogoče rešiti s kontrastnimi nevronskimi mrežami.

1. Poenostavitev arhitekture nevronske mreže.

2. Zmanjšanje števila vhodnih signalov.

3. Zmanjšanje parametrov nevronske mreže na majhen nabor izbranih vrednosti.

4. Zmanjšane zahteve za točnost vhodnih signalov.

5. Pridobivanje eksplicitnega znanja iz podatkov.

Kontrastni algoritmi, obravnavani v tem poglavju, nam omogočajo izbiro najmanjšega zahtevanega nabora vhodnih signalov. Uporaba minimalnega nabora vhodnih signalov vam omogoča bolj ekonomično organizacijo dela nevronskega računalnika. Vendar ima minimalni nabor svoje pomanjkljivosti. Ker je nabor minimalen, informacije, ki jih prenaša eden od signalov, običajno niso podprte z drugimi vhodnimi signali. To vodi do dejstva, da če pride do napake v enem vhodnem signalu, se omrežje zmoti z visoko stopnjo verjetnosti. Pri prevelikem naboru vhodnih signalov se to običajno ne zgodi, saj je informacija vsakega signala okrepljena (podvojena) z drugimi signali.

Tako nastane protislovje – uporaba začetnega redundantnega nabora signalov je neekonomična, uporaba minimalnega nabora signalov pa vodi v povečano tveganje za napake. V tej situaciji je pravilna kompromisna rešitev - treba je najti minimalen nabor, v katerem se vse informacije podvojijo. Ta razdelek obravnava metode za konstruiranje takšnih sklopov s povečano zanesljivostjo. Poleg tega vam konstrukcija dvojnikov druge vrste omogoča, da ugotovite, kateri od vhodnih signalov nima dvojnikov v izvirnem nizu signalov. Vključitev takšnega "edinstvenega" signala v minimalni niz je znak, da morate pri uporabi nevronske mreže za rešitev te težave skrbno spremljati pravilnost vrednosti tega signala.

Poznamo dve vrsti kontrastnih postopkov - kontrastiranje na podlagi pomembnosti parametrov in neponižujoče kontrastiranje. V tem razdelku sta opisani obe vrsti kontrastnih postopkov.

Ta razdelek opisuje metodo za določanje indikatorjev pomembnosti parametrov in signalov. Nato bomo govorili o določanju pomembnosti parametrov. Indikatorji pomembnosti omrežnih signalov so določeni po enakih formulah, pri čemer so parametri nadomeščeni s signali.