Στατιστική σημασία. FAQ: Πώς προσδιορίζεται η σημασία; Στατιστική σημασία και τιμή p

Η στατιστική σημασία ενός αποτελέσματος (p-value) είναι ένα εκτιμώμενο μέτρο εμπιστοσύνης στην «αλήθεια» του (με την έννοια της «αντιπροσωπευτικότητας του δείγματος»). Πιο τεχνικά μιλώντας, μια τιμή p είναι ένα μέτρο που ποικίλλει σε φθίνουσα τάξη μεγέθους με την αξιοπιστία του αποτελέσματος. Μια υψηλότερη τιμή p αντιστοιχεί σε χαμηλότερο επίπεδο εμπιστοσύνης στη σχέση μεταξύ των μεταβλητών που βρέθηκαν στο δείγμα. Συγκεκριμένα, η τιμή p αντιπροσωπεύει την πιθανότητα σφάλματος που σχετίζεται με τη γενίκευση του παρατηρούμενου αποτελέσματος σε ολόκληρο τον πληθυσμό. Για παράδειγμα, μια τιμή p 0,05 (δηλαδή 1/20) υποδεικνύει ότι υπάρχει πιθανότητα 5% η σχέση μεταξύ των μεταβλητών που βρίσκονται στο δείγμα να είναι απλώς ένα τυχαίο χαρακτηριστικό του δείγματος. Με άλλα λόγια, εάν μια δεδομένη σχέση δεν υπάρχει σε έναν πληθυσμό και διεξάγετε παρόμοια πειράματα πολλές φορές, τότε σε περίπου μία στις είκοσι επαναλήψεις του πειράματος θα περιμένατε την ίδια ή ισχυρότερη σχέση μεταξύ των μεταβλητών.

Σε πολλές μελέτες, μια τιμή p 0,05 θεωρείται «αποδεκτό περιθώριο» για το επίπεδο σφάλματος.

Δεν υπάρχει τρόπος να αποφευχθεί η αυθαιρεσία στην απόφαση ποιο επίπεδο σημασίας θα πρέπει πραγματικά να θεωρείται «σημαντικό». Η επιλογή ενός συγκεκριμένου επιπέδου σημαντικότητας πάνω από το οποίο τα αποτελέσματα απορρίπτονται ως ψευδή είναι εντελώς αυθαίρετη. Στην πράξη, η τελική απόφαση εξαρτάται συνήθως από το εάν το αποτέλεσμα είχε προβλεφθεί εκ των προτέρων (δηλαδή πριν από τη διεξαγωγή του πειράματος) ή ανακαλύφθηκε εκ των υστέρων ως αποτέλεσμα πολλών αναλύσεων και συγκρίσεων που πραγματοποιήθηκαν σε μια ποικιλία δεδομένων, καθώς και παράδοση του πεδίου σπουδών. Συνήθως, σε πολλά πεδία, ένα αποτέλεσμα p 0,05 είναι ένα αποδεκτό όριο για στατιστική σημασία, αλλά πρέπει να θυμόμαστε ότι αυτό το επίπεδο εξακολουθεί να περιλαμβάνει ένα αρκετά μεγάλο ποσοστό σφάλματος (5%). Τα σημαντικά αποτελέσματα στο επίπεδο p 0,01 θεωρούνται γενικά στατιστικά σημαντικά και τα αποτελέσματα με επίπεδο p 0,005 ή p 0,001 θεωρούνται γενικά πολύ σημαντικά. Ωστόσο, θα πρέπει να γίνει κατανοητό ότι αυτή η ταξινόμηση των επιπέδων σημαντικότητας είναι αρκετά αυθαίρετη και είναι απλώς μια άτυπη συμφωνία που εγκρίθηκε με βάση την πρακτική εμπειρία σε έναν συγκεκριμένο τομέα έρευνας.

Όπως ήδη αναφέρθηκε, το μέγεθος της σχέσης και η αξιοπιστία αντιπροσωπεύουν δύο διαφορετικά χαρακτηριστικά των σχέσεων μεταξύ των μεταβλητών. Ωστόσο, δεν μπορεί να ειπωθεί ότι είναι εντελώς ανεξάρτητοι. Σε γενικές γραμμές, όσο μεγαλύτερο είναι το μέγεθος της σχέσης (σχέσης) μεταξύ των μεταβλητών σε ένα δείγμα κανονικού μεγέθους, τόσο πιο αξιόπιστο είναι.

Εάν υποθέσουμε ότι δεν υπάρχει σχέση μεταξύ των αντίστοιχων μεταβλητών στον πληθυσμό, τότε είναι πολύ πιθανό να αναμένεται ότι στο υπό μελέτη δείγμα δεν θα υπάρχει επίσης σχέση μεταξύ αυτών των μεταβλητών. Επομένως, όσο ισχυρότερη είναι η σχέση σε ένα δείγμα, τόσο λιγότερο πιθανό είναι να μην υπάρχει η σχέση στον πληθυσμό από τον οποίο προέρχεται.


Το μέγεθος του δείγματος επηρεάζει τη σημασία της σχέσης. Εάν υπάρχουν λίγες παρατηρήσεις, τότε υπάρχουν αντίστοιχα λίγοι πιθανοί συνδυασμοί τιμών για αυτές τις μεταβλητές και έτσι η πιθανότητα να ανακαλυφθεί κατά λάθος ένας συνδυασμός τιμών που δείχνει μια ισχυρή σχέση είναι σχετικά υψηλή.

Πώς υπολογίζεται το επίπεδο στατιστικής σημαντικότητας. Ας υποθέσουμε ότι έχετε ήδη υπολογίσει ένα μέτρο εξάρτησης μεταξύ δύο μεταβλητών (όπως εξηγήθηκε παραπάνω). Η επόμενη ερώτηση που αντιμετωπίζετε είναι: «πόσο σημαντική είναι αυτή η σχέση;» Για παράδειγμα, είναι επαρκές το 40% της επεξηγημένης διακύμανσης μεταξύ δύο μεταβλητών για να θεωρηθεί σημαντική η σχέση; Η απάντηση: «ανάλογα με τις περιστάσεις». Δηλαδή, η σημασία εξαρτάται κυρίως από το μέγεθος του δείγματος. Όπως έχει ήδη εξηγηθεί, σε πολύ μεγάλα δείγματα ακόμη και πολύ αδύναμες σχέσεις μεταξύ των μεταβλητών θα είναι σημαντικές, ενώ σε μικρά δείγματα ακόμη και πολύ ισχυρές σχέσεις δεν είναι αξιόπιστες. Έτσι, για να προσδιορίσετε το επίπεδο στατιστικής σημαντικότητας, χρειάζεστε μια συνάρτηση που αντιπροσωπεύει τη σχέση μεταξύ του "μεγέθους" και της "σημασίας" της σχέσης μεταξύ των μεταβλητών για κάθε μέγεθος δείγματος. Αυτή η συνάρτηση θα σας πει ακριβώς «πόσο πιθανό είναι να αποκτήσετε μια σχέση δεδομένης τιμής (ή μεγαλύτερης) σε ένα δείγμα δεδομένου μεγέθους, υποθέτοντας ότι δεν υπάρχει τέτοια σχέση στον πληθυσμό». Με άλλα λόγια, αυτή η συνάρτηση θα έδινε το επίπεδο σημασίας (p-value) και συνεπώς την πιθανότητα να απορριφθεί λανθασμένα η υπόθεση ότι μια δεδομένη σχέση δεν υπάρχει στον πληθυσμό. Αυτή η «εναλλακτική» υπόθεση (ότι δεν υπάρχει σχέση στον πληθυσμό) ονομάζεται συνήθως μηδενική υπόθεση. Θα ήταν ιδανικό εάν η συνάρτηση που υπολογίζει την πιθανότητα σφάλματος ήταν γραμμική και είχε μόνο διαφορετικές κλίσεις για διαφορετικά μεγέθη δείγματος. Δυστυχώς, αυτή η λειτουργία είναι πολύ πιο περίπλοκη και δεν είναι πάντα ακριβώς η ίδια. Ωστόσο, στις περισσότερες περιπτώσεις η μορφή του είναι γνωστή και μπορεί να χρησιμοποιηθεί για τον προσδιορισμό των επιπέδων σημαντικότητας σε μελέτες δειγμάτων ενός δεδομένου μεγέθους. Οι περισσότερες από αυτές τις συναρτήσεις συνδέονται με μια πολύ σημαντική κατηγορία κατανομών που ονομάζεται κανονική.

Κατά την κατασκευή ενός μοντέλου παλινδρόμησης, τίθεται το ερώτημα του προσδιορισμού της σημασίας των παραγόντων που περιλαμβάνονται στην εξίσωση παλινδρόμησης (1). Ο προσδιορισμός της σημασίας ενός παράγοντα σημαίνει αποσαφήνιση του ζητήματος της ισχύος της επιρροής του παράγοντα στη συνάρτηση απόκρισης. Εάν, κατά την επίλυση του προβλήματος του ελέγχου της σημασίας ενός παράγοντα, αποδειχθεί ότι ο παράγοντας είναι ασήμαντος, τότε μπορεί να εξαιρεθεί από την εξίσωση. Σε αυτή την περίπτωση, θεωρείται ότι ο παράγοντας δεν έχει σημαντική επίδραση στη συνάρτηση απόκρισης. Εάν επιβεβαιωθεί η σημασία του παράγοντα, τότε αφήνεται στο μοντέλο παλινδρόμησης. Πιστεύεται ότι σε αυτή την περίπτωση ο παράγοντας έχει μια επίδραση στη συνάρτηση απόκρισης που δεν μπορεί να αγνοηθεί. Η επίλυση του ζητήματος της σημασίας των παραγόντων ισοδυναμεί με τον έλεγχο της υπόθεσης ότι οι συντελεστές παλινδρόμησης για αυτούς τους παράγοντες είναι ίσοι με μηδέν. Έτσι, η μηδενική υπόθεση θα έχει τη μορφή: , όπου είναι το υποδιάνυσμα του διανύσματος διάστασης (l*1). Ας ξαναγράψουμε την εξίσωση παλινδρόμησης σε μορφή πίνακα:

Υ = Xb+e,(2)

Υ– διάνυσμα μεγέθους n;

Χ- πίνακας μεγέθους (p*n);

σιείναι ένα διάνυσμα μεγέθους p.

Η εξίσωση (2) μπορεί να ξαναγραφτεί ως εξής:

,

Οπου Χγη Χ p - l - πίνακες μεγέθους (n,l) και (n,p-l), αντίστοιχα. Τότε η υπόθεση H 0 είναι ισοδύναμη με την υπόθεση ότι

.

Ας προσδιορίσουμε το ελάχιστο της συνάρτησης . Δεδομένου ότι σύμφωνα με τις αντίστοιχες υποθέσεις H 0 και H 1 = 1 - H 0 υπολογίζονται όλες οι παράμετροι ενός συγκεκριμένου γραμμικού μοντέλου, το ελάχιστο στην υπόθεση H 0 ισούται με

,

ενώ για H 1 είναι ίσο

.

Για να ελέγξουμε τη μηδενική υπόθεση, υπολογίζουμε στατιστικά , η οποία έχει κατανομή Fisher με (l,n-p) βαθμούς ελευθερίας και η κρίσιμη περιοχή για το H 0 σχηματίζεται από το 100*a τοις εκατό των μεγαλύτερων τιμών του F. Εάν F F cr - η υπόθεση απορρίπτεται.

Η σημασία των παραγόντων μπορεί να ελεγχθεί χρησιμοποιώντας άλλη μέθοδο, ανεξάρτητα ο ένας από τον άλλο. Η μέθοδος αυτή βασίζεται στη μελέτη των διαστημάτων εμπιστοσύνης για τους συντελεστές της εξίσωσης παλινδρόμησης. Ας προσδιορίσουμε τις διακυμάνσεις των συντελεστών, Οι τιμές είναι τα διαγώνια στοιχεία του πίνακα . Έχοντας καθορίσει τις εκτιμήσεις των διακυμάνσεων των συντελεστών, μπορούν να κατασκευαστούν διαστήματα εμπιστοσύνης για εκτιμήσεις των συντελεστών εξίσωσης παλινδρόμησης. Το διάστημα εμπιστοσύνης για κάθε εκτίμηση θα είναι , όπου είναι η τιμή του πίνακα του κριτηρίου του Μαθητή για τον αριθμό των βαθμών ελευθερίας με τους οποίους προσδιορίστηκε το στοιχείο και το επιλεγμένο επίπεδο σημασίας. Ένας παράγοντας με αριθμό i είναι σημαντικός εάν η απόλυτη τιμή του συντελεστή για αυτόν τον παράγοντα είναι μεγαλύτερη από την απόκλιση που υπολογίζεται κατά την κατασκευή του διαστήματος εμπιστοσύνης. Με άλλα λόγια, ο παράγοντας με αριθμό i είναι σημαντικός εάν το 0 δεν ανήκει στο διάστημα εμπιστοσύνης που κατασκευάστηκε για αυτήν την εκτίμηση του συντελεστή. Στην πράξη, όσο πιο στενό είναι το διάστημα εμπιστοσύνης σε ένα δεδομένο επίπεδο σημασίας, τόσο πιο σίγουροι μπορούμε να είμαστε για τη σημασία του παράγοντα. Για να ελέγξετε τη σημασία ενός παράγοντα χρησιμοποιώντας το τεστ Student, μπορείτε να χρησιμοποιήσετε τον τύπο . Η υπολογισμένη τιμή t-test συγκρίνεται με την τιμή του πίνακα σε ένα δεδομένο επίπεδο σημαντικότητας και τον αντίστοιχο αριθμό βαθμών ελευθερίας. Αυτή η μέθοδος ελέγχου της σημασίας των παραγόντων μπορεί να χρησιμοποιηθεί μόνο εάν οι παράγοντες είναι ανεξάρτητοι. Εάν υπάρχει λόγος να θεωρηθεί ένας αριθμός παραγόντων που εξαρτώνται ο ένας από τον άλλο, τότε αυτή η μέθοδος μπορεί να χρησιμοποιηθεί μόνο για την ταξινόμηση παραγόντων ανάλογα με τον βαθμό επιρροής τους στη συνάρτηση απόκρισης. Ο έλεγχος σπουδαιότητας σε αυτήν την περίπτωση πρέπει να συμπληρωθεί με μια μέθοδο που βασίζεται στο κριτήριο Fisher.

Έτσι, εξετάζεται το πρόβλημα του ελέγχου της σημασίας των παραγόντων και της μείωσης της διάστασης του μοντέλου σε περίπτωση ασήμαντης επίδρασης παραγόντων στη συνάρτηση απόκρισης. Περαιτέρω εδώ θα ήταν λογικό να εξεταστεί το ζήτημα της εισαγωγής πρόσθετων παραγόντων στο μοντέλο, οι οποίοι, σύμφωνα με τον ερευνητή, δεν λήφθηκαν υπόψη κατά το πείραμα, αλλά η επίδρασή τους στη συνάρτηση απόκρισης είναι σημαντική. Ας υποθέσουμε ότι αφού έχει επιλεγεί το μοντέλο παλινδρόμησης

, ,

προέκυψε το καθήκον να συμπεριληφθούν πρόσθετοι παράγοντες x j στο μοντέλο, έτσι ώστε το μοντέλο με την εισαγωγή αυτών των παραγόντων να λάβει τη μορφή:

, (3)

όπου X είναι ένας πίνακας μεγέθους n*p της κατάταξης p, Z είναι ένας πίνακας μεγέθους n*g της τάξης g και οι στήλες του πίνακα Z είναι γραμμικά ανεξάρτητες από τις στήλες του πίνακα X, δηλ. Ο πίνακας W μεγέθους n*(p+g) έχει κατάταξη (p+g). Η έκφραση (3) χρησιμοποιεί τον συμβολισμό (X,Z)=W, . Υπάρχουν δύο δυνατότητες για τον προσδιορισμό των εκτιμήσεων των συντελεστών που εισήχθησαν πρόσφατα. Αρχικά, μπορείτε να βρείτε την εκτίμηση και τον πίνακα διασποράς του απευθείας από τις σχέσεις

Οι στατιστικές έχουν γίνει εδώ και καιρό αναπόσπαστο μέρος της ζωής. Ο κόσμος το συναντά παντού. Με βάση στατιστικές, εξάγονται συμπεράσματα σχετικά με το πού και ποιες ασθένειες είναι κοινές, τι είναι περισσότερο σε ζήτηση σε μια συγκεκριμένη περιοχή ή σε ένα συγκεκριμένο τμήμα του πληθυσμού. Σε αυτό στηρίζονται ακόμη και τα πολιτικά προγράμματα των υποψηφίων κυβερνήσεων. Χρησιμοποιούνται επίσης από τις αλυσίδες λιανικής κατά την αγορά αγαθών και οι κατασκευαστές καθοδηγούνται από αυτά τα δεδομένα στις προσφορές τους.

Η στατιστική παίζει σημαντικό ρόλο στη ζωή της κοινωνίας και επηρεάζει κάθε μέλος ξεχωριστά ακόμα και σε μικρά πράγματα. Για παράδειγμα, αν οι περισσότεροι προτιμούν τα σκούρα χρώματα στα ρούχα σε μια συγκεκριμένη πόλη ή περιοχή, τότε η εύρεση ενός λαμπερού κίτρινου αδιάβροχου με λουλουδάτο στάμπα στα τοπικά καταστήματα λιανικής θα είναι εξαιρετικά δύσκολη. Αλλά ποιες ποσότητες αποτελούν αυτά τα δεδομένα που έχουν τέτοιο αντίκτυπο; Για παράδειγμα, τι συνιστά «στατιστική σημασία»; Τι ακριβώς εννοείται με αυτόν τον ορισμό;

Τι είναι αυτό?

Η στατιστική ως επιστήμη αποτελείται από έναν συνδυασμό διαφορετικών ποσοτήτων και εννοιών. Ένα από αυτά είναι η έννοια της «στατιστικής σημασίας». Αυτό είναι το όνομα της τιμής των μεταβλητών στις οποίες η πιθανότητα εμφάνισης άλλων δεικτών είναι αμελητέα.

Για παράδειγμα, 9 στους 10 ανθρώπους βάζουν παπούτσια από καουτσούκ στα πόδια τους κατά τη διάρκεια μιας πρωινής βόλτας για να μαζέψουν μανιτάρια στο φθινοπωρινό δάσος μετά από μια βροχερή νύχτα. Η πιθανότητα κάποια στιγμή 8 από αυτούς να φορέσουν μοκασίνια καμβά είναι μηδαμινή. Έτσι, στο συγκεκριμένο παράδειγμα, ο αριθμός 9 είναι η τιμή που ονομάζεται «στατιστική σημασία».

Αντίστοιχα, αν αναπτύξουμε το ακόλουθο πρακτικό παράδειγμα, τα καταστήματα υποδημάτων αγοράζουν μπότες από καουτσούκ σε μεγαλύτερες ποσότητες προς το τέλος της καλοκαιρινής περιόδου από ό,τι άλλες εποχές του χρόνου. Έτσι, το μέγεθος μιας στατιστικής αξίας έχει αντίκτυπο στην καθημερινή ζωή.

Φυσικά, σε πολύπλοκους υπολογισμούς, ας πούμε, κατά την πρόβλεψη της εξάπλωσης των ιών, λαμβάνεται υπόψη ένας μεγάλος αριθμός μεταβλητών. Αλλά η ίδια η ουσία του προσδιορισμού ενός σημαντικού δείκτη στατιστικών δεδομένων είναι παρόμοια, ανεξάρτητα από την πολυπλοκότητα των υπολογισμών και τον αριθμό των μη σταθερών τιμών.

Πώς υπολογίζεται;

Χρησιμοποιούνται κατά τον υπολογισμό της τιμής του δείκτη «στατιστικής σημασίας» της εξίσωσης. Δηλαδή, μπορεί να υποστηριχθεί ότι σε αυτή την περίπτωση όλα αποφασίζονται από τα μαθηματικά. Η απλούστερη επιλογή υπολογισμού είναι μια αλυσίδα μαθηματικών πράξεων, η οποία περιλαμβάνει τις ακόλουθες παραμέτρους:

  • δύο είδη αποτελεσμάτων που λαμβάνονται από έρευνες ή τη μελέτη αντικειμενικών δεδομένων, για παράδειγμα, τα ποσά για τα οποία πραγματοποιούνται οι αγορές, που δηλώνονται με α και β·
  • δείκτης και για τις δύο ομάδες - n.
  • αξία του μεριδίου του συνδυασμένου δείγματος - p.
  • η έννοια του "τυπικού σφάλματος" - SE.

Το επόμενο βήμα είναι να προσδιοριστεί ο γενικός δείκτης δοκιμής - t, η τιμή του συγκρίνεται με τον αριθμό 1,96. 1,96 είναι η μέση τιμή που αντιπροσωπεύει το εύρος 95% σύμφωνα με τη συνάρτηση κατανομής t του Student.

Συχνά τίθεται το ερώτημα σχετικά με το ποια είναι η διαφορά μεταξύ των τιμών του n και του p. Αυτή η απόχρωση μπορεί εύκολα να διευκρινιστεί με τη βοήθεια ενός παραδείγματος. Ας υποθέσουμε ότι υπολογίζουμε τη στατιστική σημασία της αφοσίωσης σε ένα προϊόν ή μια επωνυμία για άνδρες και γυναίκες.

Στην περίπτωση αυτή, οι χαρακτηρισμοί των γραμμάτων θα ακολουθούνται από τα ακόλουθα:

  • n - αριθμός ερωτηθέντων.
  • p - ο αριθμός των ανθρώπων που είναι ικανοποιημένοι με το προϊόν.

Ο αριθμός των γυναικών που θα ερωτηθούν σε αυτήν την περίπτωση θα οριστεί ως n1. Αντίστοιχα, υπάρχουν n2 άνδρες. Οι αριθμοί «1» και «2» για το σύμβολο p θα έχουν την ίδια σημασία.

Η σύγκριση του δείκτη δοκιμής με τις μέσες τιμές των πινάκων υπολογισμού του Μαθητή γίνεται αυτό που ονομάζεται «στατιστική σημασία».

Τι σημαίνει επαλήθευση;

Τα αποτελέσματα οποιουδήποτε μαθηματικού υπολογισμού μπορούν πάντα να ελεγχθούν· τα παιδιά διδάσκονται αυτό στο δημοτικό σχολείο. Είναι λογικό να υποθέσουμε ότι εφόσον οι στατιστικοί δείκτες καθορίζονται χρησιμοποιώντας μια αλυσίδα υπολογισμών, ελέγχονται.

Ωστόσο, ο έλεγχος της στατιστικής σημασίας δεν αφορά μόνο τα μαθηματικά. Η στατιστική ασχολείται με μεγάλο αριθμό μεταβλητών και διάφορες πιθανότητες, οι οποίες δεν είναι πάντα υπολογίσιμες. Δηλαδή, αν επιστρέψουμε στο παράδειγμα με τα λαστιχένια παπούτσια που δίνεται στην αρχή του άρθρου, τότε η λογική κατασκευή των στατιστικών δεδομένων στα οποία θα βασίζονται οι αγοραστές αγαθών για καταστήματα μπορεί να διαταραχθεί από ξηρό και ζεστό καιρό, κάτι που δεν είναι τυπικό για φθινόπωρο. Ως αποτέλεσμα αυτού του φαινομένου, ο αριθμός των ατόμων που αγοράζουν λαστιχένιες μπότες θα μειωθεί και τα καταστήματα λιανικής θα υποστούν απώλειες. Ένας μαθηματικός τύπος, φυσικά, δεν είναι σε θέση να προβλέψει μια ανωμαλία του καιρού. Αυτή η στιγμή ονομάζεται «λάθος».

Είναι ακριβώς η πιθανότητα τέτοιων σφαλμάτων που λαμβάνεται υπόψη κατά τον έλεγχο του επιπέδου της υπολογισμένης σημασίας. Λαμβάνει υπόψη τόσο τους υπολογισμένους δείκτες όσο και τα αποδεκτά επίπεδα σημαντικότητας, καθώς και τις τιμές που ονομάζονται συμβατικά υποθέσεις.

Ποιο είναι το επίπεδο σημαντικότητας;

Η έννοια του «επίπεδου» περιλαμβάνεται στα κύρια κριτήρια στατιστικής σημασίας. Χρησιμοποιείται σε εφαρμοσμένες και πρακτικές στατιστικές. Αυτό είναι ένα είδος τιμής που λαμβάνει υπόψη την πιθανότητα πιθανών αποκλίσεων ή σφαλμάτων.

Το επίπεδο βασίζεται στον εντοπισμό διαφορών σε έτοιμα δείγματα και μας επιτρέπει να διαπιστώσουμε τη σημασία τους ή, αντίθετα, την τυχαιότητά τους. Αυτή η έννοια δεν έχει μόνο ψηφιακές έννοιες, αλλά και μοναδικές αποκωδικοποιήσεις τους. Εξηγούν πώς πρέπει να γίνει κατανοητή η τιμή και το ίδιο το επίπεδο καθορίζεται συγκρίνοντας το αποτέλεσμα με τον μέσο δείκτη, αυτό αποκαλύπτει τον βαθμό αξιοπιστίας των διαφορών.

Έτσι, μπορούμε να φανταστούμε την έννοια του επιπέδου απλά - είναι ένας δείκτης ενός αποδεκτού, πιθανού σφάλματος ή σφάλματος στα συμπεράσματα που εξάγονται από τα στατιστικά δεδομένα που λαμβάνονται.

Ποια επίπεδα σημασίας χρησιμοποιούνται;

Η στατιστική σημασία των συντελεστών πιθανότητας σφάλματος στην πράξη βασίζεται σε τρία βασικά επίπεδα.

Ως πρώτο επίπεδο θεωρείται το όριο στο οποίο η τιμή είναι 5%. Δηλαδή, η πιθανότητα λάθους δεν υπερβαίνει το επίπεδο σημαντικότητας του 5%. Αυτό σημαίνει ότι η εμπιστοσύνη στην άψογη και χωρίς σφάλματα συμπεράσματα που προκύπτουν με βάση τα στατιστικά ερευνητικά δεδομένα είναι 95%.

Το δεύτερο επίπεδο είναι το όριο του 1%. Κατά συνέπεια, αυτός ο αριθμός σημαίνει ότι μπορεί κανείς να καθοδηγηθεί από τα δεδομένα που λαμβάνονται κατά τους στατιστικούς υπολογισμούς με 99% εμπιστοσύνη.

Το τρίτο επίπεδο είναι 0,1%. Με αυτήν την τιμή, η πιθανότητα σφάλματος είναι ίση με ένα κλάσμα του ποσοστού, δηλαδή τα σφάλματα πρακτικά εξαλείφονται.

Τι είναι μια υπόθεση στη στατιστική;

Τα σφάλματα ως έννοια χωρίζονται σε δύο κατευθύνσεις, σχετικά με την αποδοχή ή την απόρριψη της μηδενικής υπόθεσης. Μια υπόθεση είναι μια έννοια πίσω από την οποία, σύμφωνα με τον ορισμό, βρίσκεται ένα σύνολο άλλων δεδομένων ή δηλώσεων. Περιγραφή δηλαδή της πιθανολογικής κατανομής κάτι που σχετίζεται με το αντικείμενο της στατιστικής λογιστικής.

Υπάρχουν δύο υποθέσεις σε απλούς υπολογισμούς - μηδέν και εναλλακτική. Η διαφορά μεταξύ τους είναι ότι η μηδενική υπόθεση βασίζεται στην ιδέα ότι δεν υπάρχουν θεμελιώδεις διαφορές μεταξύ των δειγμάτων που εμπλέκονται στον προσδιορισμό της στατιστικής σημασίας και η εναλλακτική υπόθεση είναι εντελώς αντίθετη. Δηλαδή, η εναλλακτική υπόθεση βασίζεται στην παρουσία σημαντικής διαφοράς στα δεδομένα του δείγματος.

Ποια είναι τα λάθη;

Τα σφάλματα ως έννοια στις στατιστικές εξαρτώνται άμεσα από την αποδοχή μιας ή άλλης υπόθεσης ως αληθινής. Μπορούν να χωριστούν σε δύο κατευθύνσεις ή τύπους:

  • ο πρώτος τύπος οφείλεται στην αποδοχή της μηδενικής υπόθεσης, η οποία αποδεικνύεται ψευδής.
  • το δεύτερο προκαλείται από την ακολουθία της εναλλακτικής.

Το πρώτο είδος σφάλματος ονομάζεται ψευδώς θετικό και εμφανίζεται αρκετά συχνά σε όλους τους τομείς όπου χρησιμοποιούνται στατιστικά δεδομένα. Αντίστοιχα, το σφάλμα του δεύτερου τύπου ονομάζεται ψευδώς αρνητικό.

Σε τι χρησιμοποιείται η παλινδρόμηση στις στατιστικές;

Η στατιστική σημασία της παλινδρόμησης είναι ότι μπορεί να χρησιμοποιηθεί για να προσδιοριστεί πόσο καλά το μοντέλο των διαφόρων εξαρτήσεων που υπολογίζεται με βάση τα δεδομένα αντιστοιχεί στην πραγματικότητα. σας επιτρέπει να προσδιορίσετε την επάρκεια ή την έλλειψη παραγόντων που πρέπει να λάβετε υπόψη και να βγάλετε συμπεράσματα.

Η τιμή παλινδρόμησης προσδιορίζεται συγκρίνοντας τα αποτελέσματα με τα δεδομένα που αναφέρονται στους πίνακες Fisher. Ή χρησιμοποιώντας ανάλυση διασποράς. Οι δείκτες παλινδρόμησης είναι σημαντικοί για σύνθετες στατιστικές μελέτες και υπολογισμούς που περιλαμβάνουν μεγάλο αριθμό μεταβλητών, τυχαία δεδομένα και πιθανές αλλαγές.

Η σημασία του αντίκτυπου είναι ουσιαστικά μια σύνθετη (ολοκληρωτική) αξιολόγηση. Ο προσδιορισμός της σημασίας της επίδρασης πραγματοποιείται σε διάφορα στάδια.

Στάδιο 1. Για να προσδιοριστεί η σημασία της επίδρασης σε μεμονωμένα συστατικά του φυσικού περιβάλλοντος, είναι απαραίτητο να χρησιμοποιηθούν πίνακες με κριτήρια επιπτώσεων (Πίνακες 5-1, 5-2 και 5-3). Η βαθμολογία σημαντικότητας επιπτώσεων καθορίζεται από τον τύπο 1.

Q i = Q i t x Qεγώ είμαι x Q i j

1 Το προσθετικό σύστημα χρησιμοποιήθηκε στην κοινωνικοοικονομική μεθοδολογία λόγω της παρουσίας μηδενικών τιμών που ακυρώνουν την εξίσωση κατά τον πολλαπλασιασμό σε μια ολοκληρωμένη εκτίμηση επιπτώσεων

φυσικό περιβάλλον

QΕγώ

βαθμολογία αξιολόγησης ολοκληρωμένης - σύνθετης για τον υπό εξέταση αντίκτυπο.

Qi t- βαθμολογία προσωρινής επίδρασης σε i-th συστατικό του φυσικού περιβάλλοντος·

Qi s- βαθμολογία χωρικής επίδρασης σε i-th συστατικό του φυσικού περιβάλλοντος·

Qi j- βαθμολογία έντασης κρούσης σε i-th συστατικό του φυσικού περιβάλλοντος.

Οι κατηγορίες σημαντικότητας είναι συνεπείς μεταξύ διαφορετικών συνιστωσών του φυσικού περιβάλλοντος και μπορεί ήδη να είναι συγκρίσιμες για τον προσδιορισμό της συνιστώσας του φυσικού περιβάλλοντος που θα έχει τις μεγαλύτερες επιπτώσεις.

Για τη διεξαγωγή ΜΠΕ, έχουν υιοθετηθεί τρεις κατηγορίες σημαντικότητας επιπτώσεων - ήσσονος σημασίας, μέτριο και σημαντικό, όπως φαίνεται στο πλαίσιο κειμένου 5.

Πλαίσιο κειμένου 5

Ένας αντίκτυπος χαμηλής σημασίας συμβαίνει όταν παρατηρούνται τα αποτελέσματα αλλά το μέγεθος του αντίκτυπου είναι αρκετά χαμηλό (με ή χωρίς μετριασμό) και είναι εντός αποδεκτών προτύπων ή οι υποδοχείς είναι χαμηλής ευαισθησίας/αξίας.
Ένας αντίκτυπος μέτριας σημασίας μπορεί να έχει ευρύ φάσμα, από ένα όριο κάτω από το οποίο ο αντίκτυπος είναι χαμηλός έως ένα επίπεδο που πλησιάζει στην υπέρβαση του νόμιμου ορίου. Όπου είναι δυνατόν, θα πρέπει να αποδεικνύονται στοιχεία μείωσης των επιπτώσεων μέτριας σημασίας.
Υψηλής σημασίας επιπτώσεις συμβαίνουν όταν γίνεται υπέρβαση των αποδεκτών ορίων ή όταν παρατηρούνται επιπτώσεις μεγάλου μεγέθους, ειδικά σε πολύτιμους/ευαίσθητους πόρους.


· επιπτώσεις στο έδαφος και στο υπέδαφος.

· επιπτώσεις στα επιφανειακά και θαλάσσια ύδατα.

· επιπτώσεις στα υπόγεια ύδατα.

· Επίπτωση στα ιζήματα του πυθμένα.

· επιπτώσεις στην ποιότητα του αέρα.

· επιπτώσεις στους βιολογικούς πόρους της θάλασσας και της ξηράς.

· επιπτώσεις στα τοπία.

· φυσικοί παράγοντες επιρροής (επιπτώσεις θορύβου, κραδασμοί κ.λπ.).

Εάν η σημασία της επίδρασης που προσδιορίζεται για μια συγκεκριμένη συνιστώσα του φυσικού περιβάλλοντος (ατμοσφαιρικός αέρας, άγρια ​​ζωή κ.λπ.) είναι η μόνη, τότε χρησιμοποιείται απευθείας για την αξιολόγηση της προκύπτουσας σημασίας της επίδρασης.

Στην πράξη, ένα στοιχείο του φυσικού περιβάλλοντος μπορεί να υπόκειται σε διαφορετικές επιπτώσεις από πολλαπλές πηγές, επομένως η προκύπτουσα εκτίμηση σημασίας για ένα συγκεκριμένο στοιχείο του φυσικού περιβάλλοντος χρησιμοποιείται για τον προσδιορισμό της σημασίας της επίπτωσης. Ανάλογα με τις βαθμολογίες που λαμβάνονται και τα κριτήρια σημαντικότητας, μπορεί να προσδιοριστεί η προκύπτουσα εκτίμηση σημασίας επιπτώσεων. Ένα παράδειγμα προσδιορισμού της προκύπτουσας σημασίας επιπτώσεων παρουσιάζεται στον Πίνακα 5-5.

7. Περιβαλλοντικός έλεγχος – ένα οικονομικό εργαλείο περιβαλλοντικής διαχείρισης

Ο περιβαλλοντικός έλεγχος είναι ένα οικονομικό εργαλείο για την περιβαλλοντική διαχείριση.

Ο οικονομικός μηχανισμός περιβαλλοντικής ρύθμισης είναι ένα σύνθετο πολυεπίπεδο σύστημα σχέσεων μεταξύ των επιχειρηματικών φορέων μεταξύ τους και με ανώτερες αρχές. Ο συνδετικός μοχλός αυτών των σχέσεων θα πρέπει να είναι ένας περιβαλλοντικός έλεγχος (ΕΑ) - ένα εργαλείο που περιλαμβάνει οργανωτικούς και οικονομικούς παράγοντες προστασίας του περιβάλλοντος. Σας επιτρέπει να επιλέξετε την καλύτερη επιλογή για δομές προστασίας του περιβάλλοντος, να οργανώσετε πληροφορίες και αναλυτικό έλεγχο για την κατάσταση και τον βαθμό λειτουργίας του εξοπλισμού προστασίας του περιβάλλοντος και να κάνετε μια οικονομική αξιολόγηση των σχεδιαζόμενων τεχνικών και τεχνολογικών βελτιώσεων.

Με βάση τους στόχους, τα χαρακτηριστικά της μεθοδολογίας ανάπτυξης και εφαρμογής του προγράμματος, προτείνουμε τον ακόλουθο ορισμό: Η ΕΑ είναι μια ανεξάρτητη μελέτη όλων των πτυχών της οικονομικής δραστηριότητας μιας βιομηχανικής επιχείρησης οποιασδήποτε μορφής ιδιοκτησίας για τον προσδιορισμό του μεγέθους του άμεσου ή έμμεσου αντίκτυπου για την κατάσταση του περιβάλλοντος. Στόχος του είναι η συμμόρφωση των περιβαλλοντικών δραστηριοτήτων με τις απαιτήσεις της νομοθεσίας και των κανονισμών, η βελτιστοποίηση της χρήσης των φυσικών πόρων, η μείωση και ο εξορθολογισμός της κατανάλωσης ενέργειας, η μείωση των αποβλήτων, η πρόληψη έκτακτων απορρίψεων, εκπομπών και ανθρωπογενών καταστροφών.

Δεδομένου ότι μιλάμε για τη μελέτη όλων των πτυχών της οικονομικής δραστηριότητας μιας επιχείρησης, η ΕΑ πρέπει να συνδυάσει και να επεκτείνει τα προγράμματα και τις μεθόδους ήδη υπαρχόντων τύπων ελέγχων - παραγωγή, χρηματοοικονομικές δραστηριότητες, έλεγχοι συμμόρφωσης.

Η έκθεση του περιβαλλοντικού ελεγκτή θα περιέχει τις ακόλουθες πληροφορίες:

o συμπεράσματα σχετικά με τη συμμόρφωση των περιβαλλοντικών και παραγωγικών δραστηριοτήτων με τη νομοθεσία και τους κανονισμούς·

o Συμπέρασμα σχετικά με την κατάσταση της χρηματοοικονομικής και οικονομικής αναφοράς, τη λογιστική, την επικαιρότητα και το ύψος των τρεχουσών περιβαλλοντικών πληρωμών, τη σκοπιμότητα της χρήσης των κεφαλαίων που διατίθενται για την προστασία του περιβάλλοντος·

o εκτίμηση των επιπτώσεων της ελεγχόμενης επιχείρησης στην κατάσταση του περιβάλλοντος, την υγεία του προσωπικού παραγωγής, την οικολογία στην περιοχή, δεδομένα για την παρουσία και το μέγεθος των εκπομπών (απορρίψεων) ρύπων, η παραγωγή των οποίων είναι περιορισμένη ή απαγορευμένη από τις διεθνείς υποχρεώσεις του κράτους·

o Αποτελέσματα ανάλυσης του ρυθμού αύξησης της παραγωγής προϊόντων και της ποσότητας των εκπομπών και των απορρίψεων ρύπων, της κατανάλωσης ενέργειας και υλικών πόρων·

o τα αποτελέσματα μιας συγκριτικής ανάλυσης των κύριων δεικτών των περιβαλλοντικών και παραγωγικών δραστηριοτήτων της ελεγχόμενης επιχείρησης και παρόμοιων επιχειρήσεων στην Ουκρανία και σε άλλες χώρες·

o αξιολόγηση του δυνητικού κινδύνου της ελεγχόμενης επιχείρησης σε περίπτωση έκτακτης ανάγκης, της αποτελεσματικότητας του αναπτυγμένου σχεδίου εργασίας για την εξάλειψη της πηγής του ατυχήματος, της διαθεσιμότητας των απαραίτητων υλικών και τεχνικών μέσων·

o συμπέρασμα σχετικά με την επαγγελματική επάρκεια των εργαζομένων στις περιβαλλοντικές υπηρεσίες της επιχείρησης, την παροχή σύγχρονων τεχνικών μέσων παρακολούθησης της συμμόρφωσης με τα επιτρεπτά επίπεδα ρύπανσης·

o ευαισθητοποίηση του διοικητικού και παραγωγικού προσωπικού σχετικά με την ποσότητα και τη φύση της περιβαλλοντικής ρύπανσης από την επιχείρησή τους, τη διαθεσιμότητα υλικών και ηθικών κινήτρων για τη μείωση του επιπέδου της ρύπανσης και την ενεργειακή και υλική ένταση των κατασκευασμένων προϊόντων.

Με βάση το συμπέρασμα του περιβαλλοντικού ελεγκτή, ένα συγκεκριμένο πρόβλημα (για παράδειγμα, η μείωση της ποσότητας ή της συγκέντρωσης ενός συγκεκριμένου ρυπογόνου συστατικού) μπορεί να λυθεί με διάφορες, συχνά εναλλακτικές, μεθόδους. Ανάλογα με τη ριζική φύση της απόφασης που ελήφθη και τη σοβαρότητα του προβλήματος, τα απαραίτητα μέτρα περιβαλλοντικής προστασίας μπορεί να κυμαίνονται από οργανωτικά μέτρα και αυξημένο έλεγχο της τεχνολογικής διαδικασίας και της λειτουργίας του εξοπλισμού προστασίας του περιβάλλοντος έως το κλείσιμο της επιχείρησης με την επακόλουθη επαναχρησιμοποίησή της. .

Ένας από τους σημαντικούς παράγοντες που συμβάλλουν στην ανάπτυξη της ΕΑ στον κόσμο είναι η διαδικασία υλοποίησης του προγράμματος. Στη διαδικασία διενέργειας περιβαλλοντικών ελέγχων, ο εντοπισμός και η τιμωρία των υπευθύνων απέχει πολύ από τον κύριο στόχο. Είναι πολύ πιο σημαντικό για τη διοίκηση της εταιρείας να εντοπίζει τα σημεία συμφόρησης σε όλους τους τομείς των δραστηριοτήτων της εγκατάστασης που έχουν, στον ένα ή τον άλλο βαθμό, αρνητικό αντίκτυπο στο περιβάλλον και να συμβάλει στη μείωσή τους. Η διενέργεια αντικειμενικής μελέτης είναι αδύνατη χωρίς στενή συνεργασία με το διοικητικό και παραγωγικό προσωπικό της επιχείρησης, δηλ. χωρίς να το μετατρέψει από ελεγχόμενο άτομο σε πλήρη σύντροφο, του οποίου η γνώμη και η επιχειρηματολογία λαμβάνεται υπόψη σε όλα τα στάδια της ΕΑ.

Η EA προειδοποιεί για μια κατάσταση όπου τα περιβαλλοντικά προβλήματα απασχολούν μόνο τη διοίκηση της εταιρείας, η οποία αναγκάζεται, με δική της ευθύνη, να κρύψει τις αρνητικές συνέπειες των παραγωγικών δραστηριοτήτων σε σημείο που η απόκρυψή τους να καταστεί αδύνατη και η εξάλειψή τους να συνεπάγεται νομική διαδικασίες και κυρώσεις. Για το σκοπό αυτό, συνιστάται η συμμετοχή του επιστημονικού δυναμικού της περιοχής, των εργαζομένων σε περιβαλλοντικές υπηρεσίες και χρηματοπιστωτικών ιδρυμάτων στην επίλυση περιβαλλοντικών προβλημάτων μιας συγκεκριμένης επιχείρησης.

Σύμφωνα με την Παγκόσμια Τράπεζα, η πιθανή αύξηση του κόστους του έργου που σχετίζεται με τις εκτιμήσεις περιβαλλοντικών επιπτώσεων και την επακόλουθη εξέταση των περιβαλλοντικών περιορισμών αποδίδει καρπούς σε 5-7 χρόνια κατά μέσο όρο. Η συμπερίληψη περιβαλλοντικών παραγόντων στη διαδικασία λήψης αποφάσεων στο στάδιο του σχεδιασμού είναι 3-4 φορές φθηνότερη από την επακόλουθη εγκατάσταση πρόσθετου εξοπλισμού επεξεργασίας και το κόστος της εξάλειψης των συνεπειών της χρήσης μη οικολογικής τεχνολογίας και εξοπλισμού είναι 30-35 φορές υψηλότερο από το κόστος που θα απαιτούνταν για την ανάπτυξη μιας φιλικής προς το περιβάλλον λύσης.καθαρή τεχνολογία και χρήση περιβαλλοντικά προηγμένου εξοπλισμού.

Μια αντικειμενική μελέτη του συνολικού αντίκτυπου μιας περιβαλλοντικά ελεγχόμενης επιχείρησης στην κατάσταση του περιβάλλοντος, λαμβάνοντας υπόψη τις απόψεις όλων των ενδιαφερομένων, θα βοηθήσει στην αποφυγή περαιτέρω επιδείνωσης της περιβαλλοντικής και οικονομικής κρίσης και στον καθορισμό των μεθόδων λήψης υπόψη περιβαλλοντικός παράγοντας κατά την ανάπτυξη στρατηγικών και τακτικών οικονομικής δραστηριότητας. Αυτό θα αυξήσει τη βιομηχανική ασφάλεια της επιχείρησης και, κατά συνέπεια, την επενδυτική της ελκυστικότητα.

Προσδιορισμός δεικτών σημαντικότητας μέσω κλίσης

Ένα νευρωνικό δίκτυο διπλής λειτουργίας μπορεί να υπολογίσει τη διαβάθμιση της συνάρτησης αξιολόγησης από τα σήματα εισόδου και τις εκπαιδεύσιμες παραμέτρους του δικτύου.

Ένας δείκτης της σημασίας μιας παραμέτρου κατά την επίλυση ενός παραδείγματος q-o θα είναι μια τιμή που δείχνει πόσο θα αλλάξει η τιμή της συνάρτησης αξιολόγησης λύσης από το δίκτυο ενός παραδείγματος q-o εάν η τρέχουσα τιμή της παραμέτρου w p αντικατασταθεί από την επιλεγμένη τιμή w p . Αυτή η ακριβής τιμή μπορεί να προσδιοριστεί κάνοντας μια αντικατάσταση και υπολογίζοντας την εκτίμηση του δικτύου. Ωστόσο, δεδομένου του μεγάλου αριθμού παραμέτρων δικτύου, ο υπολογισμός των δεικτών σημαντικότητας για όλες τις παραμέτρους θα πάρει πολύ χρόνο. Για να επιταχυνθεί η διαδικασία εκτίμησης των παραμέτρων σημαντικότητας, χρησιμοποιούνται διάφορες εκτιμήσεις αντί για ακριβείς τιμές. Ας εξετάσουμε την απλούστερη και πιο χρησιμοποιούμενη γραμμική εκτίμηση των δεικτών σημαντικότητας. Ας επεκτείνουμε τη συνάρτηση αξιολόγησης σε μια σειρά Taylor μέχρι όρους πρώτης τάξης:

όπου H 0 q είναι η τιμή της συνάρτησης αξιολόγησης για τη λύση του παραδείγματος q-o με w =w. Έτσι, ο δείκτης σημασίας της παραμέτρου p-o κατά την επίλυση ενός παραδείγματος q-o καθορίζεται από τον ακόλουθο τύπο:

Ο δείκτης σημαντικότητας (1) μπορεί να υπολογιστεί για διάφορα αντικείμενα. Τις περισσότερες φορές υπολογίζεται για τις παραμέτρους δικτύου που εκπαιδεύονται. Ωστόσο, ο δείκτης σημασίας του τύπου (1) ισχύει και για σήματα. Όπως αναφέρθηκε ήδη στο κεφάλαιο, όταν λειτουργεί αντίστροφα, το δίκτυο υπολογίζει πάντα δύο διανύσματα κλίσης - τη διαβάθμιση της συνάρτησης αξιολόγησης με βάση τις εκπαιδευμένες παραμέτρους του δικτύου και σε όλα τα σήματα δικτύου. Εάν η βαθμολογία σημαντικότητας υπολογίζεται για τον προσδιορισμό του λιγότερο σημαντικού νευρώνα, τότε θα πρέπει να υπολογιστεί η βαθμολογία σημαντικότητας της εξόδου του νευρώνα. Ομοίως, στο έργο του προσδιορισμού του λιγότερο σημαντικού σήματος εισόδου, είναι απαραίτητο να υπολογιστεί η σημασία αυτού του σήματος, και όχι το άθροισμα των σημαντικών βαρών των συνδέσεων στις οποίες εφαρμόζεται αυτό το σήμα.

Μέσος όρος πάνω από το σετ προπόνησης

Ο δείκτης σημασίας της παραμέτρου X q p εξαρτάται από το σημείο του χώρου παραμέτρων στο οποίο υπολογίζεται και από το παράδειγμα από το σετ εκπαίδευσης. Υπάρχουν δύο θεμελιωδώς διαφορετικές προσεγγίσεις για τη λήψη ενός δείκτη της σημασίας μιας παραμέτρου που δεν εξαρτάται από το παράδειγμα. Στην πρώτη προσέγγιση, θεωρείται ότι το εκπαιδευτικό σύνολο περιέχει πλήρεις πληροφορίες για όλα τα πιθανά παραδείγματα. Σε αυτήν την περίπτωση, ο δείκτης σημασίας νοείται ως μια τιμή που δείχνει πόσο θα αλλάξει η τιμή της συνάρτησης αξιολόγησης για το σετ εκπαίδευσης εάν η τρέχουσα τιμή της παραμέτρου w p αντικατασταθεί από την επιλεγμένη τιμή w p . Αυτή η τιμή υπολογίζεται χρησιμοποιώντας τον ακόλουθο τύπο:

Σε μια άλλη προσέγγιση, το σύνολο εκπαίδευσης θεωρείται ως τυχαίο δείγμα στο χώρο των παραμέτρων εισόδου. Σε αυτήν την περίπτωση, ο δείκτης σημασίας για ολόκληρο το σετ προπόνησης θα είναι το αποτέλεσμα κάποιου μέσου όρου για το σύνολο προπόνησης.

Υπάρχουν πολλές μέθοδοι υπολογισμού του μέσου όρου. Ας δούμε δύο από αυτά. Εάν, ως αποτέλεσμα του μέσου όρου, ο δείκτης σημαντικότητας πρέπει να δώσει μια μέση σημασία, τότε ένας τέτοιος δείκτης υπολογίζεται χρησιμοποιώντας τον ακόλουθο τύπο:

Εάν, ως αποτέλεσμα του μέσου όρου, ο δείκτης σημασίας πρέπει να δώσει μια τιμή που δεν υπερβαίνει τους δείκτες σημαντικότητας για μεμονωμένα παραδείγματα (η σημασία αυτής της παραμέτρου για ένα μεμονωμένο παράδειγμα δεν είναι μεγαλύτερη από O§ p), τότε υπολογίζεται ένας τέτοιος δείκτης χρησιμοποιώντας τον ακόλουθο τύπο:

Συσσώρευση δεικτών σημαντικότητας

Όλοι οι δείκτες σημασίας εξαρτώνται από το σημείο του χώρου παραμέτρων δικτύου στο οποίο υπολογίζονται και μπορεί να διαφέρουν πολύ όταν μετακινούνται από το ένα σημείο στο άλλο. Για τους δείκτες σημαντικότητας που υπολογίζονται χρησιμοποιώντας μια κλίση, αυτή η εξάρτηση είναι ακόμη ισχυρότερη, καθώς όταν εκπαιδεύονται χρησιμοποιώντας τη μέθοδο της πιο απότομης καθόδου (βλ. ενότητα ) σε δύο γειτονικά σημεία του χώρου παραμέτρων στον οποίο υπολογίστηκε η κλίση, οι διαβαθμίσεις είναι ορθογώνιες. Για την εξάλειψη της εξάρτησης από ένα σημείο στο χώρο, χρησιμοποιούνται δείκτες σημασίας που υπολογίζονται σε πολλά σημεία. Στη συνέχεια, υπολογίζεται ο μέσος όρος τους χρησιμοποιώντας τύπους παρόμοιους με τους (3) και (4). Το ζήτημα της επιλογής σημείων στον χώρο παραμέτρων για τον υπολογισμό των δεικτών σημαντικότητας συνήθως λύνεται απλά. Κατά τη διάρκεια πολλών βημάτων εκπαίδευσης για οποιαδήποτε από τις μεθόδους κλίσης, κάθε φορά που υπολογίζεται η κλίση, υπολογίζονται και οι βαθμολογίες σημαντικότητας. Ο αριθμός των βημάτων μάθησης κατά τη διάρκεια των οποίων συσσωρεύονται δείκτες σημασίας δεν πρέπει να είναι πολύ μεγάλος, καθώς με μεγάλο αριθμό βημάτων μάθησης, οι πρώτοι υπολογισμένοι δείκτες σημασίας δεν έχουν νόημα, ειδικά όταν χρησιμοποιείται ο μέσος όρος σύμφωνα με τον τύπο (4).

Από μια ανάλυση της βιβλιογραφίας και την εμπειρία της ομάδας NeuroComp, μπορούμε να διατυπώσουμε τις ακόλουθες εργασίες που μπορούν να επιλυθούν χρησιμοποιώντας αντίθετα νευρωνικά δίκτυα.

1. Απλοποίηση της αρχιτεκτονικής των νευρωνικών δικτύων.

2. Μείωση του αριθμού των σημάτων εισόδου.

3. Μείωση των παραμέτρων του νευρωνικού δικτύου σε ένα μικρό σύνολο επιλεγμένων τιμών.

4. Μειωμένες απαιτήσεις για την ακρίβεια των σημάτων εισόδου.

5. Απόκτηση ρητής γνώσης από δεδομένα.

Οι αλγόριθμοι αντίθεσης που συζητούνται σε αυτό το κεφάλαιο μας επιτρέπουν να επιλέξουμε το ελάχιστο απαιτούμενο σύνολο σημάτων εισόδου. Η χρήση ενός ελάχιστου συνόλου σημάτων εισόδου σάς επιτρέπει να οργανώσετε πιο οικονομικά την εργασία ενός νευρικού υπολογιστή. Ωστόσο, το μίνιμαλ σετ έχει τα μειονεκτήματά του. Δεδομένου ότι το σύνολο είναι ελάχιστο, οι πληροφορίες που μεταφέρονται από ένα από τα σήματα συνήθως δεν υποστηρίζονται από άλλα σήματα εισόδου. Αυτό οδηγεί στο γεγονός ότι εάν υπάρχει σφάλμα σε ένα σήμα εισόδου, το δίκτυο είναι λάθος με υψηλό βαθμό πιθανότητας. Με ένα υπερβολικό σύνολο σημάτων εισόδου, αυτό συνήθως δεν συμβαίνει, αφού οι πληροφορίες κάθε σήματος ενισχύονται (αντιγράφονται) από άλλα σήματα.

Έτσι, προκύπτει μια αντίφαση - η χρήση ενός αρχικού πλεονάζοντος συνόλου σημάτων είναι αντιοικονομική και η χρήση ενός ελάχιστου συνόλου σημάτων οδηγεί σε αυξημένο κίνδυνο σφαλμάτων. Σε αυτήν την περίπτωση, μια συμβιβαστική λύση είναι σωστή - είναι απαραίτητο να βρεθεί ένα ελάχιστο σύνολο στο οποίο όλες οι πληροφορίες αντιγράφονται. Αυτή η ενότητα εξετάζει μεθόδους για την κατασκευή τέτοιων συνόλων με αυξημένη αξιοπιστία. Επιπλέον, η κατασκευή διπλότυπων του δεύτερου είδους σάς επιτρέπει να προσδιορίσετε ποια από τα σήματα εισόδου δεν έχουν διπλότυπα στο αρχικό σύνολο σημάτων. Η συμπερίληψη ενός τέτοιου "μοναδικού" σήματος στο ελάχιστο σύνολο είναι ένα σήμα ότι όταν χρησιμοποιείτε ένα νευρωνικό δίκτυο για την επίλυση αυτού του προβλήματος, θα πρέπει να παρακολουθείτε προσεκτικά την ορθότητα της τιμής αυτού του σήματος.

Υπάρχουν δύο τύποι διαδικασιών αντίθεσης - αντίθεση με βάση τη σημασία των παραμέτρων και μη εξευτελιστική αντίθεση. Αυτή η ενότητα περιγράφει και τους δύο τύπους διαδικασιών αντίθεσης.

Αυτή η ενότητα περιγράφει μια μέθοδο για τον προσδιορισμό των δεικτών σημασίας των παραμέτρων και των σημάτων. Στη συνέχεια θα μιλήσουμε για τον προσδιορισμό της σημασίας των παραμέτρων. Οι δείκτες της σημασίας των σημάτων δικτύου προσδιορίζονται χρησιμοποιώντας τους ίδιους τύπους με τις παραμέτρους να αντικαθίστανται από σήματα.