Ý nghĩa thống kê. Câu hỏi thường gặp: Tầm quan trọng được xác định như thế nào? Ý nghĩa thống kê và giá trị p

Ý nghĩa thống kê của một kết quả (giá trị p) là thước đo ước tính về độ tin cậy vào “sự thật” của nó (theo nghĩa “tính đại diện của mẫu”). Nói một cách kỹ thuật hơn, giá trị p là thước đo thay đổi theo thứ tự độ lớn giảm dần theo độ tin cậy của kết quả. Giá trị p cao hơn tương ứng với mức độ tin cậy thấp hơn trong mối quan hệ giữa các biến được tìm thấy trong mẫu. Cụ thể, giá trị p biểu thị xác suất xảy ra lỗi liên quan đến việc khái quát hóa kết quả quan sát được cho toàn bộ tổng thể. Ví dụ: giá trị p là 0,05 (tức là 1/20) chỉ ra rằng có 5% khả năng mối quan hệ giữa các biến được tìm thấy trong mẫu chỉ là một đặc điểm ngẫu nhiên của mẫu. Nói cách khác, nếu một mối quan hệ nhất định không tồn tại trong một quần thể và bạn tiến hành các thí nghiệm tương tự nhiều lần, thì cứ khoảng 1 trong 20 lần lặp lại thí nghiệm, bạn sẽ mong đợi mối quan hệ tương tự hoặc mạnh mẽ hơn giữa các biến.

Trong nhiều nghiên cứu, giá trị p 0,05 được coi là “mức biên chấp nhận được” đối với mức độ sai sót.

Không có cách nào để tránh sự tùy tiện trong việc quyết định mức độ quan trọng nào thực sự được coi là “đáng kể”. Việc lựa chọn một mức ý nghĩa nhất định mà trên đó kết quả bị từ chối là sai là khá tùy tiện. Trong thực tế, quyết định cuối cùng thường phụ thuộc vào việc kết quả được dự đoán trước (tức là trước khi thí nghiệm được thực hiện) hay phát hiện ra hậu nghiệm do kết quả của nhiều phân tích và so sánh được thực hiện trên nhiều loại dữ liệu, cũng như trên truyền thống của lĩnh vực nghiên cứu. Thông thường, trong nhiều lĩnh vực, kết quả p 0,05 là giới hạn có ý nghĩa thống kê có thể chấp nhận được, nhưng cần nhớ rằng mức này vẫn bao gồm tỷ lệ lỗi khá lớn (5%). Kết quả có ý nghĩa ở mức p 0,01 thường được coi là có ý nghĩa thống kê và kết quả có mức p 0,005 hoặc p 0,001 thường được coi là rất có ý nghĩa. Tuy nhiên, cần hiểu rằng việc phân loại mức ý nghĩa này khá tùy tiện và chỉ là một thỏa thuận không chính thức được áp dụng trên cơ sở kinh nghiệm thực tế trong một lĩnh vực nghiên cứu cụ thể.

Như đã đề cập, độ lớn của mối quan hệ và độ tin cậy thể hiện hai đặc điểm khác nhau của mối quan hệ giữa các biến. Tuy nhiên, không thể nói chúng hoàn toàn độc lập. Nói chung, độ lớn của mối quan hệ (mối quan hệ) giữa các biến trong một mẫu có kích thước bình thường càng lớn thì độ tin cậy càng cao.

Nếu chúng ta giả định rằng không có mối quan hệ giữa các biến tương ứng trong tổng thể thì rất có thể chúng ta kỳ vọng rằng trong mẫu đang nghiên cứu cũng sẽ không có mối quan hệ giữa các biến này. Do đó, mối quan hệ được tìm thấy trong một mẫu càng chặt chẽ thì càng ít có khả năng mối quan hệ đó không tồn tại trong tổng thể mà nó được rút ra.

Cỡ mẫu ảnh hưởng đến tầm quan trọng của mối quan hệ. Nếu có ít quan sát thì tương ứng sẽ có ít tổ hợp giá trị có thể có cho các biến này và do đó xác suất vô tình phát hiện ra tổ hợp các giá trị cho thấy mối quan hệ chặt chẽ là tương đối cao.

Cách tính mức ý nghĩa thống kê. Giả sử bạn đã tính toán mức độ phụ thuộc giữa hai biến (như đã giải thích ở trên). Câu hỏi tiếp theo mà bạn phải đối mặt là: “Mối quan hệ này quan trọng đến mức nào?” Ví dụ: phương sai được giải thích 40% giữa hai biến có đủ để coi mối quan hệ là có ý nghĩa không? Câu trả lời: “tùy hoàn cảnh”. Cụ thể, ý nghĩa phụ thuộc chủ yếu vào kích thước mẫu. Như đã giải thích, trong các mẫu rất lớn, ngay cả những mối quan hệ rất yếu giữa các biến cũng sẽ có ý nghĩa, trong khi ở những mẫu nhỏ, ngay cả những mối quan hệ rất mạnh cũng không đáng tin cậy. Vì vậy, để xác định mức ý nghĩa thống kê, bạn cần có một hàm biểu thị mối quan hệ giữa “độ lớn” và “mức ý nghĩa” của mối quan hệ giữa các biến đối với từng cỡ mẫu. Hàm này sẽ cho bạn biết chính xác “khả năng đạt được mối quan hệ của một giá trị nhất định (hoặc nhiều hơn) trong một mẫu có kích thước nhất định, giả sử rằng không có mối quan hệ như vậy trong tổng thể”. Nói cách khác, hàm này sẽ cho biết mức ý nghĩa (giá trị p) và do đó xác suất bác bỏ sai giả định rằng một mối quan hệ nhất định không tồn tại trong tổng thể. Giả thuyết “thay thế” này (rằng không có mối quan hệ nào trong tổng thể) thường được gọi là giả thuyết không. Sẽ là lý tưởng nếu hàm tính xác suất sai số là tuyến tính và chỉ có hệ số góc khác nhau đối với các cỡ mẫu khác nhau. Thật không may, chức năng này phức tạp hơn nhiều và không phải lúc nào cũng giống hệt nhau. Tuy nhiên, trong hầu hết các trường hợp, dạng của nó đã được biết và có thể được sử dụng để xác định mức ý nghĩa trong nghiên cứu các mẫu có kích thước nhất định. Hầu hết các hàm này đều liên quan đến một lớp phân phối rất quan trọng được gọi là phân phối chuẩn.

Khi xây dựng mô hình hồi quy, câu hỏi đặt ra là xác định tầm quan trọng của các yếu tố có trong phương trình hồi quy (1). Xác định tầm quan trọng của một yếu tố có nghĩa là làm rõ câu hỏi về mức độ ảnh hưởng của yếu tố đó đến hàm phản ứng. Nếu trong quá trình giải bài toán kiểm tra tầm quan trọng của một thừa số mà thấy hệ số đó không có ý nghĩa thì có thể loại nó ra khỏi phương trình. Trong trường hợp này, hệ số được coi là không có tác động đáng kể đến hàm phản hồi. Nếu tầm quan trọng của yếu tố được xác nhận thì nó sẽ được giữ lại trong mô hình hồi quy. Người ta tin rằng trong trường hợp này, yếu tố này có ảnh hưởng không thể bỏ qua đến hàm phản hồi. Việc giải quyết câu hỏi về tầm quan trọng của các yếu tố tương đương với việc kiểm tra giả thuyết rằng hệ số hồi quy của các yếu tố này bằng 0. Như vậy, giả thuyết không sẽ có dạng: , trong đó là vectơ con của vectơ thứ nguyên (l*1). Hãy viết lại phương trình hồi quy ở dạng ma trận:

Y = Xb+e,(2)

Y– vectơ có kích thước n;

X- ma trận kích thước (p*n);

b là một vectơ có kích thước p.

Phương trình (2) có thể được viết lại thành:

Ở đâu Xđất X p - l - ma trận có kích thước tương ứng (n,l) và (n,p-l). Khi đó giả thuyết H 0 tương đương với giả thiết rằng

Hãy xác định giá trị nhỏ nhất của hàm số . Vì theo các giả thuyết tương ứng H 0 và H 1 = 1 - H 0, tất cả các tham số của một mô hình tuyến tính nhất định đều được ước tính, mức tối thiểu theo giả thuyết H 0 bằng

trong khi đối với H 1 thì nó bằng

Để kiểm tra giả thuyết không, chúng tôi tính toán số liệu thống kê , có phân phối Fisher với (l,n-p) bậc tự do và vùng tới hạn của H 0 được hình thành bằng 100*a phần trăm giá trị lớn nhất của F. Nếu F F cr - giả thuyết bị bác bỏ.

Tầm quan trọng của các yếu tố có thể được kiểm tra bằng phương pháp khác, độc lập với nhau. Phương pháp này dựa trên việc nghiên cứu khoảng tin cậy cho các hệ số của phương trình hồi quy. Hãy xác định phương sai của các hệ số, Các giá trị là các phần tử đường chéo của ma trận . Sau khi xác định được các ước tính về phương sai hệ số, khoảng tin cậy có thể được xây dựng để ước tính các hệ số phương trình hồi quy. Khoảng tin cậy cho mỗi ước tính sẽ là , trong đó là giá trị dạng bảng của tiêu chí của Học sinh về số bậc tự do mà phần tử được xác định và mức ý nghĩa đã chọn. Hệ số có số thứ i là có ý nghĩa nếu giá trị tuyệt đối của hệ số của hệ số này lớn hơn độ lệch được tính toán khi xây dựng khoảng tin cậy. Nói cách khác, hệ số có số i là có ý nghĩa nếu 0 không thuộc khoảng tin cậy được xây dựng cho ước lượng hệ số này. Trong thực tế, khoảng tin cậy ở một mức ý nghĩa nhất định càng hẹp thì chúng ta càng tự tin hơn về tầm quan trọng của yếu tố đó. Để kiểm tra tầm quan trọng của một yếu tố bằng bài kiểm tra của Học sinh, bạn có thể sử dụng công thức . Giá trị t-test được tính toán được so sánh với giá trị trong bảng ở mức ý nghĩa nhất định và số bậc tự do tương ứng. Phương pháp kiểm tra tầm quan trọng của các yếu tố này chỉ có thể được sử dụng nếu các yếu tố đó độc lập. Nếu có lý do để xem xét một số yếu tố phụ thuộc lẫn nhau thì phương pháp này chỉ có thể được sử dụng để xếp hạng các yếu tố theo mức độ ảnh hưởng của chúng đến hàm phản hồi. Việc kiểm tra ý nghĩa trong tình huống này phải được bổ sung bằng phương pháp dựa trên tiêu chí Fisher.

Vì vậy, bài toán kiểm tra tầm quan trọng của các yếu tố và giảm kích thước của mô hình trong trường hợp các yếu tố ảnh hưởng không đáng kể đến hàm phản hồi được xem xét. Hơn nữa ở đây sẽ là hợp lý khi xem xét vấn đề đưa các yếu tố bổ sung vào mô hình, theo nhà nghiên cứu, yếu tố này không được tính đến trong quá trình thử nghiệm, nhưng tác động của chúng đối với chức năng phản ứng là rất đáng kể. Giả sử rằng sau khi mô hình hồi quy được chọn

, ,

nhiệm vụ nảy sinh là đưa các yếu tố x j bổ sung vào mô hình sao cho mô hình với việc đưa các yếu tố này vào có dạng:

, (3)

Trong đó X là ma trận có kích thước n*p cấp p, Z là ma trận có kích thước n*g cấp g và các cột của ma trận Z độc lập tuyến tính với các cột của ma trận X, tức là. ma trận W có kích thước n*(p+g) có hạng (p+g). Biểu thức (3) sử dụng ký hiệu (X,Z)=W, . Có hai khả năng để xác định ước tính của các hệ số mô hình mới được đưa ra. Đầu tiên, bạn có thể tìm ước tính và ma trận phân tán của nó trực tiếp từ các mối quan hệ

Thống kê từ lâu đã trở thành một phần không thể thiếu trong cuộc sống. Mọi người gặp phải nó ở khắp mọi nơi. Dựa trên số liệu thống kê, các kết luận được rút ra về vị trí và loại bệnh phổ biến, nhu cầu nhiều hơn ở một khu vực cụ thể hoặc trong một bộ phận dân số nhất định. Ngay cả các chương trình chính trị của các ứng cử viên vào chính phủ cũng dựa trên điều này. Chúng cũng được các chuỗi bán lẻ sử dụng khi mua hàng và các nhà sản xuất được hướng dẫn bởi những dữ liệu này trong các ưu đãi của họ.

Thống kê có vai trò quan trọng trong đời sống xã hội và ảnh hưởng đến từng cá nhân dù là việc nhỏ. Ví dụ: nếu hầu hết mọi người thích quần áo tối màu ở một thành phố hoặc khu vực cụ thể, thì việc tìm một chiếc áo mưa màu vàng sáng có in hoa ở các cửa hàng bán lẻ địa phương sẽ vô cùng khó khăn. Nhưng số lượng nào tạo nên những dữ liệu này có tác động như vậy? Ví dụ, điều gì tạo nên “ý nghĩa thống kê”? Chính xác thì định nghĩa này có ý nghĩa gì?

Cái này là cái gì?

Thống kê như một môn khoa học bao gồm sự kết hợp của các đại lượng và khái niệm khác nhau. Một trong số đó là khái niệm “ý nghĩa thống kê”. Đây là tên giá trị của các biến trong đó xác suất xuất hiện của các chỉ số khác là không đáng kể.

Ví dụ, cứ 10 người thì có 9 người đi giày cao su khi đi dạo buổi sáng để hái nấm trong rừng mùa thu sau một đêm mưa. Khả năng một lúc nào đó 8 người trong số họ sẽ đi giày da đanh bằng vải canvas là không đáng kể. Vì vậy, trong ví dụ cụ thể này, số 9 là giá trị được gọi là “ý nghĩa thống kê”.

Theo đó, nếu chúng ta phát triển ví dụ thực tế sau đây, các cửa hàng giày mua ủng cao su với số lượng lớn hơn vào cuối mùa hè so với các thời điểm khác trong năm. Vì vậy, độ lớn của một giá trị thống kê có tác động đến cuộc sống hàng ngày.

Tất nhiên, trong các phép tính phức tạp, chẳng hạn như khi dự đoán sự lây lan của vi rút, một số lượng lớn các biến số sẽ được tính đến. Nhưng bản chất của việc xác định một chỉ số quan trọng của dữ liệu thống kê là tương tự nhau, bất kể độ phức tạp của phép tính và số lượng giá trị không đổi.

Nó được tính toán như thế nào?

Chúng được sử dụng khi tính giá trị của chỉ báo “có ý nghĩa thống kê” của phương trình. Nghĩa là, có thể lập luận rằng trong trường hợp này mọi thứ đều do toán học quyết định. Tùy chọn tính toán đơn giản nhất là một chuỗi các phép toán, bao gồm các tham số sau:

hai loại kết quả thu được từ các cuộc khảo sát hoặc nghiên cứu dữ liệu khách quan, ví dụ: số tiền mua hàng được thực hiện, ký hiệu là a và b;
chỉ báo cho cả hai nhóm - n;
giá trị phần của mẫu kết hợp - p;
khái niệm “sai số chuẩn” - SE.

Bước tiếp theo là xác định chỉ số kiểm tra chung - t, giá trị của nó được so sánh với số 1,96. 1,96 là giá trị trung bình đại diện cho phạm vi 95% theo hàm phân phối t của Sinh viên.

Câu hỏi thường đặt ra là sự khác biệt giữa giá trị của n và p là gì. Sắc thái này có thể dễ dàng được làm rõ bằng cách sử dụng một ví dụ. Giả sử chúng ta đang tính toán ý nghĩa thống kê của mức độ trung thành đối với một sản phẩm hoặc thương hiệu đối với nam và nữ.

Trong trường hợp này, các ký hiệu chữ cái sẽ được theo sau như sau:

n - số lượng người trả lời;
p - số người hài lòng với sản phẩm.

Số phụ nữ được phỏng vấn trong trường hợp này sẽ được ký hiệu là n1. Theo đó, có n2 người đàn ông. Các số “1” và “2” cho ký hiệu p sẽ có ý nghĩa tương tự.

So sánh chỉ số kiểm tra với giá trị trung bình trong bảng tính toán của Học sinh trở thành cái gọi là “ý nghĩa thống kê”.

Xác minh có nghĩa là gì?

Kết quả của bất kỳ phép tính toán học nào luôn có thể được kiểm tra, trẻ em được dạy điều này ở trường tiểu học. Thật hợp lý khi cho rằng vì các chỉ số thống kê được xác định bằng cách sử dụng một chuỗi tính toán nên chúng được kiểm tra.

Tuy nhiên, việc kiểm tra ý nghĩa thống kê không chỉ liên quan đến toán học. Thống kê liên quan đến một số lượng lớn các biến và xác suất khác nhau, không phải lúc nào cũng có thể tính toán được. Nghĩa là, nếu chúng ta quay lại ví dụ về giày cao su ở đầu bài viết, thì việc xây dựng hợp lý dữ liệu thống kê mà người mua hàng tại cửa hàng sẽ dựa vào có thể bị gián đoạn do thời tiết khô và nóng, điều này không điển hình cho mùa thu. Hậu quả của hiện tượng này là lượng người mua ủng cao su sẽ giảm, các cửa hàng bán lẻ sẽ thua lỗ. Tất nhiên, một công thức toán học không thể dự đoán được sự bất thường của thời tiết. Khoảnh khắc này được gọi là “sai lầm”.

Chính xác suất xảy ra những sai sót như vậy sẽ được tính đến khi kiểm tra mức ý nghĩa được tính toán. Nó tính đến cả các chỉ số được tính toán và mức ý nghĩa được chấp nhận, cũng như các giá trị thường được gọi là giả thuyết.

Mức ý nghĩa là gì?

Khái niệm “mức độ” được đưa vào tiêu chí chính về ý nghĩa thống kê. Nó được sử dụng trong thống kê ứng dụng và thực tế. Đây là một loại giá trị có tính đến khả năng xảy ra sai lệch hoặc sai sót.

Cấp độ này dựa trên việc xác định sự khác biệt trong các mẫu làm sẵn và cho phép chúng tôi thiết lập tầm quan trọng của chúng hoặc ngược lại, tính ngẫu nhiên. Khái niệm này không chỉ có ý nghĩa kỹ thuật số mà còn có những cách giải mã độc đáo. Họ giải thích cách hiểu giá trị và mức độ được xác định bằng cách so sánh kết quả với chỉ số trung bình, điều này cho thấy mức độ tin cậy của sự khác biệt.

Do đó, chúng ta có thể hình dung khái niệm mức độ một cách đơn giản - đó là một chỉ báo về sai sót hoặc sai sót có thể chấp nhận được trong các kết luận rút ra từ dữ liệu thống kê thu được.

Mức ý nghĩa nào được sử dụng?

Ý nghĩa thống kê của hệ số xác suất xảy ra sai sót trong thực tế dựa trên ba cấp độ cơ bản.

Mức đầu tiên được coi là ngưỡng mà giá trị là 5%. Nghĩa là xác suất xảy ra sai sót không vượt quá mức ý nghĩa 5%. Điều này có nghĩa là độ tin cậy vào tính hoàn hảo và kết luận không có sai sót được đưa ra dựa trên dữ liệu nghiên cứu thống kê là 95%.

Cấp độ thứ hai là ngưỡng 1%. Theo đó, con số này có nghĩa là người ta có thể được hướng dẫn bởi dữ liệu thu được trong quá trình tính toán thống kê với độ tin cậy 99%.

Mức thứ ba là 0,1%. Với giá trị này, xác suất xảy ra lỗi bằng một phần trăm, nghĩa là các lỗi được loại bỏ trên thực tế.

Giả thuyết trong thống kê là gì?

Sai sót như một khái niệm được chia thành hai hướng, liên quan đến việc chấp nhận hoặc bác bỏ giả thuyết không. Giả thuyết là một khái niệm mà đằng sau đó, theo định nghĩa, là một tập hợp các dữ liệu hoặc tuyên bố khác. Tức là mô tả phân bố xác suất của một điều gì đó liên quan đến chủ đề kế toán thống kê.

Có hai giả thuyết trong các phép tính đơn giản - bằng 0 và thay thế. Sự khác biệt giữa chúng là giả thuyết khống dựa trên ý tưởng rằng không có sự khác biệt cơ bản giữa các mẫu liên quan đến việc xác định ý nghĩa thống kê và giả thuyết thay thế hoàn toàn ngược lại. Nghĩa là, giả thuyết thay thế dựa trên sự hiện diện của sự khác biệt đáng kể trong dữ liệu mẫu.

Các lỗi là gì?

Sai sót như một khái niệm trong thống kê phụ thuộc trực tiếp vào việc chấp nhận giả thuyết này hay giả thuyết khác là đúng. Chúng có thể được chia thành hai hướng hoặc loại:

loại thứ nhất là do chấp nhận giả thuyết không, hóa ra là sai;
thứ hai là do làm theo giải pháp thay thế.

Loại lỗi đầu tiên được gọi là dương tính giả và xảy ra khá thường xuyên ở tất cả các lĩnh vực sử dụng dữ liệu thống kê. Theo đó, lỗi thuộc loại thứ hai được gọi là âm tính giả.

Hồi quy được sử dụng để làm gì trong thống kê?

Ý nghĩa thống kê của hồi quy là nó có thể được sử dụng để xác định xem mô hình của các phụ thuộc khác nhau được tính toán dựa trên dữ liệu có phù hợp với thực tế hay không; cho phép bạn xác định sự đầy đủ hoặc thiếu các yếu tố để tính đến và đưa ra kết luận.

Giá trị hồi quy được xác định bằng cách so sánh kết quả với dữ liệu được liệt kê trong bảng Fisher. Hoặc sử dụng phân tích phương sai. Các chỉ số hồi quy rất quan trọng đối với các nghiên cứu và tính toán thống kê phức tạp liên quan đến một số lượng lớn các biến, dữ liệu ngẫu nhiên và những thay đổi có thể xảy ra.

Tầm quan trọng của tác động về cơ bản là một đánh giá phức tạp (toàn bộ). Việc xác định tầm quan trọng của tác động được thực hiện theo nhiều giai đoạn.

Giai đoạn 1. Để xác định mức độ tác động đối với từng thành phần riêng lẻ của môi trường tự nhiên, cần sử dụng các bảng có tiêu chí tác động (Bảng 5-1, 5-2 và 5-3). Điểm ý nghĩa tác động được xác định theo công thức 1.

Q tôi = Q tôi t x Q tôi là x Q tôi j

1 Hệ phụ gia được sử dụng trong phương pháp kinh tế xã hội do có các giá trị 0 làm mất hiệu lực của phương trình trong quá trình nhân trong đánh giá tác động toàn diện

môi trường tự nhiên

Q Tôi

tích hợp - điểm đánh giá phức tạp về tác động đang được xem xét;

Tề t- điểm tác động tạm thời lên thứ-thứ thành phần của môi trường tự nhiên;

Tề- Điểm tác động không gian lên thứ-thứ thành phần của môi trường tự nhiên;

Tề j- điểm cường độ tác động lên thứ-thứ thành phần của môi trường tự nhiên.

Các hạng mục quan trọng nhất quán giữa các thành phần khác nhau của môi trường tự nhiên và có thể có thể so sánh được để xác định thành phần môi trường tự nhiên sẽ chịu tác động lớn nhất.

Để tiến hành ĐTM, ba loại tác động có ý nghĩa đã được thông qua - nhỏ, vừa và đáng kể, như được hiển thị trong Hộp văn bản 5.

Khung văn bản 5

Tác động có mức độ nghiêm trọng thấp xảy ra khi các tác động đã xảy ra nhưng cường độ tác động đủ thấp (có hoặc không có biện pháp giảm nhẹ) và nằm trong tiêu chuẩn có thể chấp nhận được hoặc các bên tiếp nhận có độ nhạy/giá trị thấp.

Tác động có mức độ nghiêm trọng vừa phải có thể có phạm vi rộng, từ dưới ngưỡng tác động thấp đến mức gần vi phạm giới hạn pháp lý. Khi có thể, cần chứng minh bằng chứng về việc giảm tác động ở mức độ vừa phải.

Tác động có ý nghĩa lớn xảy ra khi vượt quá giới hạn chấp nhận được hoặc khi quan sát thấy tác động có cường độ lớn, đặc biệt là đối với các nguồn tài nguyên có giá trị/nhạy cảm.

· tác động đến đất và lòng đất;

· Tác động đến nước mặt và nước biển;

· Tác động đến nước ngầm;

· Tác động đến trầm tích đáy;

· tác động đến chất lượng không khí;

· Tác động đến tài nguyên sinh vật biển và đất liền;

· Tác động đến cảnh quan;

· Các yếu tố ảnh hưởng vật lý (tác động của tiếng ồn, độ rung, v.v.).

Nếu tầm quan trọng của tác động được xác định đối với một thành phần cụ thể của môi trường tự nhiên (không khí, động vật hoang dã, v.v.) là thành phần duy nhất thì nó được sử dụng trực tiếp để đánh giá tầm quan trọng sau đó của tác động.

Trong thực tế, một thành phần của môi trường tự nhiên có thể chịu tác động khác nhau từ nhiều nguồn, do đó việc đánh giá tầm quan trọng đối với một thành phần cụ thể của môi trường tự nhiên được sử dụng để xác định tầm quan trọng của tác động. Tùy thuộc vào điểm số đạt được và tiêu chí quan trọng, có thể xác định được kết quả đánh giá tầm quan trọng của tác động. Một ví dụ về việc xác định tầm quan trọng của tác động được trình bày trong Bảng 5-5.

7. Kiểm toán môi trường – công cụ kinh tế trong quản lý môi trường

Kiểm toán môi trường là một công cụ kinh tế để quản lý môi trường.

Cơ chế kinh tế điều tiết môi trường là một hệ thống quan hệ đa cấp phức tạp giữa các chủ thể kinh doanh với nhau và với các cơ quan cấp trên. Đòn bẩy kết nối các mối quan hệ này phải là kiểm toán môi trường (EA) - một công cụ bao gồm các yếu tố tổ chức và kinh tế của bảo vệ môi trường. Nó cho phép bạn chọn phương án tốt nhất cho các cấu trúc bảo vệ môi trường, tổ chức thông tin và kiểm soát phân tích về tình trạng và mức độ hoạt động của thiết bị bảo vệ môi trường, đồng thời đưa ra đánh giá kinh tế về các cải tiến kỹ thuật và công nghệ theo kế hoạch.

Dựa trên mục tiêu, đặc điểm của phương pháp phát triển và thực hiện chương trình, chúng tôi đề xuất định nghĩa sau: EA là một nghiên cứu độc lập về tất cả các khía cạnh hoạt động kinh tế của một doanh nghiệp công nghiệp thuộc bất kỳ hình thức sở hữu nào để xác định quy mô của tác động trực tiếp hoặc gián tiếp về hiện trạng môi trường. Mục tiêu của nó là đưa các hoạt động môi trường tuân thủ các yêu cầu của pháp luật và quy định, tối ưu hóa việc sử dụng tài nguyên thiên nhiên, giảm thiểu và hợp lý hóa việc tiêu thụ năng lượng, giảm chất thải, ngăn chặn xả thải khẩn cấp, khí thải và thảm họa do con người tạo ra.

Vì chúng ta đang nói về việc nghiên cứu tất cả các khía cạnh của hoạt động kinh tế của doanh nghiệp, EA phải kết hợp và mở rộng các chương trình và phương pháp của các loại kiểm toán hiện có - hoạt động sản xuất, tài chính, kiểm toán tuân thủ.

Báo cáo của kiểm toán viên môi trường sẽ bao gồm các thông tin sau:

o kết luận về sự tuân thủ của các hoạt động sản xuất và môi trường với pháp luật và các quy định;

o kết luận về tình trạng báo cáo tài chính và kinh tế, kế toán, tính kịp thời và số tiền thanh toán môi trường hiện tại, mục đích sử dụng vốn được phân bổ cho bảo vệ môi trường;

o đánh giá tác động của doanh nghiệp được kiểm toán đến tình trạng môi trường, sức khỏe của nhân viên sản xuất, hệ sinh thái trong khu vực, dữ liệu về sự hiện diện và mức độ phát thải (thải thải) các chất gây ô nhiễm mà việc sản xuất bị hạn chế hoặc bị cấm theo nghĩa vụ quốc tế của nhà nước;

o kết quả phân tích tốc độ tăng trưởng sản xuất sản phẩm và lượng phát thải, thải ra các chất gây ô nhiễm, tiêu thụ năng lượng, tài nguyên vật chất;

o kết quả phân tích so sánh các chỉ số chính về hoạt động sản xuất và môi trường của doanh nghiệp được kiểm toán và các doanh nghiệp tương tự ở Ukraine và các quốc gia khác;

o đánh giá mối nguy hiểm tiềm ẩn của doanh nghiệp được kiểm toán trong trường hợp khẩn cấp, tính hiệu quả của kế hoạch làm việc đã xây dựng nhằm loại bỏ nguồn gốc của vụ tai nạn, sự sẵn có của các phương tiện vật chất và kỹ thuật cần thiết;

o kết luận về năng lực chuyên môn của nhân viên dịch vụ môi trường của doanh nghiệp, việc họ cung cấp các phương tiện kỹ thuật hiện đại để giám sát việc tuân thủ mức ô nhiễm cho phép;

o nhận thức của nhân viên quản lý và sản xuất về số lượng và tính chất ô nhiễm môi trường do doanh nghiệp của họ gây ra, sự sẵn có của các động cơ vật chất và tinh thần để giảm mức độ ô nhiễm cũng như cường độ năng lượng và vật chất của các sản phẩm được sản xuất.

Dựa trên kết luận của kiểm toán viên môi trường, một vấn đề cụ thể (ví dụ, giảm lượng hoặc nồng độ của một thành phần gây ô nhiễm nhất định) có thể được giải quyết bằng nhiều phương pháp khác nhau, thường là thay thế. Tùy thuộc vào bản chất căn bản của quyết định được đưa ra và mức độ nghiêm trọng của vấn đề, các biện pháp bảo vệ môi trường cần thiết có thể bao gồm từ các biện pháp tổ chức và tăng cường kiểm soát quy trình công nghệ và vận hành thiết bị bảo vệ môi trường cho đến việc đóng cửa doanh nghiệp và sau đó tái sử dụng nó. .

Một trong những yếu tố quan trọng góp phần vào sự phát triển của EA trên thế giới là quy trình thực hiện chương trình. Trong quá trình tiến hành kiểm toán môi trường, việc xác định và trừng phạt những người chịu trách nhiệm không phải là mục tiêu chính. Điều quan trọng hơn nhiều đối với ban quản lý công ty là xác định những điểm nghẽn trong tất cả các lĩnh vực hoạt động của cơ sở, ở mức độ này hay mức độ khác, có tác động tiêu cực đến môi trường và hỗ trợ giảm thiểu nó. Không thể thực hiện một nghiên cứu khách quan nếu không có sự hợp tác chặt chẽ với nhân viên quản lý và sản xuất của doanh nghiệp, tức là. mà không biến nó từ một người bị kiểm soát thành một đối tác đầy đủ, ý kiến và lập luận của họ được tính đến ở tất cả các giai đoạn của EA.

EA cảnh báo về một tình huống mà các vấn đề môi trường chỉ được ban quản lý công ty quan tâm, những người buộc phải tự mình che giấu những hậu quả tiêu cực của hoạt động sản xuất đến mức không thể che giấu được và việc loại bỏ chúng sẽ đòi hỏi phải tuân thủ pháp luật. thủ tục tố tụng và hình phạt. Vì mục đích này, nên huy động tiềm năng khoa học của khu vực, nhân viên dịch vụ môi trường và các tổ chức tài chính vào việc giải quyết các vấn đề môi trường của một doanh nghiệp cụ thể.

Theo Ngân hàng Thế giới, chi phí dự án có thể tăng lên liên quan đến đánh giá tác động môi trường và việc xem xét các hạn chế về môi trường sau đó sẽ được đền đáp trong trung bình 5-7 năm. Việc đưa các yếu tố môi trường vào quy trình ra quyết định ở giai đoạn thiết kế rẻ hơn 3-4 lần so với việc lắp đặt thêm thiết bị xử lý tiếp theo và chi phí loại bỏ hậu quả của việc sử dụng công nghệ và thiết bị phi sinh thái là 30-35 lần. cao hơn chi phí cần thiết để phát triển một giải pháp thân thiện với môi trường, công nghệ sạch và sử dụng thiết bị tiên tiến thân thiện với môi trường.

Một nghiên cứu khách quan về tác động toàn diện của doanh nghiệp được kiểm toán môi trường đến hiện trạng môi trường, có tính đến ý kiến của tất cả các bên quan tâm, sẽ giúp tránh làm trầm trọng thêm cuộc khủng hoảng kinh tế và môi trường, đồng thời xác định các phương pháp có tính đến yếu tố môi trường khi xây dựng chiến lược và chiến thuật hoạt động kinh tế. Điều này sẽ làm tăng tính an toàn công nghiệp của doanh nghiệp và do đó tăng tính hấp dẫn đầu tư của doanh nghiệp.

Xác định các chỉ số ý nghĩa thông qua độ dốc

Mạng thần kinh chức năng kép có thể tính toán độ dốc của hàm đánh giá từ các tín hiệu đầu vào và các tham số có thể huấn luyện của mạng.

Một chỉ báo về tầm quan trọng của tham số khi giải ví dụ q-o sẽ là giá trị cho biết giá trị của hàm đánh giá lời giải theo mạng của ví dụ q-o sẽ thay đổi bao nhiêu nếu giá trị hiện tại của tham số w p được thay thế bằng giá trị đã chọn giá trị w p . Giá trị chính xác này có thể được xác định bằng cách thay thế và tính toán ước tính mạng. Tuy nhiên, với số lượng lớn các tham số mạng, việc tính toán các chỉ số ý nghĩa cho tất cả các tham số sẽ mất rất nhiều thời gian. Để tăng tốc quá trình ước tính các tham số có ý nghĩa, nhiều ước tính khác nhau được sử dụng thay cho các giá trị chính xác. Hãy xem xét ước tính tuyến tính đơn giản nhất và được sử dụng nhiều nhất của các chỉ số quan trọng. Chúng ta hãy mở rộng hàm đánh giá thành chuỗi Taylor đến các số hạng bậc nhất:

trong đó H 0 q là giá trị của hàm đánh giá cho nghiệm của ví dụ q-o với w = w. Như vậy, chỉ báo ý nghĩa của tham số p-o khi giải ví dụ q-o được xác định theo công thức sau:

Chỉ báo ý nghĩa (1) có thể được tính cho nhiều đối tượng khác nhau. Nó thường được tính toán cho các tham số mạng đang được huấn luyện. Tuy nhiên, chỉ báo ý nghĩa loại (1) cũng có thể áp dụng cho tín hiệu. Như đã lưu ý trong chương, khi hoạt động ngược lại, mạng luôn tính toán hai vectơ độ dốc - độ dốc của hàm đánh giá dựa trên các tham số mạng đã được huấn luyện và trên tất cả các tín hiệu mạng. Nếu điểm ý nghĩa được tính toán để xác định nơ-ron ít quan trọng nhất thì cần tính điểm ý nghĩa của đầu ra của nơ-ron đó. Tương tự, trong nhiệm vụ xác định tín hiệu đầu vào ít quan trọng nhất, cần tính toán tầm quan trọng của tín hiệu này chứ không phải tổng ý nghĩa của trọng số của các kết nối mà tín hiệu này được áp dụng.

Tính trung bình trên tập huấn luyện

Chỉ báo ý nghĩa của tham số X q p phụ thuộc vào điểm trong không gian tham số mà tại đó nó được tính toán và vào ví dụ từ tập huấn luyện. Có hai cách tiếp cận cơ bản khác nhau để thu được chỉ báo về tầm quan trọng của một tham số không phụ thuộc vào ví dụ. Trong cách tiếp cận đầu tiên, giả định rằng tập huấn luyện chứa thông tin đầy đủ về tất cả các ví dụ có thể. Trong trường hợp này, chỉ báo ý nghĩa được hiểu là giá trị cho biết giá trị của hàm đánh giá đối với tập huấn luyện sẽ thay đổi bao nhiêu nếu giá trị hiện tại của tham số w p được thay thế bằng giá trị đã chọn w p . Giá trị này được tính bằng công thức sau:

Trong một cách tiếp cận khác, tập huấn luyện được coi là mẫu ngẫu nhiên trong không gian các tham số đầu vào. Trong trường hợp này, chỉ số có ý nghĩa trên toàn bộ tập huấn luyện sẽ là kết quả của một số tính trung bình trên tập huấn luyện.

Có nhiều phương pháp tính trung bình. Chúng ta hãy nhìn vào hai trong số họ. Nếu, do tính trung bình, chỉ báo tầm quan trọng phải có ý nghĩa trung bình thì chỉ báo đó được tính bằng công thức sau:

Nếu, do tính trung bình, chỉ báo ý nghĩa sẽ đưa ra một giá trị không vượt quá các chỉ báo ý nghĩa cho các ví dụ riêng lẻ (tầm quan trọng của tham số này đối với một ví dụ riêng lẻ không lớn hơn O§ p), thì chỉ báo đó được tính toán sử dụng công thức sau:

Tích lũy các chỉ số ý nghĩa

Tất cả các chỉ báo quan trọng đều phụ thuộc vào điểm trong không gian tham số mạng mà chúng được tính toán và có thể khác nhau rất nhiều khi di chuyển từ điểm này sang điểm khác. Đối với các chỉ số ý nghĩa được tính toán bằng cách sử dụng độ dốc, sự phụ thuộc này thậm chí còn mạnh hơn, vì khi được huấn luyện bằng phương pháp giảm độ dốc cao nhất (xem phần ) tại hai điểm liền kề trong không gian tham số mà tại đó độ dốc được tính toán, độ dốc là trực giao. Để loại bỏ sự phụ thuộc vào một điểm trong không gian, người ta sử dụng các chỉ số ý nghĩa được tính toán tại một số điểm. Tiếp theo, chúng được tính trung bình bằng các công thức tương tự như (3) và (4). Bài toán chọn điểm trong không gian tham số để tính các chỉ số có ý nghĩa thường được giải quyết một cách đơn giản. Trải qua một số bước huấn luyện cho bất kỳ phương pháp gradient nào, mỗi lần tính gradient, điểm ý nghĩa cũng được tính toán. Số bước học trong quá trình tích lũy các chỉ số ý nghĩa không được quá lớn, vì với số bước học lớn, các chỉ số ý nghĩa được tính toán đầu tiên sẽ trở nên vô nghĩa, đặc biệt khi sử dụng tính trung bình theo công thức (4).

Từ phân tích tài liệu và kinh nghiệm của nhóm NeuroComp, chúng ta có thể hình thành các nhiệm vụ sau có thể được giải quyết bằng cách sử dụng các mạng thần kinh tương phản.

1. Đơn giản hóa kiến trúc mạng nơ-ron.

2. Giảm số lượng tín hiệu đầu vào.

3. Giảm các tham số của mạng nơ-ron thành một tập hợp nhỏ các giá trị đã chọn.

4. Giảm yêu cầu về độ chính xác của tín hiệu đầu vào.

5. Thu thập kiến thức rõ ràng từ dữ liệu.

Các thuật toán tương phản được thảo luận trong chương này cho phép chúng ta chọn tập hợp tín hiệu đầu vào yêu cầu tối thiểu. Việc sử dụng một bộ tín hiệu đầu vào tối thiểu cho phép bạn tổ chức công việc của máy tính thần kinh một cách tiết kiệm hơn. Tuy nhiên, bộ tối thiểu có nhược điểm của nó. Vì tập hợp là tối thiểu nên thông tin được mang bởi một trong các tín hiệu thường không được hỗ trợ bởi các tín hiệu đầu vào khác. Điều này dẫn đến thực tế là nếu có lỗi ở một tín hiệu đầu vào thì khả năng cao là mạng sẽ bị nhầm lẫn. Với bộ tín hiệu đầu vào quá mức, điều này thường không xảy ra, vì thông tin của từng tín hiệu được củng cố (sao chép) bởi các tín hiệu khác.

Do đó, nảy sinh mâu thuẫn - việc sử dụng bộ tín hiệu dự phòng ban đầu là không kinh tế và việc sử dụng bộ tín hiệu tối thiểu sẽ làm tăng nguy cơ sai sót. Trong tình huống này, giải pháp thỏa hiệp là đúng - cần phải tìm một tập hợp tối thiểu trong đó tất cả thông tin được sao chép. Phần này thảo luận về các phương pháp xây dựng các bộ như vậy với độ tin cậy cao hơn. Ngoài ra, việc xây dựng các bản sao loại thứ hai cho phép bạn xác định tín hiệu đầu vào nào không có bản sao trong bộ tín hiệu ban đầu. Việc đưa tín hiệu “duy nhất” như vậy vào tập tối thiểu là tín hiệu cho thấy khi sử dụng mạng thần kinh để giải quyết vấn đề này, bạn nên theo dõi cẩn thận tính chính xác của giá trị của tín hiệu này.

Có hai loại quy trình tương phản - tương phản dựa trên tầm quan trọng của các tham số và tương phản không suy giảm. Phần này mô tả cả hai loại thủ tục tương phản.

Phần này mô tả phương pháp xác định các chỉ số quan trọng của các tham số và tín hiệu. Tiếp theo chúng ta sẽ nói về việc xác định tầm quan trọng của các tham số. Các chỉ số về tầm quan trọng của tín hiệu mạng được xác định bằng công thức tương tự với các tham số được thay thế bằng tín hiệu.