Giá trị trung bình bị ảnh hưởng bởi các giá trị cực đoan

Nhà

Quảng cáo
Giá trị trung bình bị ảnh hưởng bởi các giá trị cực đoan

Những biện pháp nào của khuynh hướng trung tâm bị ảnh hưởng bởi những thái cực?

Câu hỏi

Mở trong ứng dụng

Dung dịch

Đề xuất sửa chữa

Đầu tiên

Câu hỏi tương tự

Q. Những thước đo nào của xu hướng trung tâm sẽ bị ảnh hưởng nếu các quan sát cực đoan ở cả hai đầu của dữ liệu được sắp xếp theo thứ tự giảm dần bị loại bỏ?

Q. Những biện pháp nào sau đây là biện pháp của khuynh hướng trung tâm.

Q. Thước đo xu hướng trung bình của giá trị trung bình bị ảnh hưởng bởi

Q.

Điều nào sau đây là / là thước đo của xu hướng trung tâm?

Q. Điều nào sau đây là / là các thước đo của xu hướng trung tâm:

Xem thêm

nếu bạn viết mẫu có nghĩa là $ \ bar x $ như một chức năng của một ngoại nhân $ O $thì độ nhạy của nó đối với giá trị của một giá trị ngoại lệ là $ d \ bar x (O) / dO = 1 / n $ở đâu $ n $ là một kích thước mẫu. điều tương tự đối với trung vị là 0, bởi vì việc thay đổi giá trị của một giá trị ngoại lệ thường không ảnh hưởng gì đến trung vị.

ví dụ để chứng minh ý tưởng: 1,4,100. trung bình mẫu là $ \ bar x = 35 $nếu bạn thay thế 100 bằng 1000, bạn nhận được
$ \ bar x = 335 $. trung vị giữ nguyên 4.

đây là giả định rằng ngoại lệ $ O $ không đúng ở giữa mẫu của bạn, nếu không, bạn có thể nhận được tác động lớn hơn từ một giá trị ngoại lai trên giá trị trung bình so với giá trị trung bình.

TL; DR;

thêm ngoại lệ

bạn có thể bị cám dỗ để đo tác động của một ngoại lệ bằng cách thêm nó vào mẫu thay vì thay thế một quan sát hợp lệ bằng một ngoại lệ. nó có thể được thực hiện, nhưng bạn phải cô lập tác động của sự thay đổi kích thước mẫu. nếu bạn không làm đúng, thì bạn có thể kết thúc với các ví dụ thực tế giả đối lập, một số trong số đó đã được đề xuất trong các câu trả lời ở đây. Tôi sẽ chỉ cho bạn cách làm chính xác, sau đó không chính xác.

Nghĩa $ x_n $ những thay đổi như sau khi bạn thêm một ngoại lệ $ O $ đến mẫu có kích thước $ n $: $$ \ bar x_ {n + O} – \ bar x_n = \ frac {n \ bar x_n + O} {n + 1} – \ bar x_n $$ Bây giờ, hãy tách phần đang thêm một quan sát mới $ x_ {n + 1} $ từ giá trị ngoại lệ thay đổi từ $ x_ {n + 1} $ to lớn $ O $. Chúng ta phải làm điều đó bởi vì theo định nghĩa, ngoại lệ là một quan sát không có cùng phân phối với phần còn lại của mẫu $ x_i $. Hãy nhớ rằng, ngoại lệ là không phải một quan sát lớn đơn thuần, mặc dù đó là cách chúng ta thường phát hiện ra chúng. Đó là một quan sát không thuộc về mẫu, và phải được loại bỏ khỏi nó vì lý do này. Đây là cách chúng tôi tách biệt hai bước: $$ \ bar x_ {n + O} – \ bar x_n = \ frac {n \ bar x_n + x_ {n + 1}} {n + 1} – \ bar x_n + \ frac {O-x_ {n + 1} } {n + 1} \\ = (\ bar x_ {n + 1} – \ bar x_n) + \ frac {O-x_ {n + 1}} {n + 1} $$

Bây giờ, chúng ta có thể thấy rằng thuật ngữ thứ hai $ \ frac {O-x_ {n + 1}} {n + 1} $ trong phương trình thể hiện tác động ngoại lệ lên giá trị trung bình và độ nhạy để chuyển một quan sát hợp pháp $ x_ {n + 1} $ thành một kẻ ngoại lai $ O $ là của đơn đặt hàng $ 1 / (n + 1) $, giống như trong trường hợp chúng tôi không thêm quan sát vào mẫu, tất nhiên. Lưu ý, rằng thuật ngữ đầu tiên $ \ bar x_ {n + 1} – \ bar x_n $đại diện cho quan sát bổ sung từ cùng một quần thể, trung bình bằng 0.

Nếu chúng ta áp dụng cùng một cách tiếp cận đối với trung vị $ \ bar {\ bar x} _n $ chúng tôi nhận được phương trình sau: $$ \ bar {\ bar x} _ {n + O} – \ bar {\ bar x} _n = (\ bar {\ bar x} _ {n + 1} – \ bar {\ bar x} _n) + 0 \ times (O-x_ {n + 1}) \\ = (\ bar {\ bar x} _ {n + 1} – \ bar {\ bar x} _n) $$ Nói cách khác, không có tác động nào từ việc thay thế quan sát hợp pháp $ x_ {n + 1} $ với một ngoại lệ $ O $và lý do duy nhất khiến trung bình $ \ bar {\ bar x} _n $ thay đổi là do lấy mẫu một quan sát mới từ cùng một phân phối.

một sự thật ngược lại, đó không phải là

Phân tích trong phần trước sẽ cung cấp cho chúng ta ý tưởng về cách xây dựng ví dụ thực tế phản đối giả: sử dụng $ n \ gg 1 $ để số hạng thứ hai trong biểu thức trung bình $ \ frac {O-x_ {n + 1}} {n + 1} $ nhỏ hơn tổng thay đổi trong trung vị. Đây là một ví dụ như vậy: “… dữ liệu của chúng tôi là 5000 cái và 5000 hàng trăm, và chúng tôi thêm hệ số -100 …”

Hãy chia ví dụ này thành các thành phần như đã giải thích ở trên. Như một ví dụ ngụ ý, các giá trị trong phân phối là 1s và 100s và -100 là một giá trị ngoại lệ. Vì vậy, chúng ta có thể cắm $ x_ {10001} = 1 $và nhìn vào giá trị trung bình: $$ \ bar x_ {10000 + O} – \ bar x_ {10000} = \ left (50,5- \ frac {505001} {10001} \ right) + \ frac {-100- \ frac {505001} {10001}} {10001} \\\ khoảng 0,00495-0,00150 \ khoảng 0,00345 $$ Thời hạn $ -0,00150 $ trong biểu thức trên là tác động của giá trị ngoại lệ. Nó nhỏ, như được thiết kế, nhưng nó là khác không.

Tương tự đối với trung vị: $$ \ bar {\ bar x} _ {10000 + O} – \ bar {\ bar x} _ {10000} = (\ bar {\ bar x} _ {10001} – \ bar {\ bar x} _ { 10000}) \\ = (1-50,5) = – 49,5 $$

Thì đấy! Chúng tôi đã tạo ra một sự thay đổi lớn ở trung vị trong khi trung bình hầu như không di chuyển. Tuy nhiên, nếu bạn theo dõi phân tích của tôi, bạn có thể thấy mẹo: toàn bộ thay đổi trong trung vị đến từ việc thêm một quan sát mới từ cùng một phân phối, không phải từ việc thay thế quan sát hợp lệ bằng một ngoại lệ, như mong đợi, bằng không.

một thực tế ngược lại, đó là

Bây giờ, điều gì sẽ là một thực tế ngược lại? Trong tất cả các phân tích trước đây, tôi cho rằng ngoại lệ $ O $ đứng của chúng tôi từ các quan sát hợp lệ với độ lớn của nó nằm ngoài phạm vi thông thường. Đây là những ngoại lệ mà chúng tôi thường phát hiện. Điều gì sẽ xảy ra nếu giá trị của nó nằm ngay giữa?

Hãy sửa đổi ví dụ trên: “… dữ liệu của chúng tôi là 5000 cái và 5000 hàng trăm, và chúng tôi thêm một số ngoại lệ là …” 20!

Hãy chia ví dụ này thành các thành phần như đã giải thích ở trên. Như một ví dụ ngụ ý, các giá trị trong phân phối là 1s và 100s và 20 là một giá trị ngoại lệ. Vì vậy, chúng ta có thể cắm $ x_ {10001} = 1 $và nhìn vào giá trị trung bình: $$ \ bar x_ {10000 + O} – \ bar x_ {10000} = \ left (50,5- \ frac {505001} {10001} \ right) + \ frac {20- \ frac {505001} {10001}} { 10001} \\\ khoảng 0,00495-0,00305 \ khoảng 0,00190 $$ Thời hạn $ -0,00305 $ trong biểu thức trên là tác động của giá trị ngoại lệ. Nó nhỏ, như được thiết kế, nhưng nó là khác không.

Sự phá vỡ cho dải phân cách bây giờ đã khác! $$ \ bar {\ bar x} _ {10000 + O} – \ bar {\ bar x} _ {10000} = (\ bar {\ bar x} _ {10001} – \ bar {\ bar x} _ { 10000}) \\ = (1-50,5) + (20-1) = – 49,5 + 19 = -30,5 $$

Trong ví dụ này, chúng tôi có một số khác không, và thay đổi khá lớn trong trung vị do ngoại lệ là 19 so với tác động của cùng một thuật ngữ đến trung bình là -0,00305! Điều này cho thấy rằng nếu bạn có giá trị ngoại lệ ở giữa mẫu, bạn có thể nhận được tác động lớn hơn đến giá trị trung bình so với giá trị trung bình.

phần kết luận

Lưu ý, có những lầm tưởng và quan niệm sai lầm trong số liệu thống kê có sức mạnh tồn tại mạnh mẽ. Ví dụ, quan điểm cho rằng bạn cần một mẫu cỡ 30 để CLT có hiệu lực. Hầu như không ai biết ai đã nghĩ ra quy tắc ngón tay cái này và dựa trên loại phân tích nào. Vì vậy, thật thú vị khi nghĩ rằng có thể những thứ trung bình / trung bình này là một trong những trường hợp này. Tuy nhiên, không phải vậy. Thật vậy, giá trị trung bình thường mạnh hơn mức trung bình đối với sự hiện diện của các giá trị ngoại lai.

Giá trị nào bị ảnh hưởng bởi giá trị cực trị?

Trung bình số học có tính đến giá trị của tất cả các mặt hàng (tức là rất lớn và rất nhỏ) trong một chuỗi. Do đó, nó chỉ là trung bình cộng bị ảnh hưởng bởi các giá trị cực trị trong chuỗi.

Giá trị trung bình có bị ảnh hưởng bởi các giá trị cực trị Giá trị ngoại lệ là gì?

Các giá trị ngoại lai ảnh hưởng đến giá trị trung bình của dữ liệu nhưng ít ảnh hưởng đến giá trị trung bình hoặc chế độ của một tập hợp dữ liệu nhất định.

Giá trị trung bình có ít bị ảnh hưởng bởi các giá trị cực trị hơn giá trị trung bình không?

Lợi thế của dải phân cách: Giá trị trung bình ít bị ảnh hưởng bởi các ngoại lệ và dữ liệu sai lệch hơn so với giá trị trung bìnhvà thường là thước đo ưu tiên của xu hướng trung tâm khi phân bố không đối xứng.

Điều gì ảnh hưởng đến dải phân cách?

Trong thực tế, thêm một điểm dữ liệu vào tập hợp hoặc lấy đi một điểm, có thể ảnh hưởng đến giá trị trung bình, trung vị và chế độ. Nếu chúng tôi thêm một điểm dữ liệu cao hơn mức trung bình hoặc lấy đi một điểm dữ liệu thấp hơn mức trung bình, thì giá trị trung bình sẽ tăng lên.

Bạn đang xem chuyên mục Hỏi đáp
Thuộc website web giải đáp

Quảng cáo
Hỏi đáp

Leave a Reply

Email của bạn sẽ không được hiển thị công khai.

You may use these HTML tags and attributes:

<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>