蒲公英 - 制藥技術的傳播者 GMP理論的實踐者

 找回密碼
 立即注冊

QQ登錄

只需一步,快速開始

使用微信帳號登錄

使用微信帳號登錄

查看: 379|回復: 8
打印 上一主題 下一主題
收起左側

[統計軟件] 樣本量大于30就可以認為是正態分布嗎?你可能對中心極限定理有誤區!

[復制鏈接]
藥徒
跳轉到指定樓層
樓主
我經常會被問到這么一個問題:樣本量多大就不用進行正態性檢驗了。殊不知,這問題的本身就是錯誤的,并不是樣本大,就一定要服從正態分布。我們可以輕易舉出一個反例來說明這個問題。比方說就用1-1000這一千個(甚至更多)自然數,組成一個樣本,那么這個樣本的分布就不是正態分布,因為1-1000服從的是均勻分布。另外,數據的分布基于形成的機理,有的分布天生就非正態(如壽命數據)。
但有些朋友,并不覺得這是一個錯誤的問題,甚至在他們的學習中還流傳著這么一個說法:樣本量大于30就可以認為是服從正態分布。但你向他問為什么的時候,會得到一個專業的解釋——中心極限定理。
中心極限定理
中心極限定理(Central Limit Theorem)是統計學中最重要的結論之一。在這里,我并不想給出中心極限定理專業的定義,只需要了解它告訴我們:來自某總體的一個樣本,無論該總體服從什么分布,只要樣本容量足夠大,其樣本均值都近似服從正態分布。
請注意這里的說法:“樣本均值“近似正態,而不是樣本本身服從正態(不是說你抽了30個樣品組成的樣本數據就正態)。這里又有一個大家疑惑的地方,樣本容量足夠大,多大才是足夠大?這個問題的答案和總體分布的形狀相關,如果樣本本是來自近似對稱分布的總體,那么當樣本量取相當。ㄈ鐦颖玖咳5)的值的時候,正態逼近的結果也會非常好。然后,如果總體的分布嚴重傾斜,則樣本量必須取相當大的值。根據檢驗,對于大多數總體來說,樣本容量取30或者更大,就足以得到令人滿意的正態逼近結果。
模擬擲骰子展示中心極限定理
為了展示中心極限定理,模擬多次投擲骰子來說明。
假設您擲骰子 1000 次。您希望得到相等數目的 1、2 等。讓我們查看 1000 次骰子的分布(圖1)。

現在假設您將投擲 2 次,并采用兩次投擲的平均值。您還將重復此試驗 1000 次。讓我們來看看兩次投擲的平均值的分布。這種分布如圖 2 所示。您是否注意到在只進行了兩次投擲的情況下,平均值的分布已經呈現出了土堆形?

假設您現在投擲骰子三次,然后取三次投擲的平均值。再次重復此試驗 1000 次。讓我們來看看此舉對投擲的平均值分布有何影響。這種分布如圖 3 所示。同樣,分布的形狀與正態分布的形狀相當接近。您是否注意到分布上發生了其他變化?

讓我們投擲骰子五次,并取其平均值。再次重復此試驗 1000 次。這種分布如圖 4 所示。您是否已開始注意到所發生的情形中存在任何模式?

讓我們繼續增加平均投擲次數。此時您將投擲 10 次,并采用 10 次投擲的平均值。這種分布如圖 5 所示。

現在,隨著您增加投擲次數,將看到兩個現象。首先,您會看到,平均分布的形狀開始與正態分布的形狀相似。其次,您會看到,隨著投擲次數的增加,分布變得越來越窄。讓我們繼續增加投擲次數。此時,您將投擲骰子 20 次。這種分布如圖 6 所示。

到現在,您應該確信增大樣本數量對樣本平均值分布是有影響的。您將再次增大樣本數量,以強化這種認知。此時,您將投擲骰子 30 次。這種分布如圖 7 所示。

讓我們看看所呈現的情況,在一個圖中繪制大小為 2、5、10、20、30 的樣本的直方圖,以查看變化的分布。

小結
從上面的模擬結果,可以知道,當樣本量大于30的時候,那么樣本均值(取了1000次樣本,得到1000個均值)的分布基本呈正態分布。

另外該定理還指出,如果根據總體不斷重復繪制隨機樣本數量 n 以及有限均值 mu(y) 和標準差 sigma(y),然后在 n 較大時,樣本均值的分布將近似呈正態分布,并且均值等于 mu(y),標準差等于 (sigma(y))/sqrt(n)。

分享到:  QQ好友和群QQ好友和群 QQ空間QQ空間 騰訊微博騰訊微博 騰訊朋友騰訊朋友
收藏收藏2 分享分享 分享淘帖 好評好評 差評差評
回復

使用道具 舉報

藥徒
推薦
發表于 6 天前 | 只看該作者
符不符合正態分布,做一個正態分布檢驗,看P值
回復 支持 1 反對 0

使用道具 舉報

藥生
沙發
發表于 6 天前 | 只看該作者
學習了,謝謝提供分享。
回復 支持 反對

使用道具 舉報

藥徒
板凳
 樓主| 發表于 6 天前 | 只看該作者
xqliu 發表于 2019-12-27 10:27
學習了,謝謝提供分享。

學習更多好的文章請關注微信公眾號Minitab Users Group  ,我們更有Minitab微課堂學習群
回復 支持 反對

使用道具 舉報

藥徒
地板
發表于 6 天前 | 只看該作者
回復 支持 反對

使用道具 舉報

藥徒
5#
發表于 6 天前 | 只看該作者
回復 支持 反對

使用道具 舉報

藥生
6#
發表于 6 天前 | 只看該作者
你這個兩次投擲(1000次)怎么理解:

是做一千次的兩次投擲嗎?

點評

3075589379  看他后面寫的,就是這個意思。投兩次,取均值,重復1000次  詳情 回復 發表于 10 小時前
回復 支持 反對

使用道具 舉報

藥徒
8#
發表于 6 天前 | 只看該作者
看這ID是官方號?
回復 支持 反對

使用道具 舉報

藥徒
9#
發表于 10 小時前 | 只看該作者
大呆子 發表于 2019-12-27 13:54
你這個兩次投擲(1000次)怎么理解:

是做一千次的兩次投擲嗎?

看他后面寫的,就是這個意思。投兩次,取均值,重復1000次
回復 支持 反對

使用道具 舉報

您需要登錄后才可以回帖 登錄 | 立即注冊

本版積分規則

×友情提示
1、無權下載附件會員可能原因:1.“待驗證用戶組“,請點擊注冊郵箱里面收到的確認郵件即可; 2.作者設定權限的,提高用戶組級別即可
2、對本站的任何疑問或合作需求,請聯系微信tank066,關于怎樣提高用戶組/積分:http://www.883555.live/thread-6764-1-1.html
3、注冊用戶在本社區發表、轉載的任何作品僅代表其個人觀點,不代表本社區認同其觀點。
4、如果存在違反國家相關法律、法規、條例的行為,我們有權在不經作者準許的情況下刪除其在本論壇所發表的文章。
5、所有網友不要盜用有明確版權要求的作品,轉貼請注明來源,否則文責自負。

QQ|手機版|蒲公英|ouryao|蒲公英 ( (京)-非經營性-2014-0058 京ICP備14042168號 京ICP證150354號 )

GMT+8, 2020-1-2 20:48 , Processed in 0.156165 second(s), 73 queries .

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回頂部 初学者打麻将视频教程