學長的教法很簡單,用畫分布圖的方式來解說,簡單舉個例子,採集宜蘭山區的蝴蝶跟平地的蝴蝶,各自量取翅膀寬度,會得到兩個數據,畫成兩個分布圖,兩區域的蝴蝶翅膀寬度可能有些許重疊,也有些不同,那麼到底他們是同一母群體還是不同母群體呢?可以由這個圖來看:
說穿了p值是什麼,學長用一句話就教完了: 就是兩個分布圖重疊的那一塊(藍色部分) |
由這張圖來看也許看不出數據,但可以了解P值的意義,然後再問P值小代表什麼意義?很容易的就會知道,代表兩群相似性低,當P值小到一定程度時,我們會認為重疊區只是一種機率問題的出現,一般我們訂為0.05,也就是重疊區占5%以下,此時也就是統計學上所謂:有顯著差異。
P值越大,兩群體的相似性越高,且不是隨機誤差所造成 我們就稱它為沒有顯著差異。 |
相反的P值越大代表重疊的區域越多,那就代表了什麼?沒錯,相信聰明的看官都說得出來,就是相似性很高,相似性越高就代表差異很小此時我們可以說它們是同一母群體:也就是統計上所謂的無顯著差異。
那怎麼算P值呢?這種東西學過沒常用很快就會忘了!更何況統計是一大堆讓人頭暈的數字!還好我們有好朋友,不用高檔的統計軟體,有excel就夠了,把上面的圖轉換成統計資料就變成這樣:
開啟excel相信大家都會,但2003跟2007還是有些不同 好吧!我承認我是湊版面 |
接著是keyin兩群的原始數據 |
選取我們要的統計函數,直接選TTEST, 就是這個步驟省掉了我們一大推繁瑣的計算 |
點選後會出現這個表格,就可以選取資料範圍了 |
選取資料1及資料2 |
然後是選取單尾或雙尾檢定,問題來了,要怎麼選咧? |
其實蠻容易的,單尾或雙尾要看統計的目的來選擇,若想證明的是我的數據不同於母群體(不管是大於或小於)這時候就用雙尾檢定,也就是H0:子群=母群。若想證明的是我的資料大於或小於母群,這時候就用單尾檢定囉!也就是H0:子群> =母群或H0:子群< =母群。在這裡沒有母群,也就是兩個子群"比大小",也是用單尾就好囉!就在tails的地方選1。
完成後就會變成這樣:
最後會自動跳出一個數字,2.87708E-05。這就是P值, E代表的是10的指數,在這裡就可以看出P值小於0.05。 代表兩個群體之間存在顯著的差異。 |
我想用這樣的方式,加上excel的統計功能,學生在做科展時,確實是可以做進一步的統計分析,未來有機會我也會試試看讓學生操作。另一項可能會常用的迴歸分析,再找時間來複習複習。
p value 的講解淺顯易懂, 讓人茅塞頓開. 感謝您的分享
回覆刪除非常感謝您分享關於t-test的使用心得
回覆刪除有件事想請教前輩您
不好意思 有冒犯之處請多多包涵
用「蝴蝶翅膀寬度」來定義不同母群的根據是什麼?
還是只是自己想像用來練習t-test
這點讓我不是很懂
謝謝您用心看完我的疑問
蝴蝶翅膀只是一個舉例,作為統計的練習,在真正分類上當然不是這樣去做劃分。感謝您的提問~
刪除有收獲,感謝。
回覆刪除