2011年10月13日 星期四

圖+excel說t-test

前陣子跟兆晉學長聊到國中生到底能不能學會統計分析,學長說的很斬釘截鐵:可以。真是讓我驚訝的一項回答,但學長說的居然跟暑碩時教授說的一樣─只要了解統計的意義,而不是計算過程,學生是可以理解的,一般會認為國中學生無法學統計,是因為老師自己也不太懂的藉口罷了!嗯,為了這句話我一定要搞懂它!根據學長的的說法,我把它畫成了圖片,並且上網查了如何用excel來做t-test(求P-value)。

學長的教法很簡單,用畫分布圖的方式來解說,簡單舉個例子,採集宜蘭山區的蝴蝶跟平地的蝴蝶,各自量取翅膀寬度,會得到兩個數據,畫成兩個分布圖,兩區域的蝴蝶翅膀寬度可能有些許重疊,也有些不同,那麼到底他們是同一母群體還是不同母群體呢?可以由這個圖來看:
  

說穿了p值是什麼,學長用一句話就教完了:
就是兩個分布圖重疊的那一塊(藍色部分)
  












由這張圖來看也許看不出數據,但可以了解P值的意義,然後再問P值小代表什麼意義?很容易的就會知道,代表兩群相似性低,當P值小到一定程度時,我們會認為重疊區只是一種機率問題的出現,一般我們訂為0.05,也就是重疊區占5%以下,此時也就是統計學上所謂:有顯著差異

P值越大,兩群體的相似性越高,且不是隨機誤差所造成
我們就稱它為沒有顯著差異。
相反的P值越大代表重疊的區域越多,那就代表了什麼?沒錯,相信聰明的看官都說得出來,就是相似性很高,相似性越高就代表差異很小此時我們可以說它們是同一母群體:也就是統計上所謂的無顯著差異

那怎麼算P值呢?這種東西學過沒常用很快就會忘了!更何況統計是一大堆讓人頭暈的數字!還好我們有好朋友,不用高檔的統計軟體,有excel就夠了,把上面的圖轉換成統計資料就變成這樣:
開啟excel相信大家都會,但2003跟2007還是有些不同
好吧!我承認我是湊版面

接著是keyin兩群的原始數據

選取我們要的統計函數,直接選TTEST,
就是這個步驟省掉了我們一大推繁瑣的計算
點選後會出現這個表格,就可以選取資料範圍了
選取資料1及資料2
然後是選取單尾或雙尾檢定,問題來了,要怎麼選咧?
其實蠻容易的,單尾或雙尾要看統計的目的來選擇,若想證明的是我的數據不同於母群體(不管是大於或小於)這時候就用雙尾檢定,也就是H0:子群=母群。若想證明的是我的資料大於或小於母群,這時候就用單尾檢定囉!也就是H0:子群> =母群或H0:子群< =母群。在這裡沒有母群,也就是兩個子群"比大小",也是用單尾就好囉!就在tails的地方選1。
完成後就會變成這樣:
最後會自動跳出一個數字,2.87708E-05。這就是P值,
E代表的是10的指數,在這裡就可以看出P值小於0.05。
代表兩個群體之間存在顯著的差異。
我想用這樣的方式,加上excel的統計功能,學生在做科展時,確實是可以做進一步的統計分析,未來有機會我也會試試看讓學生操作。另一項可能會常用的迴歸分析,再找時間來複習複習。 

4 則留言:

  1. p value 的講解淺顯易懂, 讓人茅塞頓開. 感謝您的分享

    回覆刪除
  2. 非常感謝您分享關於t-test的使用心得
    有件事想請教前輩您
    不好意思 有冒犯之處請多多包涵
    用「蝴蝶翅膀寬度」來定義不同母群的根據是什麼?
    還是只是自己想像用來練習t-test
    這點讓我不是很懂
    謝謝您用心看完我的疑問

    回覆刪除
    回覆
    1. 蝴蝶翅膀只是一個舉例,作為統計的練習,在真正分類上當然不是這樣去做劃分。感謝您的提問~

      刪除