点估计与区间估计
第十章 估計
点估计与区间估计
點估計與區間估計推論統計的理論乃在根據樣本的訊息,猜測母體的特性或參數。主要 的推論型式是參數(母數)的估計與假設的檢定,參數的估計又可分 為
點估計(point estimation):根據樣本資料,求得一統計量 的觀測值,作為參數(母數)的估計值。 區間估計(interval estimation):根據樣本資料,求得兩個 數值,構成一個信賴區間(confidence interval,C. I.),概 括出參數(母數)的可能範圍。點估計之優點為算法簡單,意義簡單明瞭;但其缺點為無法判斷估計 結果的準確性,且其估計值會因樣本不同而有所差異。所以才會有區 間估計之推出。 假定,我們估計全體大學生平均每月可用零用金為5000元,那是點估 計,該估計為單一數值,可視為線上的一點;若我們估計全體大學生 平均每月可用零用金介於4000~6000元,那就是區間估計,因為涉及 兩點,可視為線上的一個區段。
点估计与区间估计
母體平均數µ的估計 母體平均數 的估計實務上,最常碰到對母體均數µ的估計。如:大學生的平均智商、平均 成績、平均身高、每月平均可用零用金、平均手機的使用月費;國民 平均所得、工廠的平均生產數量、百貨公司的平均營業額、每戶家庭 每月的平均支出、……。 估計母體平均數µ的方法可為:樣本中位數、中距( ) 2 與平均數。其中,以樣本平均數為最優,因其具有不偏性與一致性, 且變方最小。最大 最小
点估计与区间估计
大樣本時若樣本數n>30,則以其為µ的點估計。若樣本數n>30,且母體變異數 σ2已知,則以
x ± zα / 2
σn
為µ的100(1-α)%之信賴區間。 但實務上,母體變異數σ2通常未知,當樣本數n>30,可以樣本標準差 S來取代母體標準差σ。故以
x ± zα / 2
S n
為µ的100(1-α)%之信賴區間。
点估计与区间估计
而
zα / 2
S nS n2
即我們可容忍的誤差(e)。所以,我們於第四章計算樣本大小時,就是將
e = zα / 2簡化成
Z S n = α /2 e 來計算樣本數。 式中,Zα/2值可用Excel之NORMSINV()函數來求算(詳第三章之說明), 其公式應為: =NORMSINV(1-α/2) 以α=0.05時為例,其Zα/2值為1.96:(詳範例Ch10.xlsx『依α査Z值』工作表)
点估计与区间估计
未分組資料若資料為未分組之數值資料,可直接以AVERAGE()與STDEV()來求 算樣本均數與標準差。續代入先前之
x ± zα / 2求得µ的點估計與信賴區間。
S n
以範例Ch10.xlsx『飲料花費』工作表內容言,其飲料花費µ的點估計 為83.225元;µ的95%信賴區間為
83.225 ± 1.96
82.21 = 83.225 ± 11.39 200
即71.83~94.62元。我們可以說,有95%的信賴水準,母體(全體大 學生)的一週飲料花費會落在71.83~94.62元: 轉為媒體上所常用之口語,就是:此次
調查之結果,全體大學生的一 週飲料平均花費為83.225元,於95%信賴水準之下,其誤差不會超過 ±11.39元。
点估计与区间估计
若依不同之顯著水準求算,其信賴區間分別為: α 信賴區間 0.10 75.20~92.54 其內,信賴區間之上下限的公式,於F12與G12分別為: 0.05 73.54~94.20 F12 =$F$2-NORMSINV(1-$E12/2)*$F$3/SQRT($F$4) 0.01 70.30~97.44 G12 =$F$2+NORMSINV(1-$E12/2)*$F$3/SQRT($F$4) 然後,將F12:G12,抄給F13:G14即可。 可發現,顯著水準愈小(信賴水準愈大),信賴區間將愈大。
点估计与区间估计
馬上練習以範例Ch10.xlsx『運動時間』工作表內容,求α=0.05時,大學生每 週運動時間之均數µ的點估計及其95%信賴區間。
点估计与区间估计
馬上練習續上題,求α=0.01、α=0.05與α=0.1時,運動時間之均數µ的信賴區間 分別為何?
点估计与区间估计
信賴區間之範圍CONFIDENCE() 信賴區間之範圍CONFIDENCE(α,σ,n) CONFIDENCE(顯著水準,標準差,樣本數) 本函數可傳回母體平均數的信賴區間之範圍,α為顯著水準,α=0.05時 表求算95%信賴區間之範圍。σ為母體標準差,n為樣本數。 若處理對象為常態分配,母體標準差(σ)已知,其計算公式為:
zα / 2
σ
nzα / 2 S n
實務上,很少會已知母體標準差,就以樣本標準差來替代。其計算公 式為:
故其µ的100(1-α)%之信賴區間為:
x ± CONFIDENCE(α , σ , n)
点估计与区间估计
如範例Ch10.xlsx『直接以CONFIDENCE()求算飲料花費區間』工作表,其 資料內容同於前文『飲料花費』工作表。以AVERAGE()、STDEV()與 COUNT()求得均數、標準差與樣本數。然後,於F6再以 =CONFIDENCE(F5,F3,F4) 求信賴區間之範圍,可省去以=NORMSINV(1-α/2)計算Zα/2值之步驟。所求得 之95%信賴區間同樣為71.83~94.62:
点估计与区间估计
馬上練習依範例Ch10.xlsx『成績』工作表內容,求α=0.05時,成績均數µ的點 估計,並以CONFIDENCE()求其95%信賴區間。
点估计与区间估计
分組資料對問卷上,採用勾填某一區間所獲得之數字。如: 請問您整個家庭月所得狀況: 請問您整個家庭月所得狀況: □1. 5萬元以下 萬元以下 □4. 15至20萬元 至 萬元 □2. 5至10萬元 至 萬元 □5. 20萬元以上 萬元以上 □3. 10至15萬元 至 萬元
得將其轉為組中點(25000,75000,…,225000),再計算其均數、 變異 …… 此处隐藏:1014字,全部文档内容请下载后查看。喜欢就下载吧 ……
