要研究天鵝的顏色,我們不可能去觀察每一只天鵝(總體),我們只能投機取巧,通過觀察其中的一部分(樣本)來推斷。這就帶來一個巨大的風險,可能我們看到100000只天鵝都是白色的,但你怎么知道剩下的更多的天鵝中就沒有黑色的?
因此,選擇誰來觀察,就成了一個技術活,這就是我們今天的主角——抽樣(sampling)。
通常我們以為:樣本越大就越好,大樣本等于好樣本;其實不然,樣本最重要的是:
代表性。ㄒ槐椋
代表性!(兩遍)
代表性。ㄈ椋
舉個栗子:我想研究一下某所大學最受歡迎的電影,我有時間、有精力、有資金,我調查10000名同學,調查結論是《泰坦尼克》;而我的同事只調查了10名同學,他的結論卻是《泰坦尼克》和《碟中諜》兩個。我因為按照宿舍樓抽樣,所以調查的恰好都是女生;我的同事則是在男女生中各調查了5個人。
誰更可信?
看來樣本容量固然重要(how many),但更重要的還是抽樣方案(how)。一般來說,方案分為概率抽樣(隨機抽樣)和非概率抽樣兩大類。兩者的根本區別就是前者完全是經“上帝的手”在選擇,比較公平、公正、公開;后者還有“凡人的手”在幫忙,當然有時是幫倒忙。
因為概率抽樣中的每個個體都有一個確定的可能性(概率)被抽中,所以概率和統計技術就有了用武之地,我們可以計算出抽樣帶來的誤差,對總體給出相當準確的推斷。
01 非概率抽樣(Non-probability sampling)
又稱非隨機抽樣,指根據一定主觀標準抽取樣本,令總體中每個個體的被抽取不是依據其本身的機會,而是完全決定于調研者的意愿。
其特點為不具有從樣本推斷總體的功能,但能反映某類群體的特征,是一種快速、簡易且節省的數據收集方法。當研究者對總體具有較好的了解時可以采用此方法,或是總體過于龐大、復雜,采用概率方法有困難時,可以采用非概率抽樣來避免概率抽樣中容易抽到實際無法實施或“差”的樣本,從而避免影響對總體的代表度。
常用的非概率抽樣方法有以下四類:
▷ 方便抽樣(Convenience sampling)
指根據調查者的方便選取的樣本,以無目標、隨意的方式進行。例如:街頭攔截訪問(看到誰就訪問誰);個別入戶項目誰開門就訪問誰。
優點:適用于總體中每個個體都是“同質”的,最方便、最省錢;可以在探索性研究中使用,另外還可用于小組座談會、預測問卷等方面的樣本選取工作。
缺點:抽樣偏差較大,不適用于要做總體推斷的任何民意項目,對描述性或因果性研究最好不要采用方便抽樣。
▷ 判斷抽樣(Judgment sampling)
指由專家判斷而有目的地抽取他認為“有代表性的樣本”。例如:社會學家研究某國家的一般家庭情況時,常以專家判斷方法挑選“中型城鎮”進行;也有家庭研究專家選取某類家庭進行研究,如選三口之家(子女正在上學的);在探索性研究中,如抽取深度訪問的樣本時,可以使用這種方法。
優點:適用于總體的構成單位極不相同而樣本數很小,同時設計調查者對總體的有關特征具有相當的了解(明白研究的具體指向)的情況下,適合特殊類型的研究(如產品口味測試等);操作成本低,方便快捷,在商業性調研中較多用。
缺點:該類抽樣結果受研究人員的傾向性影響大,一旦主觀判斷偏差,則根易引起抽樣偏差;不能直接對研究總體進行推斷。
▷ 配額抽樣(Quota sampling)
指先將總體元素按某些控制的指標或特性分類,然后按方便抽樣或判斷抽樣選取樣本元素。
相當于包括兩個階段的加限制的判斷抽樣。在第一階段需要確定總體中的特性分布(控制特征),通常,樣本中具備這些控制特征的元素的比例與總體中有這些特征的元素的比例是相同的,通過第一步的配額,保證了在這些特征上樣本的組成與總體的組成是一致的。在第二階段,按照配額來控制樣本的抽取工作,要求所選出的元素要適合所控制的特性。例如:定點街訪中的配額抽樣。
優點:適用于設計調查者對總體的有關特征具有一定的了解而樣本數較多的情況下,實際上,配額抽樣屬于先“分層”(事先確定每層的樣本量)再“判斷”(在每層中以判斷抽樣的方法選取抽樣個體);費用不高,易于實施,能滿足總體比例的要求。
缺點:容易掩蓋不可忽略的偏差。
▷ 滾雪球抽樣(Snowball sampling)
指先隨機選擇一些被訪者并對其實施訪問,再請他們提供另外一些屬于所研究目標總體的調查對象,根據所形成的線索選擇此后的調查對象。
第一批被訪者是采用概率抽樣得來的,之后的被訪者都屬于非概率抽樣,此類被訪者彼此之間較為相似。例如:如在目前中國的小轎車車主等。
優點:可以根據某些樣本特征對樣本進行控制,適用尋找一些在總體中十分稀少的人物。
缺點:有選擇偏差,不能保證代表性。
02 概率抽樣(Probability sampling)
又稱隨機抽樣,指在總體中排除人的主觀因素,給予每一個體一定的抽取機會的抽樣。
其特點為,抽取樣本具有一定的代表性,可以從調查結果推斷總體;操作比較復雜,需要更多的時間,而且往往需要更多的費用。
常用的有以下六種類型:
▷ 簡單抽樣(Simple sampling)
簡單隨機抽樣(simple random sampling)又稱純隨機抽樣,是概率抽樣的最基本形式。它是按等概率原則直接從含有N個元素的總體中隨機抽取n個元素組成樣本(N>n)。
常用的辦法類似于抽簽,即把總體的每一個單位都編號,將這些號碼寫在一張張小紙條上,然后放入一容器(如紙盒、口袋)中,攪拌均勻后,從中任意抽取,直到抽夠預定的樣本數目。這樣,由抽中的號碼所代表的元素組成的就是一個簡單隨機樣本。
比如,某系共有學生300人,系學生會打算采用簡單隨機抽樣的辦法,從中抽取出60人進行調查。為了保證抽樣的科學性,他們先從系辦公室得到一份全系學生的名單,然后給名單中的每個學生都編上一個號(從001到300)。抽樣框編好后,他們又用300張小紙條分別寫上001,002,…,300。他們把這300張寫好不同號碼的小紙條放在一個盒子里,攪亂后,隨便摸出60張小紙條。然后,他們按這60張小紙條上的號碼找到總體名單上所對應的60位同學。這60位同學就構成了他們本次的樣本。這種方法簡便易學。但當總體元素很多時,寫號碼的工作量就很大,攪拌均勻也不容易,因而此法往往在總體元素較少時使用。
對于總體元素很多的情形,我們則采用隨機數表來抽樣。本書后就附有一張隨機數表,表中的數碼和排列都是隨機形成的,沒有任何規律性(故也稱為亂數表)。利用隨機數表進行抽樣的具體步驟是:
-
先取得一份總體所有元素的名單(即抽樣框);
-
將總體中所有元素一一按順序編號;
-
根據總體規模是幾位數來確定從隨機數表中選幾位數碼;
-
以總體的規模為標準,對隨機數表中的數碼逐一進行衡量并決定取舍;
-
根據樣本規模的要求選擇出足夠的數碼個數;
-
依據從隨機數表中選出的數碼,到抽樣框中去找出它所對應的元素。
▷ 系統抽樣(Systematic random sampling)
將總體中的各單元先按一定順序排列,并編號,然后按照不一定的規則抽樣。其中最常采用的是等距離抽樣,即根據總體單位數和樣本單位計算出抽樣距離(即相同的間隔),然后按相同的距離或間隔抽選樣本單位。例如:從1000個電話號碼中抽取10個訪問號碼,間距為100,確定起點(起點<間距)后每100號碼抽一訪問號碼。
系統抽樣的具體步驟是:
-
給總體中的每一個個體按順序編號,即制定出抽樣框。
-
計算出抽樣間距。計算方法是用總體的規模除以樣本的規模。假設總體規模為N,樣本規模為n,那么抽樣間距K就由下列公式求得:
-
K(抽樣間距)=N(總體規模)n(樣本規模)
-
在最前面的K個個體中,采用簡單隨機抽樣的方法抽取一個個體,記下這個個體的編號(假設所抽取的這個個體的編號為A),它稱做隨機的起點。
-
在抽樣框中,自A開始,每隔K個個體抽取一個個體,即所抽取個體的編號分別為A,A+K,A+2K,…,A+(n-1)K。
-
將這n個個體合起來,就構成了該總體的一個樣本。
優點:兼具操作的簡便性和統計推斷功能,是目前最為廣泛運用的一種抽樣方法。如果起點是隨機確定的,總體中單元排列是隨機的,等距抽樣的效果近似簡單抽樣;與簡單抽樣相比,在一定條件下,樣本的分布較好。
缺點:抽樣間隔可能遇到總體中某種未知的周期性,導致“差”的樣本;未使用可能有用的抽樣框輔助信息抽取樣本,可能導致統計效率低。
▷ 分層抽樣(Stratified random sampling)
是把調查總體分為同質的、互不交叉的層(或類型),然后在各層(或類型)中獨立抽取樣本。例如:調查零售店時,按照其規模大小或庫存額大小分層,然后在每層中按簡單隨機方法抽取大型零售店若干、中型若干、小型若干;調查城市時,按城市總人口或工業生產額分出超大型城市、中型城市、小型城市等,再抽出具體的各類型城市若干。
優點:適用于層間有較大的異質性,而每層內的個體具有同質性的總體,能提高總體估計的精確度,在樣本量相同的情況下,其精度高于簡單抽樣和系統抽樣;能保證“層”的代表性,避免抽到“差”的樣本;同時,不同層可以依據情況采用不同的抽樣框和抽樣方法。
缺點:要求有高質量的、能用于分層的輔助信息;由于需要輔助信息,抽樣框的創建需要更多的費用,更為復雜;抽樣誤差估計比簡單抽樣和系統抽樣更復雜。
在實際運用分層抽樣的方法時,研究者需要考慮下列兩個方面的問題
(1)分層的標準問題。同一個總體可以按照不同的標準進行分層,或者說,根據不同的標準可以將一個總體分成不同的類別或層次。那么,在實際抽樣中究竟應該按什么標準來分層呢?通常采用的原則有:
第一,以所要分析和研究的主要變量或相關的變量作為分層的標準。比如,若要研究居民的消費狀況和消費趨向,可以以居民家庭人均收入作為分層標準;又如,要了解社會研究中不同職業的人員對社會經濟改革的看法,就可以以人們的職業作為分層的標準。
第二,以保證各層內部同質性強、各層之間異質性強、突出總體內在結構的變量作為分層變量。比如在工廠進行,可以以工作性質作為分層標準,將全廠職工分為干部、工人、技術人員、勤雜人員等幾類來進行抽樣。
第三,以那些已有明顯層次區分的變量作為分層變量。比如在社會研究中,性別、年齡(當然是分段以后,如老、中、青)、文化程度、職業等等,就經常被用作分層的標準;其他如學生按年級、專業、學校類型分層,城市按人口規模分層等等。
(2)分層的比例問題。分層抽樣中有按比例和不按比例分層兩種方法。按比例分層抽樣是指按總體中各種類型或層次的比例來抽取子樣本的方法。即在單位多的類型或層次中所抽的子樣本就大一些,在單位少的類型或層次中所抽的子樣本就小一些。比如,某廠有工人600人,按性別分層則有男工500人,女工100人?傮w中兩類工人人數的比例為5∶1。因此,若要抽60人作樣本,那么,按比例的抽法就是根據上述比例,分別從500名男工中隨機抽取50人,而從100名女工中隨機抽取10人。這樣,樣本中男女工人之比與總體中男女工人之比完全相同,均為5∶1。可以說,樣本的性別結構是總體中性別結構的一種縮影。
采取按比例分層抽樣的方法,可以確保得到一個在某種特征上與總體結構完全一樣的樣本。但是,在有些情況下,又不宜采用這種方法。例如,有時總體中有的類型或層次的單位數目太少,若以按比例分層的方法抽樣,則有的層次在樣本中個案太少,不便于了解各個層次的情況,這時往往要采取不按比例抽樣的方法。比如上例中,樣本中女工人數過少,此時我們可以采取不按比例抽樣的方法,在500名男工中抽30人,在100名女工中也抽30人。這樣,樣本就能較好地反映出男女兩類工人的一般狀況,我們也能很好地對男女兩類工人的情況進行比較和分析。
需要但注意的是,我們采用不按比例分層抽樣的方法,主要是便于對不同層次的子總體進行專門研究或進行相互比較,但若要用樣本資料推斷總體時,則需要先對各層的數據資料進行加權處理,即通過調整樣本中各層的比例,使數據資料恢復到總體中各層實際的比例結構。比如上例中,若要用30個男工、30個女工的收入資料去推斷全廠工人的平均收入時,就需要在男工的收入后乘以5/3,而在女工的收入后乘以1/3,再加總平均,否則就會導致推斷的偏誤。
▷ 整群抽樣(Cluster sampling)
是先將調查總體分為群,然后從中抽取群,對被抽中群的全部單元進行調查。例如:入戶調查,按地塊或居委會抽樣,以地塊或居委會等有地域邊界的群體為第一抽樣單位,在選出的地塊或居委會實施逐戶抽樣;市場調查中,最后一級抽樣時,從居委會中抽取若干戶,然后調查抽中戶家中所有18歲以上成年人。
優點:適用于群間差異小、群內各個體差異大、可以依據外觀的或地域的差異來劃分的群體。
缺點:群內單位有趨同性,其精度比簡單抽樣為低。
▷ 多級抽樣(Multistage sampling)
也叫多階段抽樣或階段抽樣,以二級抽樣為例,二級抽樣就是先將總分組,然后在第一級和第二中分別隨機地抽取部分一級單位和部分二級單位。例如:以全國性調查為例,當抽樣單元為各級行政單位時,按社會發展水平分層后(或按經濟發展水平,或按地理位置分層),從每層中先抽幾個地區,再從抽中的地區抽市、縣、村,最后再抽至戶或個人。
優點:具體整體抽樣的簡單易行的優點,同時,在樣本量相同的情況下又整群抽樣的精度高。
缺點:計算復雜。
▷ 抽中概率與規模成比例抽樣(PPS)
是不等概率中最常用的一種方法,指在總體中參照各單位的規模進行抽樣,規模大的被抽取的機會大,總體中每個個體被抽中的概率與該個體的規模成正比的抽樣。例如:在進行企業調查時,根據PPS抽樣方法抽取企業,令規模大的企業被抽取機會大。
優點:使用了輔助信息,可以提高抽樣方案的統計效率。
缺點:如果研究指標與規模無直接關系時,不合適采取這種方法。
此外,在抽樣方法劃分上,還有多階段抽樣和兩相抽樣等,有興趣的讀者可參閱其他相關書籍。
前面談到抽樣方法的一些基本分類和各自特點,需要注意的是,在實際的運用中,一個調查方案常常不是只局限于使用某一種抽樣方式,而根據研究時段的不同采用多種抽樣方法的組鴿為實現不同的研究目的,有時甚至在同一時段綜合運用幾種抽樣方法。
例如,設計一個全國城市的入戶項目,在抽樣上可以分為幾個不同的步驟,包括:
-
在項目正式開始前,可以采用判斷抽樣法選出某一城市先作試點,在問卷設計初期可以采用任意抽樣法選出部分人群進行問卷試訪。
-
采用分層隨機抽樣法,確定全國要分別在多少個超大型市、多少個大型市、多少個中型市、多少個小型市實施(先分出城市的幾個層次,再依據研究需要在各層用PPS法選取具體城市)
-
采用簡單抽樣法或PPS抽樣法,確定抽出城市中應抽的地塊或居委會;
-
采用整群抽樣法,確定抽出地塊或居委會應訪問的家庭戶;
-
在項目后期,可以采用判斷抽樣法選取某城市進行深入研究。
-