臺灣的原住民屬於南島民族的一支。南島民族指的是臺灣原住民、菲律賓、印尼、伯羅洲、沙勞越、馬來西亞、紐西蘭以及整個南太平洋(大洋洲)的住民。他們講的話就是南島語(Austronesian)。「南島」一詞指在南方的島嶼。除了這些地方之外,東南亞大陸仍然有少數殘留的南島民族,講的也是南島語。南島語一共約有900~1,200種語言。
南島語族的形成
南島民族本為語言學上之分類。自80年代以來語言學及考古學上的研究顯示,古代南島語言的起源與臺灣有密切的關係,而絕大多數的語言學者及考古學者基本上也都認為臺灣是南島民族最可能的原鄉(參見臺灣史前博物館網站的報導)。但對於臺灣是否的確毫無疑問就是南島民族的原鄉,部分遺傳學者則持有不同的看法。臺灣史前史的研究中,也與中國東南沿海新石器文化進行比較研究,尋找臺灣新石器文化來源,其直接關係著南島語族的歷史。另一方面,研究臺灣東海岸史前史,特別是它與東南亞一帶史前文化的關係,是瞭解臺灣史前文化如何向東南亞和太平洋擴散的重要線索。例如考古學上在東南亞所發現的最早史前遺址是在呂宋島,和臺灣東部文化遺址很類似;這就是很有意義的發現。
☆ 考古證據
臺灣位於大陸東南亞與西南太平洋交界,從史前時代就成為不少族群來往頻繁之處。考古的證據顯示臺灣的史前遺址已有1千多處,其中包含10多個史前文化,時間則至少跨越了1萬5千年。這說明了在很早以前就有許多來自不同地區的民族陸續來到臺灣,並且開創出內容豐富的文化。雖然舊石器時代因為遠至更新世時期,較難以探索當時所屬的人類究係何者。新石器時代與鐵器時代則被推測為臺灣原住民族所遺留,而因原住民屬南島語族,故新石器時代與鐵器時代即可能是古代南島語族的遺留。不久之前考古學者在臺南科學園區發現的南關里遺址屬於臺灣最早的新石器時代的大坌坑文化,年代在6千年前左右,所出土的考古材料相當豐富,非常珍貴。考古學者一般認為大坌坑文化是由中國大陸東南沿海帶入的新石器時代文化。這個文化相當活躍,廣泛分布於臺灣全島(尤其是沿海)及澎湖,以繩紋陶為主要特色,是臺灣最早的新石器時代文化,時間大約在6千年前到5千年前之間,又稱為「粗繩紋陶文化」。其文化特徵跟代表舊石器時代的長濱文化有明顯的不同。大坌坑文化的遺址大多出現在海濱、河口或湖濱,是一個適應海洋、河流、沼澤等環境的文化。許多學者如張光直等人認為,大坌坑文化即為南島民族之古老樣貌。代表性的遺址有大坌坑遺址(北部)、鳳鼻頭遺址(鳳山)、八甲遺址(歸仁鄉)、長光遺址(花蓮)、果葉遺址(澎湖)。和這個文化類似的史前文化也出現在閩江口以南到雷州半島附近之間的大陸東南亞沿海,但最近大規模比較各遺址間史前文化的特徵,學者認為是大坌坑文化與廣東、福建地區的相似性造成,而不一定是同源。無論如何,考古學的證據說明大陸東南亞、臺灣,以及島嶼東南亞等三地間有過密切的互動,但尚無法支持單一方向擴散的假說。
臺灣約在4千5百年前,以大坌坑文化為基礎,又發展出繩紋紅陶文化,但是與大坌坑文化僅略有差異而已。兩者在文化內容上一直維持很高的同質性。3千5百年到1千5百年前,臺灣的史前文化展現出繽紛多樣的面貌。文化分化十分顯著,遺址也急遽增加,從海濱、平原、丘陵到高山都有這一時期的遺址存在。這個時期已有定居的聚落,發展成部落社會,有農耕及畜牧,製作石器的技術越來越進步,也開始有製陶、紡織、編織等工藝。
☆ 遷徙路線
但是南島民族是怎麼形成的?這要從現代人離開非洲後遷徙的路徑加以瞭解。現代人基因的多樣性主要是由於6萬至10萬年前發生的兩次人口大遷徙:
第一次大遷徙:一部分人留在非洲不動,但一部分人移居西亞。
第二次大遷徙:移居西亞的人後來有一部分往北到歐洲,或往東走,到達中亞,東北亞,最後一部分人經過白令海峽,到達美洲;但有一部分往南遷徙,到達南亞、東南亞,最後到了澳洲、新幾內亞;但另有一部分則往東走,最後到達臺灣,成為我們所認識的南島民族。約在5千年前,南島民族在臺灣東海岸的一支往南遷徙,到達菲律賓、印尼、美拉尼西亞、紐西蘭,最後他們的定居地遍及整個大洋洲。
因此東(南)亞可以算是往北移居的人口(包括那些最後移往美洲的人)以及往南移居的人口(移往澳洲,大洋洲)的交會點,也因此,東(南)亞因緣際會成為地球上族群分布、語言、文化最為複雜的地區之一。這就是東南亞研究之所以重要的理由。
目前我們已知東南亞地區有五大語系存在。這五大語族各反映出歷史上不同的遷徙路徑。如下圖所示。
其中棕色路線表示現代智人從印度遷徙過來,約在2萬年前到達今雲南瀾滄江流域一帶。後來這些人分為三支繼續往前尋找下一站棲身之地。北支有一部分(藍色路線)後來到達今日之青藏高原一帶,成為日後的藏緬族(Tibeto-Burmese)。另外一部分(紅色)沿著黃河到達今陝西、河南、成為日後的華夏族(或漢族)。中支(綠色)則沿著長江南下,到達今天的湖南,成為日後的苗瑤族(Miao-Yao)。苗瑤族後與南下到長江流域的漢族有相當程度的混居或通婚,被當時的漢人稱為南蠻。南支(深藍色)早在2萬多年前就與其他從印度來的族群分離,他們先是南下,一部分後來定居今馬來半島,一部分則北上到達今柬埔塞,越南一帶;一部分則繼續沿著中國東南海岸北上,到今天長江口南側,他們就是日後漢人所謂的百越民族,也是今天壯侗語族(壯族,泰語族,黎族等)的祖先。有部分學者認為當今的南島民族可能也是當年百越民族的一支。
☆ 五大語系
這幾支移民日後發展出五個很不同的語系。這五大語系從南到北,其代表性的語言分布、數目及推測的祖語年代大略如下:
1. 漢藏語系:最龐大的語系,共約有360種語言。漢語、藏語、緬甸語等是人口較大的語言。其共通的祖語約在7千至6千年前形成。這個語系的原鄉究竟何處一直有爭論;北印度、四川、西藏高原或黃河流域上游都有支持者。
2. 苗瑤語系:由於被南北幾個較大的語系的同化,苗瑤語系目前只有32個語言,分布於中國西南邊界(廣西,貴州)、寮國、泰國、越南等地山區。苗瑤語深受漢語的影響,含有很多的漢語借詞。其祖語約在2500年前形成。有些學者認為戰國時代楚國使用的語言很可能就是原始苗瑤祖語。
3. 壯侗語系(或稱侗台語系):共約有70種語言,分布於廣西、貴州、海南島、泰國、寮國等地。泰語、寮語、黎語、壯語、布依語等是較常見的語言,其中泰語支是在西元後才南遷到今天的泰國、寮國;因此壯侗語系的原鄉很可能是在今廣西、貴州一帶,因為這些地方語言的歧異度也比較高。又此處的台語支(或寫為泰語支,傣語支)是壯侗語系的南支之一,指的是泰語、寮語、撣語等40多種語言的合稱,跟臺灣的臺語無關,純粹只是寫成漢字後的巧合。
4. 南亞語系:共約有168個語言,分布幅原很廣,西起印度北部、馬來半島,東到越南。越南話(人口將近7千萬)、高棉話(人口約2千萬)是較重要的語言。印度東北部的MUNDA語支(人口約9百萬)也屬於南亞語系。
5. 南島語系:除了上面提到分布在臺灣及整個島嶼東南亞的900~1,200個南島語之外,大陸東南亞有少數幾個地方仍然存有講南島語的族群。最有名的是越南南部的占族(CHAMIC)。占族在7世紀到15世紀間曾建立王國,占有今越南南部大部分的領土及部分的海南島,後來被原根據地在今越北的越南人逐步消滅大部分,殘留的人口散居越南南部及其東南沿海、越寮邊界,以及馬來西亞、泰國境內。在語言上,占族講的語言屬於占語群,是馬來玻里尼西亞語支下的一支。根據他們使用的陶器,鐵器器物,澳洲考古學者Bellwood認為占族可能是公元前第一或第二世紀移自伯羅洲,而當時伯羅洲人講的應該就是南島語的馬來玻里尼西亞語支。也就是說,如果Bellwood的論證成立的話,這表示約6千年前自大陸東南亞移居臺灣的古南島民族,後來一部分人南遷到菲律賓、印尼、伯羅洲、馬來半島等地,而後有一部分伯羅洲人又移回大陸東南亞海岸,成為日後的占族,等於繞了一大圈。
南島語系的分布
南島語的分布如圖3及圖4所示。可以看得出南島語的分布很廣,從最西部非洲東岸的馬達加斯加島到最東邊的復活島,經度跨越206度。最北是臺灣,最南是紐西蘭,緯度間距達70度,人口在3億8千萬以上。
德國語言學者Dempwolff在1930年代首先發現南島語之間有著密切的親屬關係。之後歷史語言學者主要的研究焦點之一就是對古南島語(南島語的祖語)做重建的工作,即推測這個祖語是個什麼樣的語言。歷史語言學學者利用18世紀以來所發展的比較方法,逐漸勾勒出這個古語的樣貌,目前大致上已經有了共識。這個比較方法基本的假設是:所有的語言,其語音的變化都相當規則。此外,一組語言如果共享有一個音變特徵,那麼這組語言就構成一個語支,跟其他的語言或語支就不同。試以下面三個語言三個單字為例:
天空 哭 眼睛
卑南語 laŋit taŋis mata
馬來語 laŋit taŋis mata
夏威夷語 lani kani maka
這三個語言彼此距離遙遠,卑南語是在臺東,馬來語在馬來半島,夏威夷距離臺灣將近3千公里,但這三個單字的語音跟語音之間的對應關係很有規則,而語意上也對應。事實上,卑南語跟馬來語音或義剛好完全一樣。而夏威夷語的n對應於另兩個語言的ŋ;夏威夷語的k也對應於另兩個語言的t。如果我們有機會觀察這三個語言其他的詞彙,或觀察更多的南島語,我們可以得到同樣的更多類似的對應關係。歷史語言學者就是根據這一類的證據,而推測古南島語這三個詞的發音應該是:
天空 *laŋit
哭 *taŋis
眼睛 *mata
(*表示是推測擬構的語言,不是真正觀察到的語言)
古南島語的擬測可以直接間接讓我們推知幾千年前南島民族生存的環境或文化活動有什麼樣的特色。這些推測的知識也可以藉著其他領域得到的證據,加以檢驗,獲得支持或佐證。最近幾年關於南島民族的研究,語言學的證據,考古學的證據,遺傳學的證據三者之間關係最為密切。有時相互支持,但有時相互牴觸。
卑南語、馬來語及夏威夷語雖然都是南島語,但要確立多達1,200個南島語之間的親屬關係並不容易。一方面,一個人即使窮畢生之力,最多也只能弄懂幾十種語言而已,何況學者關心的不只是簡單的「關係」,而是還要有能力找到證據,能把親屬關係清清楚楚地劃出它的樹狀圖,跟生物學上的分類追求親緣關係一樣,這種功夫就不可能靠個人單打獨鬥,而是需要一群人發揮集體意志,經過幾十年的研究才可能完成。從1930年代開始到今天,我們總算清楚地掌握了900~1,200個南島語親屬關係的樹狀圖。
南島語族的原鄉
上面提到過南島語系的分布。任何一個語系都有它固定的地理分布範圍。語系分布幅原如果狹小,爭論它的原鄉意義就可能不是很重要,但對於像南島語系這種地理分布廣闊的語系,確認其原鄉意義就很不尋常。因為一旦確定它的原鄉,就等於決定該族群遷徙的方向了。南島民族的原鄉如果是臺灣,那麼其遷徙方向就是一路往西到爪哇,一路往東南到太平洋;如果原鄉是在新幾內亞─美拉尼西亞一帶(60年代耶魯大學教授Dyen即曾如此主張),那麼遷徙的方向就分兩路:一路往北,到臺灣;一路往東,到達大洋洲。但這個說法,目前語言學者或考古學者並不採信。
語言學上,認定一個語系的原鄉是尋找出語言之間歧異度最高的地方。歧異度是指一個語系的第一層的語支多寡的程度。語支越多的地方表示這個地方語言的歧異度越高。目前學者認為南島語系第一層的語支有10支,其中9支都在臺灣,臺灣以外的語言全部都屬於剩下的一支。而這一支一般稱為馬來玻里尼西亞語支(上面提過越南南部占族講的占語很可能屬於馬來玻里尼西亞語支)。因此就語言學上的證據而言,除非別有用心,南島語族的原鄉就是臺灣,很少有人懷疑。
最近也有部分學者認為壯侗語系(或稱侗台語系)(英語稱為Tai-Kadai)有可能是南島語系的第11支,但也可能是古馬來玻里尼西亞語支下面的一個次語支。因此,南島語系的親屬關係樹狀圖如圖5所示。其中PAN指古南島語,FORMOSAN指臺灣的南島語,PMP指古馬來玻里尼西亞語支。WMP指西部馬來玻里尼西亞次語支。PCEMP指古中東馬來玻里尼西亞次次語支等。臺灣的南島語曾多達20種以上,但現在僅剩下13種,如圖6所示。
臺灣的南島語從北到南是:
1. 巴賽語 (Basay) (今臺北以北、以西一帶;已消失)
2. 凱達格蘭語 (Ketangalan) (泛指今臺北、桃園平埔族;已消失)
3. 龜崙語 (Kulun) (今桃園龜山;似應為凱達格蘭語之一支;已消失)
4. 噶瑪蘭語 (Kavalan)
5. 泰雅語 (Atayal)
6. 賽夏語 (Saisiyat)
7. 道卡斯語 (Taokas) (今新竹苗栗平原;已消失)
8. 賽德克語 (Seediq)
9. 巴布拉語 (Papora) (今梧棲、沙鹿、清水一帶;已消失)
10. 巴則海語 (Pazeh)
11. 撒其扎亞語 (Sakizaya)
12. 貓霧拉語 (Babuza) (今彰化、西螺;已消失)
13. 邵語 (Thao)
14. 豆蘭語 (Nataoran)
15. 洪雅語 (Hoanya) (今草屯、南投、斗六;已消失)
16. 鄒語 (Tsou)
17. 布農語 (Bunun)
18. 阿美語 (Amis)
19. 卡那卡那布語 (Kanakanabu)
20. 沙阿魯阿語 (Saaroa)
21. 西拉雅語 (Siraya) (臺南及高雄平原;已消失)
22. 魯凱語 (Rukai)
23. 卑南語 (Puyuma)
24. 排灣語 (Paiwan)
25. 雅美語 (Yami)
遺傳學的研究
過去20多年學者根據不同的遺傳指標,研究人類族群的起源或遷徙,發表許多成果,使得南島民族的研究更為多元,成為語言學、考古學之外一項重要的研究議題。一般常用的遺傳指標為紅血球標記(RBC markers)、紅血球酵素(RBC enzymes)、人類白血球抗原(HLA)、Y染色體、粒腺體DNA、SNP(Single Nucleotide Polymorphism,單點核苷酸多態性)、微衛星體(microsatellites)等。其中Y染色體與粒腺體DNA這兩種基因是單系遺傳,不經過重組,適合用以追溯單系血緣研究。人類遺傳學的研究首先要收集完備臺灣各原住民族群之基因庫,並對臺灣原住民族群、東南亞族群及玻里尼西亞族群基因進行分析與比較,同時將遺傳學的結果和語言學及考古學的觀點,互為檢視、比較與整合。根據這樣的研究,期望能回答臺灣原住民族群特殊遺傳基因標記的演化機制及成因,了解臺灣原住民族群以及南島語族的起源、遷移與擴散。初步的遺傳證據顯示,臺灣原住民族群和太平洋南島語族有密切的關聯;但未知的疑問尚留更多。在Y染色體研究方面,中國大陸學者的研究結果顯示東南亞族群最為多樣,在15個單倍型中出現了14個,臺灣原住民只有7個,麥克羅西亞與玻里尼西亞共有10個單倍型,其中9個也出現在東南亞族群。麥克羅西亞與玻里尼西亞族群只有4個單倍型與臺灣原住民共享,因此麥克羅西亞/玻里尼西亞族群與臺灣原住民分別是兩套不同的單倍型,而這兩套都出現在東南亞。另外遺傳距離也顯示這兩個地區的距離是任何一個與東南亞距離的兩倍。因此這些學者認為臺灣原住民與麥克羅西亞/玻里尼西亞族群的源頭應該是在亞洲大陸。雖然無法確定是何處,但大陸東南亞最有可能。
粒腺體DNA的研究似乎更為混沌。不過日本學者Tajima等人的研究把臺灣原住民的粒腺體分為8個不同的群,分別為C1~C8,其中C2和C4在其他人類族群幾乎沒有出現。Tajima等人計算C2出現的時間為11,000+/﹣7,900年前,C4出現的時間為26,000+/﹣8,100年前。這兩個年代可以推測原住民可能在26,000~11,000年前冰河期結束前就來到臺灣。如果再加上較為普遍的C6~C8,那麼原住民至少是分成三波移民到臺灣。
馬偕醫院林媽利醫師及其研究團隊(包括臺大生化所余榮熾教授)在紅血球抗原表現型的分析研究顯示,臺灣原住民族群的某些紅血球抗原表現型頻率,和臺灣的閩南或客家族群,以及中國大陸族群有明顯的差異。特別是位於東海岸的阿美族、卑南族以及排灣族,紅血球抗原有更為歧異的表徵。而臺灣原住民族群的某些紅血球抗原表現型,也顯示和東南亞及玻里尼西亞族群的關聯性;這些顯示具有關聯性的紅血球抗原表現型包括Lewis血型、JKnull血型和MiIII血型。其中MiIII血型在阿美族占95%,雅美族占34%,卑南族占21%,是世界上頻率最高的三個族群,但鄰近的魯凱族與排灣族占的比例反而是0,似乎表示臺灣原住民是不同的年代來到臺灣,而且互不通婚。
不過,不同的遺傳標記的研究分別導出不太一樣的結果。例如在HLA和微衛星體的研究,臺灣原住民各族群間的遺傳關係上,表現的不一樣,但是與其他南島民族、島嶼東南亞或其他地區的族群比較,臺灣的原住民還是關係較為密切。
結語
語言或考古學的研究認為臺灣是南島民族擴散的起源地,約在5千年前從臺灣東海岸向南洋群島等地遷移,因此臺灣原住民或整個南島民族語言文化的起源、親緣關係、遺傳關係的研究等議題,成為學術界甚至一般知識分子很感興趣的問題。本文僅利用有限篇幅,描繪出這個龐大的研究議題中非常小的一部分,給讀者一個粗淺的理解。對任何議題有進一步的興趣的讀者,事實上很容易藉著網路上維基百科的文章,閱讀很多相關的研究結果。又本報導屬非純學術性質,因此關鍵的地方並沒有提供註解或引文出處。(本專題策畫/外文系江文瑜教授)
黃宣範小檔案
(http://homepage.ntu.edu.tw/%7Esfhuang/)
現職:臺大語言學研究所名譽教授
經歷:臺大語言學研究所教授兼所長
國科會傑出特約研究員獎
臺大終身特聘教授
巫永福文化評論獎
臺大胡適講座
臺灣語言學學會理事長
國科會人文學研究中心主任
研究興趣:功能語法學;認知語意學;南島語言學
(圖為2005年5月與夫人同遊北海道時攝)
圖說:
圖1:臺灣史前重要的考古遺址。
圖2:東南亞族群遷徙路徑。
圖3:南島語的分布。
圖4:南島語的分布(顯示幾個不同的語支)。
圖5:南島語親屬關係。
圖6:臺灣的南島語(含已消失的平埔族語)。