從小我就對科學研究如何產生知識有很大的好奇心,讀到休謨(David Hume)對歸納法的質疑,更是心動,同意他所認為歸納所得的假說只是一種猜測而非真理,但是無法解釋何以歸納出來的假說,卻常是物理、化學的定理。直到讀到巴柏(Karl Popper)提出科學知識的產生,乃是不斷的對所有的假說加以推翻,而尚未被推翻的假說至少比已被推翻者更接近真理[1],我的內心才比較平靜,且終生研究的基本哲學就是在推翻假說,以不斷創新。而假說驗證之開始即是進行測量。
流行病學研究方法
流行病學是一門探討人群健康相關議題的科學,也是植根於科學研究的基本道理。流行病學的開展,是由流行病學家利用政府機構定期收集的死亡、出生證明中求得死亡率、出生率等等人口統計學資料作病因之解釋。由於這些資料會隨著地點、時間及人口特性如年齡、性別而有所改變,流行病學家嘗試提出合理假說來解釋及預測這些趨勢。他們隨即發現可以藉由不同的健康事件求出急性疾病如食物中毒、麻疹及小兒麻痺,或慢性病如癌症、糖尿病、中風等罹病率(morbidity)。在確定觀察時間的情況下,更可以求得痊癒率(cure rate)、復發率(recurrency rate)及致死率(fatality rate)。MacMahon and Pugh[2]將流行病測量歸納出率(rate)、分率(proportional rate)及比率(ratio)三類,更指出考量人、時、地和其他不同變因的重要性。
最初,計算健康事件的疾病發生率(如霍亂)近似於伯努力試驗(Bernoulli trials)的正向反應次數(frequency of positive responses)。但是當流行病學家開始慢性病的研究後,時間作為分母的發生率概念逐漸明顯[3]。因為事件(疾病)隨著時間推移而發生,如果觀察期被延長,族群內有些個案可能會失去追蹤或是檢查出有病,如果將此視為存活的危害率(hazard rate),那麼統計學家就可以分析發生率之變化及變因[4]。
發生率的應用層面很廣,譬如我們研究T牌和V牌車傷害事故的發生率,分子是發生事故傷害之人數,而分母即是暴露在風險的總人時量(開車的總人時數population-time at risk)﹔再藉由率差(兩率相減)或率比(兩率相除)來比較哪一款的車子,對於一般民眾來說較為安全。因為我們的目標是要找出車子的品質與設計的良窳,因此在研究的過程中,就必須要「找出變因」,也就是,是否車子的零件品質、或是安全帶、安全氣囊對於事故傷害發生造成影響。
回到流行病學來說,在急性的疾病中,找出變因較為容易,但是在慢性病中則較難,因為其他變因較可能混入。因此我們應該從了解科學研究的基本原理開始,不斷的提出假說跟否證假說。用Karl Popper的說法就是「猜測與否證」(conjectures and refutations)。由於所提出的假說不一定可被直接測試或推翻,因此需要從假說產生一些演繹性的命題(statement),而這些命題是比較可以被直接的驗證。如此假說就能被驗證其真假,經過多次被嘗試推翻卻未能推翻成功的假說,就是最接近真相的假說。我們無法百分之百證實某個假說是正確的,但是卻可以藉由否證失敗來證明某個假說較接近真理。相對於其他已被否證或推翻的假說,到目前為止尚未被推翻的假說較接近真相。
職業病診斷
臺灣在80年代以前,職業病的診斷和資料極為有限。在我剛回國的4年內,得到許多人的協助,以謹慎的方法驗證,發現了8種職業病。要感謝許多指教的師長和各方人員,我好比桌子的桌面,很風光,可以被看見,但如果沒有了未被外界看見的桌腳做無名英雄,桌子就倒了!經由共同不斷的努力,讓臺灣在職業病的鑑定與預防上,有了顯著的進步。茲舉如下兩例,說明猜測與否證如何找到職業病因。
1986年,發生一起印刷廠工人群聚爆發肝炎[5]的事件。一開始,雇主跟員工都認為是B型肝炎引起,因為B型肝炎在臺灣的盛行率大約15-20%。如果我們沒有考慮到其他可能原因,就不會發現其實是清潔劑中的四氯化碳所引起。但是要驗證它並非病毒性肝炎引起,同樣需提出證據。於是在事故後第10天對每位工人進行血清中A型肝炎IgM抗體檢測,確定他們均非急性A型肝炎;再依B肝帶原作分層分析,發現25位工人中有5位未在中央冷氣系統中工作,雖有一位B肝帶原者,但肝功能(血清丙胺酸轉氨酶Alanine aminotransferase,簡寫為ALT)正常。倒是在中央冷氣系統下工作的20個人,7位B肝帶原者有6位肝功能異常,非帶原者中13位有11位異常;顯示B肝帶原無法完全解釋這次的肝功能異常事件。進一步於事故後停工第20天追蹤此17位肝功能曾異常者,發現每位肝功能均大有進步;5位ALT原大於600 IU/liter者均進步至原值的1/5以下,其餘12位均恢復至接近正常或更低(小於45 IU/liter)﹔因此研究者推論此次肝炎群聚爆發只有化學性肝炎,可能是溶劑揮發,經由中央冷氣系統傳到各房間內導致。因為若是病毒性肝炎導致,則可能17位異常者只有近半恢復,而不是在10天內每一位均大有進步。
在職業病鑑定的過程中,我們經常需要像上例一樣,運用科學證據驗證,並推翻職業病因的假說而找到另外的病因。1986年9月,一間位於彰化的彩色印刷工廠,有個學徒忽然發生了急性四肢無力跟呼吸困難的症狀[6-7],有幾個工人也發生相同的症狀。研究者到現場調查病因,原先以為可能是彩色印刷工廠使用有機溶劑所引起的職業病,當然研究者也想到疾病所引起的上運動神經元、下運動神經元或是神經-肌肉接觸點(neuromuscular junction)功能缺失等可能。研究者根據不同假說演繹出幾項預期的結果:
(1) 如果有機溶劑中毒是原因(H1),那麼病人應該會出現意識昏迷的情況。
(2) 如果是由其他有機溶劑所引起的多發性神經病變(H2、H3),例如正己烷、丙烯醯胺(Acrylamide)、甲基正丁酮(Methylbutyl ketone),那麼神經傳導速度(nerve conduction velocity, NCV)應該會下降。
(3) 如果是其他疾病引起上運動神經元病變(Hn-2),那病人應該會出現意識昏迷或不自主運動或顫抖的症狀。
(4) 如果是Guillain-Barre syndrome(一種下運動神經元疾病)所引起(Hn-1),通常不會有群聚現象,同時病人往往會有去髓鞘(demyelination)的相關症狀出現,例如神經傳導速度下降。
(5) 如果是重症肌無力或是其他神經-肌肉接觸點疾病引起(Hn(1)),neostigmine test應該呈陽性反應。
(6) 如果是由其他藥物、農藥(如有機磷)、蜘蛛或是雨傘節毒蛇咬傷所引起(Hn(2)),那麼在症狀發生前應該要有用藥或是被咬的經歷。
(7) 如果是肉毒桿菌引起(Hn(3)),研究者應該可以在患者食用的食物中,培養出肉毒桿菌跟發現肉毒桿菌毒素。
實地訪視發現,所有病人並未出現意識昏迷或顫抖的症狀;為3位發生複視、雙足無力症狀的病人安排神經傳導速度檢查,並未發現神經傳導速度有影響,也都沒有產生不自主運動。在症狀發生前,也沒有個案服用藥物或是被蜘蛛或蛇咬傷。neostigmine test均呈現陰性反應。研究者發現,症狀的發生跟9月26日或27日當天早晨,是否在工廠用早餐有明顯的關連。7個有類似症狀的人,當天通通都在工廠吃早餐,其他沒有症狀的32人,只有7個在工廠吃早餐。(Fisher’s exact test p=0.0002)[8]。後來對所剩食物採樣,在當天早餐食用的花生罐頭中,檢驗出有肉毒桿菌與肉毒桿菌毒素的存在。最後的否證試驗,則是將該花生罐頭產品從市面上移除,後來再也沒有新的個案發生。這個研究是臺灣第一次証實由市售產品引起肉毒桿菌中毒的案例。
以下將這個案例的推斷方法用圖1表示:
我們先後與臺大醫學校區及其他醫院同仁利用「推翻假說」的方式來驗證,證實了20種以上的職業病與環境病,由下列物質所引起:煤油(kerosene)、正己烷(n-hexane)、雙吡啶異構物(bipyridines)、四氯化碳(carbon tetrachloride)、二異氰酸甲苯(toluene diisocyanate)、石綿(asbestos)、錳(manganese)、有機磷劑(organophosphorus)製造、二甲基甲醯胺(dimethyl formamide)、混合溶劑(mixture of solvents)、防霉劑(thiazolidone)、汞(mercury)、鉻酸(chromate)、氯乙烯(vinyl chloride)、二甲基乙醯胺(dimethyl acetamide)、乙二醇(ethylene glycol)、氯仿(chloroform)、海龍(Halon)混合物等。這些研究發現促成我國領先亞洲各國在1993年底頒布「危險物及有害物通識規則」,為每個工作場所所接觸的物質建立一張物質安全資料表。2008年12月起,歐盟全面推動“REACH”計畫,更要求約兩萬種在歐盟進出口之物質均需註冊其毒性。
生活品質與健康計量方法
1989年,臺灣社會正在醞釀著一件改變未來的重要決定:全民健保。全民健保在開辦前,即有人質疑,美國如此先進的國家都沒有辦全民健保,臺灣有什麼能力或財力?經濟學家也提出警告,全民健保很可能會倒閉!引發我深入思考,畢竟全民健保是對貧困者最基本的保障,若不能永續經營,則對大眾健康及社會的穩定無疑是一大傷害。有經濟學家告訴我,全民健保要永續經營的主要辦法就是做好成本與效果的管理(Cost effectiveness)。一般的成本計量,只要將所有的花費均已被計入且分類又夠細,各項成本不重疊即可;但就效果(effectiveness)來看,卻比較沒有明確的定義或測量。例如,究竟怎樣的治療算是有療效的?什麼樣的藥可以帶來比較好的效果?
醫療的目的就是希望全體的民眾都健康,而人們對健康的定義大多是長壽以及生活品質好:也就是不只要活得久、也要活得快樂、活得舒服。就壽命來看,我們有存活函數可以測量;但是生活品質的測量,則顯得虛無縹緲、無所依據,如果無法對此下定義,則無從測量起,亦即無法對生活品質做出量化的比較。則如何算是有效的醫療行為、如何算是好的效果,無從比較、無從控管,也就無法達成永續經營必須要求的「成本效果」控制。
既然如此,如何讓生活品質和壽命合併計量,可能是值得努力的方向。早在1968年[9],就有一位腎臟科醫生提出以生活品質調整後的存活時間的觀念。也就是不只考慮存活的長短,還加上生活品質的影響。生活品質既然要計量,則需要方法:心理計量和效用(或偏好)計量。心理計量是一種主觀計量法,如今天哪裡疼痛及其頻率與嚴重程度、治療後舒服的程度、滿意不滿意等,其結果影響臨床決策;效用(utility)或偏好(preference)的計量則是一種經濟觀念計量(預期效用理論),往往牽涉到不確定性(或風險)的觀念及當事人需面臨的選擇,例如氣切病人能藉此延續生命,但是生活品質卻可能大為改變,那麼進行氣切手術與死亡,要如何選擇?一般利用偏好計量來分析國家的健保或醫療資源如何分配,才能在最小成本下,讓全民的健康達到一個最大值。
加入生活品質來調整存活函數的觀念,後來逐漸衍生成生活品質調整後存活人年(Quality adjusted life year, QALY)[10-12]的概念。而世界衛生組織所進行的計量公眾健康研究[13],過去幾年都以失能調整後之人年(DALY,disability-adjusted life year)來計算各種疾病負擔(burden of disease)及各種因子造成的健康衝擊[14]。但DALY的計量單位只考慮生理的健康,並未全盤考量生活品質,且未算出疾病耗費的健保費用。因此讓我們有機會將健康的計量分成存活時間長短(survival time)和生活品質(quality of life,QOL)兩方面來考量並整合,並利用健保資料庫來計算醫療照護的成本。圖3說明我們所採取的方法和醫療介入後造成的影響[15]。
英國於1990年代初期即開始用QALY作健康計量單位,通常是把存活曲線取積分來得知預期壽命,然後對該種病患之生活品質測其平均值,乘以其預期壽命即為生活品質調整後之預期壽命。例如:假設一個洗腎病患的健康相關生活品質(health-related quality of life)平均為0.7,則把整個曲線下的面積乘以0.7,即是洗腎病患終生剩下的健康人年數。相當於把疾病診斷後的存活曲線每一點都乘以0.7,則會劃出曲線,而這條曲線底下的面積即為生活品質調整後的存活壽命(quality adjusted life expectancy,QALE),以QALY作計量單位。如圖4所示:
如果以每年存活率乘以某疾病一個個案平均一年所需醫療費用,再加上折現率或是醫療照顧的通貨膨脹,逐年加總折現便可計算出一個病患一生需要多少醫療花費。但是僅用一個平均值來代表某病之病人的生活品質太過簡略,因此將得病後每個時間點之生活品質均加以量化,連成一條曲線(quality adjusted survival curve),再將底下的面積積分,會更準確估計生活品質調整後之預期壽命[16],如圖5所示。
此生活品質調整後的存活壽命(QALE)亦可以一般的生命表各時間點t之存活率,再乘以生活品質後加總來估計。寫成數學公式如下[17]:
∫ E[Qol(t|xi)]S(t|xi)dt
在知道了如何計算生活品質調整後的存活壽命,就可以將其運用在各項疾病的計算上,以肝癌為例:臺大醫院肝癌的世代族群,肝癌的平均診斷年齡為58歲,約可活11個月,也可以看出1年、3年的存活各多少,圖6下降的虛線為存活函數,用標準賭博法(standard gamble)的方式去問生活品質,可得到另一條上揚的曲線即為QOL曲線,可以發現存活時間越久,自覺生活品質越好,此發現和世界各國一致;而將生活品質與存活函數乘起來就得到最下面那條曲線-QAS(quality adjusted survival)。1999年我們研究團隊也發展出一個公式,可以將這條曲線做外推(extrapolation),這也是我們目前暫時領先國際之處[18],同時此法已被用數學導出,只要合乎”constant excess hazard”;此法[19]在我國男女17大癌症及職災永久殘障病人身上證實[20-21]。
另外我們用臺灣生命統計的存活函數,找出與肝癌病患在年齡、性別等可以相互匹配的一群正常人,假定他們的生活品質為1,即可做出他們平均的QAS曲線,為圖7中上方的曲線,而下方曲線即為全國癌症登記肝癌病患的QAS曲線,兩曲線中間所夾的面積即為預防一個肝癌的發生平均可以得到的健康效益,可用健康量(約19.5健康人年)加上所節省的健保費用來計量表示。
用以上的方法,也可計算出每種疾病的每個病例預期壽命損失的人年,以及每產生一個病例健保要負擔多少錢。把健保所需負擔的費用乘以每年該疾病的新個案數即可算出當年該類病患的終生健保財務負擔。從臺灣17大癌症,即男女10大癌症裡頭可發現,結腸直腸癌以折現率3%且醫療費用年膨脹率3%計算,每年新增個案終其一生將需花掉健保約50億;在肝臟疾病方面,人民損失的壽命較多,但健保負擔部分每年總共只增加20億,因為肝癌罹病後存活時間較短。至於洗腎病人,若以折現率0%或2%計算個案,就可以瞭解臺灣專門洗腎的機構為何如此盛行。由2002及2003年每名洗腎病患所需醫療費平均值來看,一個洗腎病患終生可以為醫院帶來約400萬元的健保給付,所以這個部分應該要以預防來進行控制,以免將來健保財務更加惡化。
根據研究發現,臺灣洗腎費用仍然比其他國家來的便宜,約僅日本3分之1,加拿大或美國的4分或5分之1。如果把洗腎費用除以臺灣的GDP,仍然比較便宜。我們應該推動預防來減少本國洗腎人口,而洗腎機構則可結合旅遊業讓鄰近國家(如日本)的病患,來臺洗腎順道旅遊以繼續維持營運。這是我的主張:讓亞太各國的洗腎病患來臺灣消費,因臺灣洗腎費用較低廉,且品質(存活率)可能更優良。而要達到此一目標則需要發展實證醫學(Evidence based medicine),讓我們的醫療被世界認同且能接受考驗!
我們將QALY的概念落實到健康計量上,就能夠促進健保使用的某種公平性,促進其永續的目標;將最合乎成本效果之醫療指引,落實到全部的醫療院所,不僅在預防和臨床上有所依據,也可以讓臺灣的健康照護市場更有競爭力!(本專題策畫/流行病學研究所蕭朱杏教授)
參考文獻:
[1] Popper KR. Conjectures and refutations: the growth of scientific knowledge, New York: Harpper & Row, 1965, pp. 33-65, 215-250.
[2] MacMahon B, Pugh TF. Epidemiology: principles and methods, Boston: Little, Brown and Company, 1970.
[3] Elandt-Johnson RC. Definition of rates: some marks on their use and misuse. Am J Epidemiol 1975;102:267-71.
[4] Breslow NE, Day NE. Statistical methods in cancer research. Vol I-The design and analysis of cohort studies, Lyon: International Agency for Research on Cancer, 1980, pp.41-81.
[5] Deng JF, Wang JD, Shih TS, Lan FL. Outbreak of carbon tetrachloride poisoning in a color printing factory related to the use of isopropyl alcohol and an air conditioning system in Taiwan. Am J Industr Med 1987;12:11-19.
[6] Wang JD, Chang YC. An outbreak of type A botulism due to commercially preserved peanuts- Chang Hwa Conuty. Epidemiol Bull(R.O.C.) 1987;3(3):21-23.
[7] Tsai SJ, Chang YC, Wang JD, Chou JH. Outbreak of type A botulism caused by a commercial food product in Taiwan: clinical and epidemiological investigations. Chin Med J (Taipei) 1990;46:43-8.
[8] Chou JH, Hwang PH, Malison MD. An outbreak of type A foodborne botulism in Taiwan due to commercially preserved peanuts. Int J Epidemiol 1988;17(4):899-902.
[9] Klarman HE, Francis JO, Rosenthal GD. Cost-effectiveness analysis applied to the treatment of chronic renal disease. Med Care 1968;6:48-54.
[10] Weinstein MC, Stason WB. Foundations of cost-effectiveness analysis for health and medical practices. New Engl J Med 1977;296:716-21.
[11] Beauchamp TL, Childress JF. Principles of biomedical ethics. 4th ed and 5th ed. New York: Oxford University Press, 1994, and 2001.
[12] Gold MR, Siegel JE, Russell LB, Weinstein MC. Cost-effectiveness in health and medicine. 1st ed. Oxford, U.K.: Oxford University Press, 1996.
[13] Murray CJL, Salmon JA, Mathers CD, et al eds. Summary Measures of Population Health: Concepts, Ethics, Measurement and Applications. Geneva: World Health Organization, 2002.
[14] Ezzati M, Lopez AD, Rodgers A, et al eds. Comparative Quantification of Health Risks: Global and Regional Burden of Disease Attributable to Selected Major Risk Factors. Geneva: World Health Organization, 2004.
[15] 王榮德、劉邦祥、何子豪:以合乎成本效果之臨床指引達成民眾、健保與醫界的三贏局面。臺灣醫界 2007; 50(5):234-239.
[16] Hwang JS, Tsauo JY, Wang JD. Estimation of expected quality adjusted survival by cross sectional survey. Statistics in Medicine 1996;15:93-102.
[17] Wang JD. Basic Principles and Practical Applications in Epidemiological Research. Singapore: World Scientific, 2002, pp.147-157.
[18] Hwang JS , Wang JD. Monte Carlo estimation of extrapolation of quality-adjusted survival for follow-up studies. Statistics in Medicine 1999;18:1627-1640.
[19] Fang CT, Chang YY, Hsu HM, Twu SJ, Chen KT, Lin CC, Huang LYL, Chen MY, Huang JS, Wang JD, Chuang CY. Life expectancy of patients with newly diagnosed HIV infection in the era of highly active antiretroviral therapy. QJM-An Int J Med 2007; 100:97-105.
[20] Chu PC, Wang JD, Hwang JS, Chang YY. Estimation of life expectancy and the expected years of life lost in patients with major cancers: Extrapolation of survival curves under high-censored rates. Value Health 2008; 7:1102-1109.
[21] Ho JJ, Hwang JS, Wang JD. Estimation of reduced life expectancy from serious occupational injuries in Taiwan. Accident Anal Prev 2006; 38:961-968.
圖說:
圖1:1986年印刷廠B肝事件推斷表。
圖2:透過訪視抽絲剝繭,找出職業環境災害因子。圖為塑膠合成工廠混合攪拌的個案。訪視目的:患者血中鉛濃度追蹤半年以上皆呈現異常,尋找可能之鉛暴露來源以及改善工廠作業環境。訪視結果:訪視個案報告血中鉛濃度過高,發現相關之暴露證據為制燃劑三氧化二銻中含有鉛成分707ppm。同時不明來源之塑膠染料亦可能含有鉛成分。
圖3:健康人年(QALY)的計算:
∑(在狀態i下之存活長度)×(在狀態i下之生活品質)
圖4:1990年代啟用之生活品質調整後的存活壽命。
圖5:評估存活函數、平均生活品質和生活品質校正後之存活曲線;生活品質校正後之存活曲線下的面積是生活品質校正後之存活時間[17]。
圖6:生活品質校正後的存活QAS,以臺大醫院之肝癌研究為例。
圖7:用QAS進一步預測採取預防可獲得的健康效益。
圖8:2009年3月參加南非ICOH會議。
王榮德小檔案
1975年臺大醫學系畢,赴美國哈佛大學公共衛生學院深造,先後獲工業衛生碩士(1979)與職業醫學博士(1982)。現任臺大醫院內科醫師與公衛學院職業醫學與工業衛生研究所教授,2002-05年間擔任公共衛生學院院長。
王教授與其研究團隊證實了20種以上的職業病與環境病。促成我國在1993年頒布「危險物及有害物通識規則」。與中研院統計所黃景祥教授在1996年發現了公式∫E[Qol(t|xi)]S(t|xi)dt,整合存活函數S(t|xi)及生活品質函數Qol(t|xi)之統計方法,提出「健康人年」計量單位(quality-adjusted life year)。另與本校經濟系劉錦添教授利用假設性市場法(contingent valuation method)測量,把疼痛時之單位化為貨幣值;又與心理系姚開屏教授及同仁共同發展臺灣版世界衛生組織生活品質問卷(WHOQOL),目前已有超過600個研究登記使用本問卷,成為健康產業效果評估基本工具。已發表300篇學術論文、55篇教科書報雜誌文章,以及5本中文書、一本英文教科書。獲頒教育部學術獎、兩次講座教授獎、行政院傑出科學與技術人才獎等榮譽。