周業(yè)安:度量公共治理
發(fā)布時間:2020-06-05 來源: 歷史回眸 點擊:
盛洪:雙周已經(jīng)持續(xù)了十四年,每次幾乎都是全文放在網(wǎng)上。從主講人的報告到評議再到爭論,記錄是比較完整的。今天的周業(yè)安教授要做的報告是天則所的一個課題——度量公共治理。這個課題是茅老師牽頭的,周業(yè)安是研究核心力量。這個題目很有意義也很有難度。公共治理是政府要提供的公共服務,對政府的服務的評價涉及到對政府績效的判斷。同時,雖然實際不存在競爭(政府是自然壟斷的),但是對不同地方的政府進行評價可能會有助于建立一種標尺競爭。這樣,就可能促進政府努力改進其工作。難度較大是因為公共物品是不能直接由市場度量的。它不是競爭的而是自然壟斷進行提供的,同時又是非排它的,所以不能用市場機制來評價它。因此,我們作為經(jīng)濟學家就會進行這樣的工作,試圖評價政府提供的公共治理的質(zhì)量和數(shù)量。我就不再多講了,請周業(yè)安教授給大家詳細地介紹。
周業(yè)安:感謝各位老師以及朋友來參加這次論壇。首先簡單地介紹一下這個項目的背景。這個問題首先是由茅老師和天則的楊培鴻想到的,也就是如何度量公共治理。當時立了項以后的參與者有茅老師、楊培鴻、清華的賈西津等人。這個問題的前一部分和我們之前做的對經(jīng)濟人權(quán)的研究有關(guān)。研究經(jīng)濟人權(quán)的時候,我們的想法還不是很成熟。我們開始想到的是用一些客觀的指標度量經(jīng)濟人權(quán)。后來發(fā)現(xiàn)效果不是特別好,所以在第二個階段的時候,我們嘗試用調(diào)查的方法解決這個問題。由于對企業(yè)進行調(diào)查比較困難,所以我們只進行了居民調(diào)查。
現(xiàn)在就講一下我們是如何設計這個調(diào)查,如何通過這些數(shù)據(jù)獲得對于公共治理的量化分析。和茅老師商量以后我們將這個主題分成兩個部分。我今天先和大家討論具體的度量方法,然后由清華的賈西津老師來談一談度量背后的公共治理的背景。因為公共治理是一個很特殊的概念,不把背景討論清楚可能使得討論度量存在一定的困難。
一、研究背景
這個研究的背景是現(xiàn)在的社會公共問題越來越突出。關(guān)于公共問題各位老師有很多的研究,比如收入分配問題、公共安全問題、公共衛(wèi)生問題等等。我們認為產(chǎn)生現(xiàn)有問題的根本原因是現(xiàn)有的公共治理機制的失靈。國內(nèi)現(xiàn)在對公共治理的規(guī)范的討論比較多,但是實證數(shù)據(jù)比較少;
單方面的評價數(shù)據(jù)比較多,全面的評價數(shù)據(jù)比較少。相比之下,國外的公共治理評價是非常繁榮的。按照Malik(2002)的說法,治理評價指數(shù)已經(jīng)成為一個產(chǎn)業(yè),迄今種類不下150種。評價單一的時候不能排除評價機構(gòu)由于本身利益性的考慮可能有公正性的問題。評價多了以后,評價機構(gòu)之間的競爭會使得判斷更加客觀。所以,對于公共治理的評價,多一點比少一點好。
目前國際機構(gòu)對中國公共治理的評價建立在國別基礎之上,在地區(qū)層面較少。目前國內(nèi)地區(qū)層面的評價代表性的有三個:第一,國際復興開發(fā)銀行和世界銀行對中國120個城市競爭力的評級,其中涉及到政府效率評價;
第二,樊綱 、王小魯和朱恒鵬(2007)等開發(fā)的市場化指數(shù),通過一系列調(diào)查數(shù)據(jù)和客觀數(shù)據(jù)來評價各地區(qū)市場化程度,其中很多指標涉及公共治理的內(nèi)容;
第三,陳昌盛和蔡躍洲(2007)首次對各地區(qū)的公共服務水平進行了系統(tǒng)評價,采用了標準的績效度量方法,依據(jù)客觀數(shù)據(jù)給出了地區(qū)公共服務水平的排名,其中的主要內(nèi)容也構(gòu)成公共治理的一部分。這是較為三個有代表性的比較全面的評價,其它單方面的評價就不一一例舉了。這三個評價中前兩個涉及部分政府的權(quán)利運用問題,但沒有從權(quán)利合理配置的角度來評價,或者說沒有就公共治理的本質(zhì)問題進行評價;
而后一個是純粹的公共服務績效評價,沒有涉及權(quán)利問題。正在進行的有世界銀行對中國部分城市的公共治理評價,以及天則經(jīng)濟研究所對全國30個城市的公共治理評價。
二、國外的公共治理評價
公共治理評價和公共治理的定義有關(guān)。公共治理作為一個新的范式,學者們的理解也不盡相同。歸納起來,主要有以下代表性的觀點:第一種,把公共治理看作政治品(political goods)。它主要由政府提供,其他組織和個人也可以參與。持此種觀點的學者有Besançon(2003)、Rotberg(2004)、Rotberg和 West(2004)。第二種,把公共治理和代議制民主等同起來,看作是民主制度的一個組成部分。持此種觀點的學者有Apreda(2005)。第三種,把公共治理看成一個經(jīng)濟體或者社會中權(quán)威或者權(quán)力(權(quán)利)的實施。至于實施的主體可以是政府,也可以是非政府組織或者單個社會成員。推行此種理論的學者有Huther 和 Shah(1999), UNDP(1997),世行Kaufmann等人。第四種是利益相關(guān)理論,代表學者有Bovaird和 Loffler(2003), Huden和Court(2002)。這種看法和歐洲對治理的理解一脈相承。我們知道OECD出臺了一系列的公司治理準則,其核心也是利益相關(guān)理論。第三、四種看法分別在英美和歐洲占據(jù)主導地位。第五種,把公共治理看作是制度、行為和過程構(gòu)成的一個系統(tǒng)。代表學者有Rhodes(1997:15),UNDP(2006a)。第六種,把公共治理看成一個多元化國家中不同組織(政府和非政府)和個人共同決定和生產(chǎn)公共服務的機制和過程,代表學者是Osborne(2006)。這種看法類似以前德國的公司治理中提到的共同治理的概念。雖然定義不同,但是涉及公共治理的三個基本問題是共同需要面對的。
Bovaird(2005)把這三個問題歸納如下:首先,公共治理是一個規(guī)范概念還是一個實證概念?研究公共管理學的學者可能認為關(guān)于公共治理的討論是規(guī)范性的、是包含某種價值觀的。從經(jīng)濟學的角度講,公共治理又是實證的概念。公共治理到底運行到了怎樣的程度,如何用數(shù)量的方式表達這些公共治理,如何通過這種表達改進治理?也就是說實際層面的運行和績效也是我們關(guān)心的。這兩個方面有脫節(jié)的地方。
其次,政府和市民社會在互動網(wǎng)絡中的相對作用如何?公共品必須滿足兩個特征:非競爭性和非排它性。政府提供這樣的產(chǎn)品可以被看成是公共領域中的一種治理方式。除此之外還有其它的方式,比如科斯的談判方式、布坎南的俱樂部方式等等。這些私人的方式也會引入進來,但是他們在系統(tǒng)中如何相互作用還不是很明確。后來的公共治理運動把政府、市民都看成公共治理中的平等主體,誰提供的效率最高就由誰提供。在很多領域,更多人強調(diào)的是政府和市民的合作提供。這經(jīng)常被稱為公共服務的合作分散。這個公共服務不僅僅是純公共品的概念,還包含了有私人物品特征的公共服務的概念,比如教育、醫(yī)療。在經(jīng)濟學中,這些不一定是私人物品。但是在很多公共經(jīng)濟學家看來它們又是公益品,具有強烈的外部性。它們可以由政府提供,但又不是必然需要政府來提供。其中強調(diào)的是政府和市民在公共治理中形成的互動網(wǎng)絡,這種互動網(wǎng)絡中政府和市民是平等的合作的關(guān)系。現(xiàn)在公共治理運動中的新的趨勢,也就是強調(diào)合作而不是對抗。這和過去的兩分法不太一樣。
另外,如何對治理原則和效率進行權(quán)衡?在經(jīng)濟學中,我們認為在理性狀態(tài)下小政府是最好的。這種觀念就是一種治理原則。不同的看法涉及不同的治理原則。有些人強調(diào)最小政府,有的人贊成大政府。不同治理原則會體現(xiàn)在公共治理的不同的制度安排上。相應地,治理原則是人們評判公共領域中的治理的好壞的標準。我們要考慮這些治理原則能否實施,在實際運行中的表現(xiàn)。所以治理原則和效率的問題就是規(guī)范和實證的問題。
以上三個問題都會影響到公共治理的度量。公共治理治理度量會引起較大爭議,原因就是其中的概念分歧很多、關(guān)于度量思路和理論模型的分歧也很多。在公共治理運動達到高潮的現(xiàn)在,仍然存在傳統(tǒng)和現(xiàn)代的公共治理運動的沖突。不同的治理觀念會帶來相應的度量方法。并且對不同數(shù)據(jù)類型和采集方法的依賴也會產(chǎn)生不同的評價效果。從目前國際上所流行的評價方法看,種類雖多但從大類上可以劃分為兩類:基于客觀數(shù)據(jù)的評價和基于主觀調(diào)查數(shù)據(jù)的評價。
先看看基于客觀數(shù)據(jù)的評價。第一類是依賴各國和地區(qū)的統(tǒng)計數(shù)據(jù),設計恰當?shù)闹笜梭w系進行公共治理評價。典型的是Rotberg在哈佛大學肯尼迪學院發(fā)起的公共治理評價的系列研究。其中很多指標類似于公共服務績效的評價體系。經(jīng)過仔細研究,我們覺得他的這種評價體系沒有脫離績效評價的范疇,和我們所理解的公共治理的評價有一定的距離。Rotberg是一個堅持客觀數(shù)據(jù)的代表人物。他認為所有主觀數(shù)據(jù)的度量都是錯誤的,只有他的客觀數(shù)據(jù)的度量是正確的。另外還有UNDP的人類發(fā)展指數(shù),這和公共治理有關(guān)但不一定有絕對的關(guān)系。
第二類是依賴事件記錄和量化。比如,把各國和地區(qū)一段時間內(nèi)發(fā)生的和公共治理相關(guān)的時間記錄下來,形成數(shù)據(jù)集并由此進行評價。最具代表性是人權(quán)觀察組織對各國和地區(qū)侵犯人權(quán)事件的記錄和評價。人權(quán)評價本身是公共治理評價的一個核心部分。人權(quán)觀察組織把每個時期各個國家和地區(qū)侵犯人權(quán)的事件進行記錄、形成數(shù)據(jù),然后將這些數(shù)據(jù)量化來進行評價。我們當時在討論的時候,張老師也提出過觀察當?shù)氐氖腥菔忻,將之記錄下來形成評價。后來,因為經(jīng)費等問題,我們放棄了這種方法。
主觀調(diào)查數(shù)據(jù)方面的數(shù)據(jù)很多,現(xiàn)在對公共治理的評價也主要是基于主觀調(diào)查數(shù)據(jù)。主觀數(shù)據(jù)評價的種類非常多。有針對公眾的意見調(diào)查,有專家意見調(diào)查,有企業(yè)意見調(diào)查,有特定群體意見調(diào)查等等。不同的調(diào)查方法所采集的數(shù)據(jù)質(zhì)量和信息量是不同的。從目前實施的各種方法看,各有千秋,相互之間有一定的互補性。世界銀行已經(jīng)試圖把一些重要的數(shù)據(jù)庫綜合起來,形成一些綜合指標來評價公共治理。這是一個非常好的嘗試。
客觀數(shù)據(jù)的度量方法剛才已經(jīng)提到了兩種,下面簡單地介紹一些單項指標。1、最簡單的客觀指標就是Clague等人(1999)提出的合同密集型貨幣指標(Contract-Intensive Money,CIM),它是非流通貨幣占貨幣供應總量的比例,即CIM =(M2 - C)/ M2。一個國家中的公共治理水平越高,人們就感覺自己的財產(chǎn)越安全(也就是越不會持有通貨)。這是他們的邏輯,由此進行度量的效果還不錯。2、Rotberg(2004)以及Rotberg和 West(2004)提出了六個方面的客觀指標:法律規(guī)則、政治自由、經(jīng)濟績效、基礎設施、教育和醫(yī)療。每一個指標下面都有一系列的子指標進行度量。3、UNDP人類發(fā)展指數(shù)。4、Djankov等人(2002,2003)對開辦新企業(yè)的花費的測度。5、Knack and Kugler(2002)等人通過測度裝電話的等待時間、電話錯誤的數(shù)量等來度量公共治理。6、菲律賓政策研究中心(the Philippine Center for Policy Studies (PCPS))從1999年啟動了一項善治和地方發(fā)展指數(shù)(the Indicators of Good Governance and Local Development)計劃,2003年完成。該指標簡稱 GOFORDEV Index,提供了地方發(fā)展所需善治的客觀度量指標。
再看看主觀數(shù)據(jù)測度的代表性方法。1、Kaufmann, Kraay和 Zoido-Lobatón (1999a,1999b)構(gòu)建了一個全球治理數(shù)據(jù)庫(the Worldwide Governance Indicators,WGI)。數(shù)據(jù)來源于其他13個不同組織1997和/或1998年的主觀調(diào)查數(shù)據(jù),比如自由之家的經(jīng)濟自由調(diào)查數(shù)據(jù)等。來自不同數(shù)據(jù)庫的相關(guān)的31個指標經(jīng)過綜合形成三個總體指標——法律規(guī)則、政府效力和瀆職,以此來反映治理的三個基本方面。這三個總體指標覆蓋了166、156和155個國家和地區(qū)。為了獲得綜合指標,他們采取了不可觀測成份模型(unobserved components model)來估計治理指數(shù)。其后,Kaufmann, Kraay和 Mastruzzi(2002,2004,2005,2006,2007)不斷修正了這種方法,并擴大了數(shù)據(jù)來源以及數(shù)據(jù)的覆蓋面。在最新一期治理評價報告中, 該治理指標體系已經(jīng)包含有六項綜合指標:呼聲和責任(voice and accountability)、政治穩(wěn)定性和暴力免除(political stability and absence of violence)、政府效力(government effectiveness)、管制質(zhì)量(regulatory quality)、法律規(guī)則(rule of law)以及腐敗的控制(control of corruption)。(點擊此處閱讀下一頁)
指標覆蓋面達到212個國家和地區(qū),時間是從1996到2002年。這些總體指標包含了幾百個度量治理感知的單個變量,這些單個變量的數(shù)據(jù)來自30個組織構(gòu)造的33個獨立的數(shù)據(jù)庫。2、顧客滿意度測量法,比如美國顧客滿意度指數(shù)(The American Customer Satisfaction Index ,ACSI)。這個度量純粹是把公共服務的好壞與其消費者的滿意程度相關(guān)聯(lián),通過問卷調(diào)查獲得顧客對公共服務的滿意程度的數(shù)據(jù),形成滿意度指數(shù)。然后用這個指數(shù)來評價公共治理的好壞。這類似于商業(yè)調(diào)查中對企業(yè)服務進行的調(diào)查。這個指數(shù)現(xiàn)在每年都會發(fā)布。因為涉及到所有居民的主觀判斷,對政府的影響很大。3、治理國際(Governance International)發(fā)展的一種多元利益相關(guān)者評價模型(the GI Governance Health Check),即多元利益相關(guān)者3600評價模型。這個模型中有一個像飛鏢盤的圖。一個圖劃分為幾塊,分別代表不同的治理層次。不同層次可以旋轉(zhuǎn),外圍代表不同的顧客。這和測量顧客滿意度的方法類似,不過評價方式是多層的。4、Bovaird和Loffler(2003)在利益相關(guān)者論基礎上發(fā)展的過程評價法。過程評價方法更重視的是公共治理的程序問題。他們認為公共治理的績效評價是結(jié)果,結(jié)果很多時候是有偶然性的。比如經(jīng)濟發(fā)展了、大家都有錢了,可能人們會覺得公共治理也改善了。但是經(jīng)濟發(fā)展和公共治理的程序的改變并沒有必然的聯(lián)系,經(jīng)濟發(fā)展了人權(quán)不一定會得到改善。5、Court, Hyden和 Mease(2002)等人提出的專家意見法。他們認為簡單地從居民的角度去測度存在很多問題。因為居民可能本身對公共治理這個概念不太理解。從居民的角度來評價偏差很大,應該從專家的角度進行評價。他們在每個國家或者地區(qū)選擇35~40個專家,讓其打分。他們自己也承認這種方法有很大的缺陷性。首先是專家的選擇問題,還有就是打分的時候有相互交流的過程。如果小組的領導人不服責任或者在這方面不是很在行,采集的數(shù)據(jù)就可能非常無效。
有人試圖將主客觀數(shù)據(jù)結(jié)合起來,比如Malik(2002) 、Huther和Shah(1999)等出了將部分數(shù)據(jù)和部分主觀數(shù)據(jù)加總。我們當時也考慮過采取這種方法,但是擔心在加總的時候會存在一些問題。如果客觀數(shù)據(jù)樣本和調(diào)查數(shù)據(jù)樣本不一致,加總時就會產(chǎn)生困難。最后我們放棄了這種方法。
關(guān)于度量方法,到現(xiàn)在仍然存在很大的爭論。首先,不同的治理概念會導致數(shù)據(jù)采集方案的差異。有些定義可以通過客觀數(shù)據(jù)來度量,而另一些定義則只能通過主觀數(shù)據(jù)來度量。對于兩種度量方式孰優(yōu)孰劣,大家爭論不休。其二,既然治理是多元的、系統(tǒng)的概念,是否需要把所有的維度都考慮進來?有的數(shù)據(jù)的評價是很有側(cè)重的,比如專門的腐敗度量、政府信任度量、民主治理度量等等。有的度量則包容寬泛。不同口徑下會導致不同的度量效果。某如果定義較窄,那么需要度量的維度較少;
反之,需要度量的維度就較多。那么是不是維度越多越好?這就是治理度量當中單一指標和綜合指標的爭論。可以說,這兩大問題的爭論貫穿于治理評價的始終。Kaufmann 和 Kraay(2007)明確地指出:相對于試圖度量的特定治理概念來說,任何特定的治理指標本身都會存在度量錯誤;
相對于更寬泛的治理概念來說,任何特定的治理指標都是不完美的度量。最近的一些爭論(比如WGI提出的第二代治理指數(shù),以及類似的其他人提出的可行動的治理指數(shù)等)歸納起來都可以看作以下兩個方面:關(guān)于主觀度量和客觀度量的爭論以及總體指數(shù)和個體指數(shù)的爭論。
三、天則所公共治理評價思路
公共治理本身不是一個很清晰的概念,它的度量也不是一個清晰的概念。這給我們的研究帶來了很大的難度。我們需要清晰地提煉出自己的看法以及度量的思路。下面就講一下我們在做這個研究的時候采取的評價思路。
下面給出我們關(guān)于公共治理的定義。公共治理就是確保公共領域中相關(guān)契約達成、實施和救濟的一系列制度安排和作用機制,它通過權(quán)利的合理配置和機制設計來實現(xiàn)集體福利最大化。這個定義有以下幾個主要方面:1、公共治理是為了解決公共問題的。所謂公共問題,并不局限于純公共品而是可以包含準公共品以及外部性產(chǎn)品(如公益品)和行為。所以我們度量的不一定是純粹的政府行為,我們提出的公共治理的度量不是政府績效的度量,而是在公共領域中的公共治理機制的度量。從我國的現(xiàn)狀看,公共治理機制的主體是政府。2、公共治理本質(zhì)上是集體行動,也就是公共選擇過程。既然是公共選擇過程,就不可避免地會出現(xiàn)免費乘車現(xiàn)象。公共治理就是通過合理的機制設計和權(quán)利安排來有效降低公共領域的交易成本(即政治交易成本)。3、由于公共治理涉及集體利益,就必然存在一個規(guī)范性問題。究竟什么是好的公共治理,即善治的標準是什么?和單純的私人治理不同,在私人領域中只需要考慮資源最優(yōu)配置。但在公共領域,不僅要考慮資源最優(yōu)配置,而且還要考慮交易的公平性。也就是說,公共治理必須做到公平和效率的統(tǒng)一,也就是社會福利最大化。4、公共治理是公共選擇過程,那么就存在多個參與人。也即,集體利益目標是利益相關(guān)者目標的加總。加總過程實際上就是一個社會談判過程,即政治過程。按照規(guī)范的理解,如果這個過程能夠保障每個社會成員的利益,就是好的。而好的唯一標準就是布坎南倡導的一致同意原則。5、公共治理作為一個權(quán)利配置過程,所涉及的權(quán)利和私人治理不同。在私人治理中,財產(chǎn)權(quán)是最重要的權(quán)利。而在公共治理中,財產(chǎn)權(quán)僅僅是一個方面而已。不同的公共問題和人們相應的權(quán)利需求相對應。純公共品對應人們的最基本的權(quán)利需求,也就是對生命安全等公民權(quán)利和政治權(quán)利的需求;
準公共品和外部性產(chǎn)品和行為對應人們其他的權(quán)利需求,主要是經(jīng)濟、社會和文化權(quán)利需求。6、公共治理同時又表現(xiàn)為一個機制設計的過程,借助不同的治理機制來更有效的配置權(quán)利和資源。這些機制包括市場、關(guān)系和政府等一系列環(huán)節(jié),不同治理機制的采納取決于相對應的交易成本的大小。
我們認為公共治理有兩個需要度量的基本要素。將這兩個基本要素提煉出來以后,所有的度量都是圍繞其展開的。一個要素是權(quán)利。和私人治理類似,公共治理本質(zhì)上也是權(quán)利的配置。這一配置分為兩個層次。第一層次是基本權(quán)利的配置;緳(quán)利主要是公民權(quán)利、政治權(quán)利、以及相應的經(jīng)濟社會文化權(quán)利。第二層次是和公共資源有關(guān)的權(quán)利的配置。另一個是政治過程,就是如何保障和實現(xiàn)這些權(quán)利。如果我們指望仁慈的政府,就會依靠政府去實現(xiàn)。如果我們接受布坎南的觀點,我們就需要一個明確的民主制度保障自己的權(quán)利。不同的民主形式在權(quán)利保障方面的作用又是不同的。我們要考察的是我們的政治過程是怎樣的。
權(quán)利和政治過程合起來就會產(chǎn)生一定的績效。如果權(quán)利和政治過程與績效之間是簡單的線性關(guān)系,那么我們就可以通過公共服務評價來度量公共治理。但不幸的是,這種線性關(guān)系并不存在。我們看到,一些實行民主的政體并沒有獲得好的績效,而一些集權(quán)政體反而有高水平的社會經(jīng)濟發(fā)展。因此,單純從績效角度來評價公共治理,顯然違背了公共治理的本意,對改進公共治理沒有幫助。我們主張應該從公共治理本身的基本要素來評價。這樣才能還原公共治理的本來面目,在這種評價基礎上才能更好的提出改進公共治理的建議。
為了度量我們剛才講到的兩個基本要素,我們的二級指標(一級指標是公共治理,二級指標用于體現(xiàn)公共治理的不同的方面)有下面幾個。1、公民權(quán)利和政治權(quán)利。按照這一權(quán)利的內(nèi)涵,我們通過言論和出版自由、對私權(quán)的保護、對自由的保護來加以度量。由于我們打算度量地區(qū),所以國防就沒有考慮進來。因為國防是一個國家的整體事務,和各個地區(qū)無關(guān)。2、社會權(quán)。國內(nèi)法學界通常把經(jīng)濟、社會和文化權(quán)利統(tǒng)稱為“社會權(quán)”,它定義了人們在教育、健康、住房、勞動等方面所享有的權(quán)利。按照社會權(quán)的通常定義,我們把該項權(quán)利分解為公共安全(不含國防,是日常生活中的安全保障)、交通、教育、勞動、環(huán)境、公共衛(wèi)生、住房、社會保障、基本建設等方面加以測度。3、政治過程。其中,關(guān)鍵要體現(xiàn)政府權(quán)利的行使、政治過程的透明度和居民的可參與程度。對于居民的參與程度,開始存在很大的爭議。最初討論的時候,有些學者認為考慮我們國家的居民的參與問題作用不是很大。但是從我們的角度看,有參與和完全沒有參與是兩個概念。在現(xiàn)在有不同渠道參與的情況下,如果忽視參與就無法完全反映政治過程中居民的力量。也就是說我們可能會夸大政府的作用(無論是正面的還是負面的作用)。而且,隨著經(jīng)濟的發(fā)展,人們參與的領域越來越多,參與的程度也越來越強。政治過程只有體現(xiàn)了利益相關(guān)者之間合作管理公共事務、共同生產(chǎn)公共品,才稱得上是現(xiàn)代的公共治理。當然,現(xiàn)實的公共事務管理可能就是一個簡單的行政管理模式,但我們在評價公共治理的時候,不是為了描述現(xiàn)狀,這是我們一再強調(diào)的。政治過程就可以分解為行政程序、民主、參與、信息公開、效率、司法和執(zhí)法等幾個方面。其中司法和執(zhí)法被放入行政范疇中。因為在我國這種政治架構(gòu)下司法和執(zhí)法還沒有分立,不能將之作為單獨的方面進行度量。4、政府廉潔和政府信任。前面三項已經(jīng)足夠表達我們的需要度量的方面了。但是考慮到可能有在技術(shù)化處理中被忽略的指標,我們設計了兩個綜合指標。政府廉潔可以綜合體現(xiàn)整個行政管理體制的運行效率和結(jié)果績效;
而政府信任反映了居民對政府的整體認知水平。我們通過這兩個總體指標的設置來調(diào)整前面單項度量的結(jié)果。
在度量方法上,我們采取主觀數(shù)據(jù)度量中的公眾意見法。沒有采取專家意見調(diào)查法,因為我們認為在國內(nèi)進行專家意見的調(diào)查不太可靠。雖然專家對公共治理認識較多,但是他們的意見可能是偏度較大的。如果采取特殊群體的調(diào)查方法,如何甄別特殊群體、如何進行特殊群體的抽樣又是難度較大的。例如,只分析某個年齡段或者只分析女性受調(diào)查者都是無法進行操作的?紤]了經(jīng)費、人員、方法的特點,我們最后選擇了公共意見法。這個方法類似顧客滿意度評價。公眾意見法的本質(zhì)在于把當?shù)鼐用窨醋魇且粋當?shù)毓仓卫淼闹匾嫦嚓P(guān)者和消費者。他們對公共治理的主觀感受反映了當?shù)鼐用袼J為的所享受的公共治理服務水平,以及他們對公共治理本身的認知水平。我們對某個地方的公共治理進行度量得出的結(jié)果會反映居民對當?shù)氐墓仓卫淼钠毡榭捶。這個普遍看法可能是有偏差的,但是如果一直使用這種方法,第二次、第三次的研究結(jié)果就可以反映出當?shù)鼐用竦母惺艿淖兓。這樣的效果就會很好。通過一定的抽樣方法,我們可以獲取各地的樣本。通過對這些樣本進行詢問,我們就能夠獲得樣本在主觀上感知當?shù)毓仓卫淼闹匾畔ⅰ;谶@些信息,我們就可以給出可比性的度量和評價。我們做了一個假定:當?shù)氐墓仓卫硭胶彤數(shù)鼐用駥Ξ數(shù)毓仓卫淼闹饔^感知度存在線性關(guān)系。這就意味著:如果當?shù)氐墓仓卫硭胶,當(shù)鼐用駥ζ涞闹饔^感知也應該好。不會出現(xiàn)這樣的情況:當?shù)氐墓仓卫硭胶懿,但是當(shù)氐木用駞s反應良好。我們還假定:我們通過抽樣得出的樣本對當?shù)毓仓卫淼闹饔^評價程度反映了當?shù)氐木用窨傮w對當?shù)毓仓卫淼乃降囊话阏J識。
以對教育的測度為例。設計的問題是:1、在過去兩年里,您家為孩子上學大約花了多少贊助費/借讀費/擇校費?2、對他(她)在學校里的各種教育花費(包括學雜費、補課費、文具、校服等),家里感覺負擔重嗎?如果家庭中有沒有上學的適齡兒童,我會問這個問題。3請問他(她)沒有上學主要是什么原因?4、請問您對教育方面的表現(xiàn)滿意嗎?5、在過去兩年里,您認為當?shù)貙τ诮逃怯泻艽蟾纳,一點改善,沒有變化還是更加退步了?4、5兩個問題是對教育的直接滿意程度的度量。最后兩個問題是對教育感知的正面判斷,這樣設置問題是為了對沖前面的問題導致的回答偏差。前面強調(diào)了負擔可能會給人負面的感覺,我們后面就提出了正面的感知,看看居民的判斷是怎樣的。6“政府在努力減輕家庭的教育負擔”,對此說法,您是非常同意,比較同意,不太同意還是非常不同意?7、 “政府非常重視教育”,對此說法,您是非常同意,比較同意,不太同意還是非常不同意?
對于全面度量公共治理,我們在國內(nèi)是第一個做這項工作的。是不是做得很好,我們也不是特別有把握。因為公共治理這個問題太復雜了。但是我們希望這個研究能夠?qū)鴥?nèi)關(guān)于公共治理的理論和實踐作出一點貢獻。(點擊此處閱讀下一頁)
研究中可能存在一些不足。研究中可能存在一些不足,我們歸納了這幾個方面。1、定義和指標分解是否恰當。我們將之定義在權(quán)利和政治過程上,是否恰當有待討論。2、我們采取了公眾輿論調(diào)查方法,試圖從居民的主觀感知程度來度量公共治理水平。如前面指出的,這需要兩個假定:一是居民主觀感知和實際的公共治理水平成線性關(guān)系;
二是樣本數(shù)據(jù)能夠代表總體,反映一個地區(qū)的一般公共治理水平。第一個假定成立與否和居民自身的認知水平、偏好、文化和制度背景甚至情緒等都有關(guān)系。比如,以前世行在非洲進行調(diào)查的時候,南非經(jīng)濟發(fā)展好的時期人們的滿意度會非常低。在有一些國家,發(fā)展得不好的時候滿意度很高。不是說所有樣本都會出現(xiàn)異常,但還是有這個可能的。我們調(diào)查的三十個城市,可能其中兩三個會出現(xiàn)異常。第二個假定和樣本采集方法有關(guān)。由于經(jīng)費的限制,我們當時采集的樣本的數(shù)量不是很多,方法也值得進一步討論。這個調(diào)查是委托零點公司進行的,他們也出具了技術(shù)報告。據(jù)他們分析,數(shù)據(jù)的可信度是不錯的。3、公共意見調(diào)查法只能測度一個地區(qū)居民的一般感知程度,但不能測度特定群體的感知。比如腐敗的感知很少發(fā)生在普通居民身上,我們的方法就會低估這方面的感知水平。我們原先試圖通過企業(yè)調(diào)查進行這方面的測度,但是由于管制問題這個調(diào)查無法實施。在度量公共治理的時候,對那些特定群體的度量又是很重要的。雖然很多時候權(quán)利被侵犯的只是少數(shù)人,但是權(quán)利被侵犯對這少數(shù)人卻是事實。這種人的權(quán)重就得不到體現(xiàn)了。除非按照人權(quán)觀察組織的方法,把這些特殊事件收集起來作為實證,F(xiàn)在我們通過公眾意見調(diào)查沒法體現(xiàn)這些方面。比如農(nóng)民工的權(quán)益保護我們就沒法體現(xiàn)。我們采取的是住戶調(diào)查,所以搜集的樣本是常住居民。這樣就可能使得數(shù)據(jù)的搜集受到限定。4、在一些技術(shù)細節(jié)上同樣存在諸多值得改進的地方。一是問題的設計是否能夠充分顯示必要的信息?在討論的時候,大家提了很多意見,我們也吸收了一部分意見。但是由于操作上的問題,還有一些意見沒法吸收。二是問題的賦權(quán)是否合理?進行調(diào)查以后,我們要將結(jié)果代入可計算的公式。做這個工作的時候需要對一些數(shù)據(jù)分別賦予權(quán)重,關(guān)于怎么賦權(quán)也有很多問題。三是評分的方法是否恰當?我們最后是算出總權(quán)重,這樣使得數(shù)據(jù)有可比較性。合成指數(shù)的方法很多,比如等權(quán)重法、專家打分法(專家給出權(quán)重)、成分分析法等等。但是其它方法不能保持結(jié)果的時間序列性。權(quán)重方法的好處在于權(quán)重穩(wěn)定,這樣各年的數(shù)據(jù)可以比較。這也是通行的方法,但是都有待進一步討論和改進。
最后再捋一下總體思路。首先下面這張表(表一)將各種不同的治理觀念和相應的定義、度量方法進行了匯總?梢钥吹,不同的治理觀念所得到的治理方法以及相應的結(jié)論都可能很不相同。但是現(xiàn)在也有學者研究不同的度量方法得出的結(jié)果之間是否存在相關(guān)性。我看到的這方面的文獻的判斷是比較樂觀的。也就是說,不同的測量方法得到的結(jié)果之間的相關(guān)性是比較高的。只有個別結(jié)果出現(xiàn)異常,大部分還是保持一致的(只是程度不同)。
下圖(圖一)描述了公共治理評價指標體系。這個公共治理指數(shù)由四個分指數(shù)組成。這些分指數(shù)包括公民權(quán)利和政治權(quán)利、社會權(quán)、程序正義以及綜合指標。第四項是對前面三項的調(diào)整,通過一個整體的印象來彌補單項測度的有偏性。在每一項指標下面又有一些分指標。每一個分指標都對應若干問題,這些若干問題就組成了問卷。通過問卷調(diào)查,我們獲得了相應的數(shù)據(jù)。
關(guān)于評價方法,我們在充分考慮了已有的評價方法以后做出了一些取舍。然后,提煉出了自己的評價方法,將之稱為過程評價和結(jié)果評價的統(tǒng)一、單項評價和綜合評價的統(tǒng)一,并且以主觀評價為準。過程評價和結(jié)果評價的統(tǒng)一說的是我們關(guān)于權(quán)利的評價考慮的是結(jié)果,權(quán)利是否得到了好的保護這是公共治理的結(jié)果。我們理解的公共治理的結(jié)果和有些學者不太一樣,有些人將之理解為公共服務的績效。但是我們認為這和公共治理本身的含義有一定的偏離。我們認為公共治理的核心在權(quán)利層面上,其目的是保護人們在公共領域當中的權(quán)利。所以公共治理的結(jié)果應該體現(xiàn)在公民的權(quán)利是否得到了保障。兩項基本權(quán)利能否得到好的保障就是結(jié)果的反映。有的結(jié)果以后必須有一定的程序去保障機制在公共領域當中的實施。我們將這個程序稱為過程評價。這個過程評價就是一個政治過程的評價。這個評價不是簡單的行政程序的問題。按照我們對公共治理的理解,公共治理是政府和其他參與者共同合作形成的治理模式。這個治理模式下面不僅包含了政府的行政程序,還包含了其他的利益主體行使自己的權(quán)利的參與渠道。以前討論的時候,有些學者質(zhì)疑在我們這個研究中討論民主選舉是否有意義。我們認為有意義。因為各個地方進行的不同試點可能會使居民產(chǎn)生不同的認知。我們要考慮在不同試點下面的認知是不是有差別。我們有單一評價也有總額和評價,綜合評價可以彌補綜合評價的不足。公共治理領域中,其它的參與機制才剛剛開始,政府還是處于主導地位。我們需要考慮人們對政府的總體印象。我們的整個評價方法如下圖(圖二)所示。這些評價方法好還是不好需要聽取大家的意見。
茅于軾:中國現(xiàn)在經(jīng)濟增長很快,但是社會矛盾又很多。大家分析認為這是政治改革落后造成的。在十年以前或者更早的時候,我和盛洪就討論過這個問題。我們提出的一致意見是要推動政府的政治改革。按照中國的情況,不可能搞三權(quán)分立、多黨制、普選。第一步還是應該從技術(shù)層面上幫助政府進行改革。從那時開始,我們就做了一個較大的課題——政府體制改革。這個課題大概持續(xù)了六年,出了80多份報告。最后還寫了一本書,名字是《透明公正——中國政府體制改革之路》。那本書不過是談到了我們的研究的三分之一的內(nèi)容,后來由于出版自由的問題被擱淺了。后來我們就開始進行中國經(jīng)濟人權(quán)研究。本來想做中國人權(quán)研究,但是太敏感了不好做。關(guān)于經(jīng)濟人權(quán)的研究周老師也參加了。那個課題沒有分省。從2000年到2004年,我們把中國經(jīng)濟人權(quán)的變化分成四個領域:住房、教育、醫(yī)療和就業(yè)。那個課題結(jié)束以后,現(xiàn)在開始這個課題——中國公共治理的分省評價。
周老師已經(jīng)講得很清楚了,我只做幾點補充。第一,公共治理是很抽象的,能否分成一二三個指標分別打分?周老師講了,公共治理是多維的問題。比如重量和長度就是不同的維度。不同的維度是不能加總或者平均的。比如,重量3公斤和長度4米取平均3.5,這算什么呢?我們現(xiàn)在做的就是這個工作,把不同的維度取了平均。但是各個省都是這么取平均的,得出的數(shù)據(jù)就可以比較了。我們最后得到的全國的公共治理指數(shù)是0.352。0分最好,1分最差。按照百分制計算,中國公共治理的得分是65。這樣的單個數(shù)據(jù)沒有太大的意義。但是比較發(fā)現(xiàn),杭州最好(0.27),福州最差(0.41)。這是總的評分,下面還有周老師說到的四個領域的評分,比如基本權(quán)利、正義程序等等。可以看到,排序之間確實有相關(guān)性。我們還需要做一系列進一步的工作。比如,各個維度中是否存在相關(guān)性,收入水平、教育水平和滿意度是否存在相關(guān)性。我們在打分的時候?qū)⒉粷M意的權(quán)重定得很大。比如選項中有很滿意、還可以、不滿意、很不滿意?赡芎懿粷M意的只有2%-3%的人,但是卻被放大了。我不太懂,但是其他老師說這是有根據(jù)的。第二,周老師講到了主觀和客觀的爭論。什么叫主觀或者客觀,有兩種分類。一種認為問卷的答案是主觀的,觀察的結(jié)果是客觀的?纯瘩R路上有沒有坑,或者打電話給政府機關(guān)看看有沒有人接,這都是客觀觀察可以看到的。還有一種是從答案中判斷是主觀或者客觀。比如某人有三個小孩,一年花了多少教育費,這算是客觀的。他對此不滿意,這算是主觀的。關(guān)于主觀客觀的爭論很大。有人認為要的就是客觀的數(shù)據(jù),主觀的數(shù)據(jù)會有偏差。也有人說我們要的不是客觀數(shù)據(jù),而恰恰是主觀數(shù)據(jù)。你搞得再糟糕,老百姓滿意就行。這個爭論現(xiàn)在也沒有結(jié)果。
這個分省研究剛剛做了一年,我們準備繼續(xù)做下去。歡迎大家多給我們提改進意見。中央政府有很多考核地方的方法。我們希望這個數(shù)據(jù)可以幫助中央政府對地方的公共治理的好壞有一個客觀、中立的評價。共產(chǎn)黨的評價方法是很多的,但是要做到中立很難。因為其中可能涉及人際關(guān)系等等。天則所來做就沒有這些問題。我們肯定會客觀、可靠地做出評價。不可能說某個地方給一萬塊,我們就給他們評價好一點。樊綱他們做了幾年,影響就出來了。我們頭一年影響很小。但是慢慢做下去,就有希望變成天則公共治理指標。
大家可以看一下最后的綜合指標度量結(jié)果。這和經(jīng)濟水平?jīng)]有直接關(guān)系。北京的經(jīng)濟很好,但是排名卻不是很前。南京的排名就非?亢蟆
周業(yè)安:在評價方面,我們關(guān)注的是負面評價。如果居民回答是滿意的,我們就不去關(guān)注。在問題的回答中,我們會對“不滿意”賦一個值,對“很滿意”賦0。比如,問題的答案有“滿意”、“不滿意”和“非常不滿意”。我們可能會對“滿意”賦0,對“不滿意”賦0.3,對“非常不滿意”賦0.7。評價越是負面的,得到的數(shù)就越大。我們把所有的答案量化,最后轉(zhuǎn)化為現(xiàn)在的數(shù)據(jù)。
朱恒鵬:首先,我感覺你們的理論工作已經(jīng)做得非常扎實了。如果現(xiàn)在還有一些理論上無法解決的問題,可能都是很難的。第二,關(guān)于主觀評價和客觀評價,我認為二者都需要。主觀評價是看老百姓的滿意度,本身公共治理的很重要的目的就是讓老百姓滿意?陀^評價還是取決于專家意見,客觀指標其實還是專家定出來的。所謂專家,他們和老百姓比起來理論儲備比較扎實,對問題的看法相對扎實。另外,專家可能相對理性一些。所以,我們傾向于選擇這樣的客觀指標。在評價政府的公共治理的時候,專家的意見是需要的。在中國這樣的情況下,不能跟著群眾的感覺走。在司法上的很多冤案就是例子。很多案子都是由于“民憤極大”所以限期破案。我看到某法律專欄上就有一個案例:一家五口人被懷疑殺害了祖母。由于民憤極大所以公安局就草草破案,一家五口人被抓了三口。這家的女兒不服,認為不可能是家里人把奶奶殺死的。告了十幾年以后終于找到了關(guān)鍵證人,案例終于平反。在接受采訪的時候法官說:當時的證據(jù)是嚴重不足的,判得那么急是由于民憤極大。因為殺祖母是會引起公憤的。第三個是不同的指標數(shù)據(jù)加總的問題。分數(shù)是無量綱的,不同分數(shù)相加是可以的。這就和高考相似。兩個人的總分相同。一個人的物理高8分,另一個的語文高8分。是不是意味著這兩個人的水平一樣高呢?不一定是。但是大家普遍認為這個由打分判斷能力的方法還是可以的。這個問題不是很關(guān)鍵的,可以解決。指標如果超過十來個,權(quán)重的選擇就不會有太大影響。所以,我覺得權(quán)重用簡單平均法是最好的。這個方法的優(yōu)點在于權(quán)重不會改變。所有的其它方法權(quán)重都可能發(fā)生改變。比如專家打分法中,過一段時間可能就會讓專家重新打分。哪個指標更重要,可能這個指標的權(quán)重就會增大。一旦改變權(quán)重,從簡單統(tǒng)計學上說數(shù)據(jù)就不是一個口徑了。最后一個問題,我感覺我國的省會城市的特權(quán)是很大的。我認為省會居民對政府的感覺可能和一般城市的居民對政府的感覺是不一樣的。幾乎每個省的政府都會把省會建設得最漂亮。調(diào)查是在省會城市居民中進行的,這就很可能高估我國的公共治理的水平。從中央到地方,幾乎都會把最好的資源用在首府城市。這在醫(yī)療上可以很明顯地看出來。從1993年分稅制改革以來,政府對醫(yī)療的投資很少。絕大多數(shù)資金都投在了首都以及各省會城市。這樣一來,這些地方的居民得到的醫(yī)療服務以及醫(yī)保福利的水平就是高于其它地方的居民的。所以,我覺得這個調(diào)查可能高估了中國公共治理的水平。但是,各省之間的排序可能不變。
盛洪:是不是可以這樣理解,拿產(chǎn)品來說,僅僅評價其效果是不夠的,還需要考慮其價格。地方政府可以在本地收稅,從而可能通過轉(zhuǎn)移支付將這些財政收入轉(zhuǎn)移到了省會城市的建設上。所以,是不是可以研究財政收入和財政支出之間的差額?或者是不是可以看看首都或者省會城市是否得到了補貼?(點擊此處閱讀下一頁)
這是不是應該按地稅而不是國稅來算?
楊曉維:這個研究是在評價公共治理。在我理解,公共治理是公共事物的決策機制。所以首先是不是應該有這樣一個指標,用來評價中國政府(中央或者地方的)的治理結(jié)構(gòu)和國外比較起來怎樣。這實際上就是周業(yè)安教授說的政治程序。第二個問題才是結(jié)果(效果)問題。這應該是兩個問題,但是我感覺業(yè)安沒有將其清晰地分開。就像我們首先會看公司的治理結(jié)果怎樣,然后才會看公司的績效如何(公司賺錢多不多)。對于治理結(jié)構(gòu)好像這里談得不是很多。比如,政治決策中傳媒起到什么作用,公眾表達是用民主制、公投、一黨專制或者是其它的。等等這些都是需要評價的,但是涉及政治不敢觸動。但是我們首先可以設計指標,描述公共治理治理結(jié)構(gòu)是怎樣的,然后我們可以談結(jié)果。對于結(jié)果的滿意度可以說是見仁見智。公眾的看法是說不清楚的。比如很多人關(guān)心政府提供的福利如何,但是我就不怎么關(guān)心這個。我在成都的時候,開車要是違規(guī)了交警上來開了罰單就走。問他犯的是怎么錯誤,他也不理。北京就不是這樣的。交警上來會先敬個禮,然后告訴你犯了什么錯誤。有些情況下我可以和他討論討論,然后他就讓我下次注意、放我走了。我就可能更關(guān)心諸如此類的東西。所以,可以首先設計指標把治理結(jié)構(gòu)描述清楚。治理結(jié)構(gòu)嚴格地說起來就是各種權(quán)利的分配以及運行過程,各種權(quán)利包括公民權(quán)利、政治權(quán)利等等。下一步再進行績效評價,這可能有待建立一套理論。剛才周先生講到了專家意見。我覺得不是專家意見,而是應該基于各種比較以及理論研究之上形成一個規(guī)范的標準。這個標準對什么治理結(jié)構(gòu)最有效有一系列規(guī)范的指標。如果這個標準沒有制定出來,那么我們設計的指標就比較盲目了,F(xiàn)在能做到這一步已經(jīng)很不容易了。但是如果形成一套標準以后,我們再設計一些客觀指標甚至是主觀指標就更加有針對性。
溫來成:剛剛聽了周業(yè)安教授的報告,覺得很有啟發(fā)。茅老師說要讓這個數(shù)據(jù)成為天則指數(shù),獲得社會的認可。這使得此項研究有的推廣價值,可能對社會有很大的貢獻。在許多國家,這樣的指數(shù)有上百種之多。零點公司在清華開的一個會上也介紹了他們自己做的社會公共服務指數(shù)。我本人主要做政府財政以及城市公共管理的研究工作。在這些方面可以和大家做一些交流。這幾年,國內(nèi)行政管理學界(或者說公共管理學界)對這個問題的關(guān)注很多。從1985年開始,國內(nèi)回復了行政學和政治學的理論教學和研究工作。西方管理理論中有一個著名的觀點——結(jié)果導向。隨著西方管理理論的引入,國內(nèi)有一撥一撥的人開始研究這些問題。中國行政學會下面的一個二級分會在蘭州設立了一個地方政府評價研究中心,也弄出了一大堆的指標。這兩年的國家的社科研究基金也開設了專門的課題來研究這個問題。我們中財大有個老師正在研究政府績效評價的指標體系。社科院搞了一個公共財政評價體系,也希望將自己的指標設定出來以后向全國各地推行。搞績效預算可能政治阻力太大,財政部在外界的壓力之下也開始推行績效評價。財政局不太可能評價市政府辦公廳的支出是否符合績效指標。但是他們選擇了政治上不敏感的對象來評價,比如扶貧資金的績效評價、教育專項資金的績效評價。他們是想先做績效評價,再向績效預算方向轉(zhuǎn)移。零點公司這樣的民間組織做的公共績效評價工作也是很有意義的。從民間角度考慮問題,得出的結(jié)論還是和我們?nèi)粘I钪械母惺鼙容^吻合的。他們得出了指數(shù)是60%。這說明目前人們覺得政府提供的公共服務大體可以,但是還沒有得到滿意的程度。
周教授講到天則所的指標是以權(quán)利和政治過程為核心來設置的。如果這些指標要向社會推廣,就需要考慮政府和老百姓能夠在多大程度上接受這些指標。比如,福州市市長是不是覺得自己做得最差,這個結(jié)果是不是合理。這也是一個考慮因素。當然,這兩年大家對政府公共治理討論比較多。社會比較關(guān)注的政府治理這部分可能比較多的是和民生有關(guān)的公共服務。比如有社會權(quán)利這一塊,包括科技、教育、文化、衛(wèi)生等方面。還有反腐敗問題以及看病難、看病貴等問題。前幾年有些資料說醫(yī)療問題是當年第一位的社會矛盾。所以我們在設置指標的時候可能要考慮社會的認可程度怎樣,社會在公共治理領域關(guān)注哪些因素。
另外還有對每個指標如何賦權(quán)的問題。指標比較多,大家在一段時期對各個指標的關(guān)注程度可能不一樣。公民權(quán)利、政治過程在我國也在緩慢地改進,但是在短時期內(nèi)可能不會有太大變化。但是社會權(quán)利方面則可能出現(xiàn)較大的變化。在評價的時候如何更好地體現(xiàn)這些問題,這是我對指標設定提出的一些不成熟的看法。
另外,我們也做了這方面的研究工作。我們幫政府做的一些課題涉及到了績效評價。我感覺其中有幾個問題需要進一步的討論,在這里提出來和各位專家交換一下意見。講到評價(特別是公共治理評價),有幾個不可回避的問題。比如評價的主體,是由政府機構(gòu)評價還是社會組織評價?在許多國家,公共治理評價是一個巨大的市場,有眾多機構(gòu)在從事這個工作。在我國,這個市場還在政府的壟斷之下。如果政府不開發(fā)這個市場,評價主體沒有明確的法律依據(jù),這個工作進行起來還是比較困難的。我們希望這個評價結(jié)果能夠推動國家公共治理水平以及社會福利水平的提高。如果這個結(jié)果政府也不認可、老百姓也不認可,那它的現(xiàn)實意義就不是很大了。雖然我們的學校也講校務公開,但是學校從來不對外公開收支。這些政府組織以及官辦的非贏利機構(gòu)誰也不敢公開預算。這都是值得關(guān)注的問題。
還有一個客觀評價指標和主觀評價指標的問題。有些指標就是不能量化的,就是一個主觀的感覺。比如百姓對國家安全的評價,十一在馬路上也覺得是安全的。這樣的評價也就可以了。一定要打70或者80分,意義不是很大。指標設計的時候也要考慮是否合理,不合理的指標可能會對基層政府是一種誤導。對于同樣的錢,鄉(xiāng)長會拿它來整修街道還是翻新校舍呢?可能整修街道會使得上面的領導來視察的時候看到顯著的政績。指標設計不合理就可能使得地方領導重視眼前利益,把人們最先看得到的地方翻新。這個問題可能是各個國家政府公共治理的通病,我們需要考慮如何在指標設計的時候考慮減輕這種弊病。
張昕:很榮幸參加這個討論會,這個主題在現(xiàn)在的國際和國內(nèi)環(huán)境下是非常重要的。我只能提供一些思路或者相應的補充。這項研究和哈佛大學羅伯特•帕特南做的那項研究很像。他寫了一本《使民主運轉(zhuǎn)起來》,里面是關(guān)于社會資本的研究。他跟蹤意大利十年。這本書上世紀92、93年出版,在美國也是很有影響的。以前奧爾森說利益集團會影響經(jīng)濟增長。他的書中說結(jié)社自由能夠促進經(jīng)濟增長。他說這在意大利北部和南部有很明顯的區(qū)分。我國和意大利有些相像。他們有傳統(tǒng)的歷史,我們也有。他們的北部和南部有些像我們的東部和西部。所以這個話題對我國是很有意義的。
治理是一個難以界定的問題。目前在我所看到的文獻中,社會學、經(jīng)濟學、政治學、公共管理以及法學等學科都對這個問題感興趣。治理實際上是一個很大的概念。通常西歐這方面的文獻比較多,北美也有一些。我結(jié)合通過閱讀所知的思想,做一些文獻引用方面的補充。第一,國家不能太大;
另一個,治理是可抉擇的集體行為;
另一個,治理本身是法人治理;
還有,治理是一個多中心的概念。我理解的和公共管理相關(guān)的界定是部門間的伙伴關(guān)系,F(xiàn)在有人說三分法,把第三部門加進去。這就是三部門間的伙伴關(guān)系。三個部門間的伙伴關(guān)系的提出使得原來的二分法(市場私人物品和政府公共物品)不成立了。從文獻上考證,布坎南在其《公共物品的供給與需求》中談到公共物品和服務的公共性可以被看作是從0到100%。所以,他對物品和服務進行了分類。無論是公共部門、私人部門或者第三部門,都可以提供這些物品。今天開始越多越多地強調(diào)對物品的大的分類,這就可能打開新的視野。在治理的理解上,我覺得需要進一步深入。從權(quán)利的配置(憲政程序)角度的分析非常好。但是我覺得現(xiàn)在需要關(guān)注治理主體的問題。我比較贊同結(jié)社自由。政府不贊成結(jié)社,很多情況下就會缺少主體。這樣一來,再多的參與也沒用。如果能夠有結(jié)社自由,治理主體就會多樣化。美國有教授就認為多樣性本身具有生態(tài)學的意義。治理多樣性可以作為一個指標,對應著問卷中要揭示的一些情況。奧利佛•威廉姆森提出的治理還是強調(diào)了存在外在的制度環(huán)境以及內(nèi)在的制度結(jié)構(gòu)。制度結(jié)構(gòu)是針對主體而言的。這個主體從法人治理來看是所有權(quán)和控制權(quán)之間的結(jié)合物。這個結(jié)合物就是一個多中心的概念。這個課題已經(jīng)做了很多工作,但是在治理概念的理解上可能需要更進一步。我覺得還可以參照帕特南的那本《使民主運轉(zhuǎn)起來》。他也有主觀的問卷,但是概念非常清楚。社會資本的概念是一個主體,把研究內(nèi)容串連起來。和帕特南的比較,我們這個課題缺乏中心的主題概念。帕特南的研究還涉及到了其它經(jīng)濟發(fā)展的指標。剛才溫來成老師也談到,公共管理有很多政府績效方面的研究。最近國家行政學院引進了很多歐盟的書籍,包括教育、醫(yī)療、治安等等。其中一些評價也是和公共治理有關(guān)的。這也可以作為參考。
對于指標賦權(quán)的問題,我覺得關(guān)系不大。不同的維度加權(quán)是可以的。比如,人格也是有不同的維度的。但是在實際操作的時候,我們假設人們的回答是正態(tài)分布。把所有抽樣總體做一個正態(tài)分布,原始分數(shù)就能夠轉(zhuǎn)化為標準分數(shù)。然后個人每項的標準化分數(shù)都可以和常額比較。這個標準化分數(shù)是無量綱的,將之乘以一個數(shù)就可以獲得好的解釋。最后加總的時候就不需要賦權(quán)了,這個項目的所有人的常額已經(jīng)建立起來了。我能說的就這三個方面。
韓朝華:這個研究很好,恐怕也是國際學術(shù)界的潮流。在研究經(jīng)濟增長、經(jīng)濟發(fā)展的時候必須控制那些非經(jīng)濟的制度、文化甚至歷史等因素。天則這樣有雄厚的學術(shù)資源的機構(gòu)做這個研究是很有必要也很有意義的。希望這個研究能夠繼續(xù)下去。
楊曉維:無論是專家意見還是公眾調(diào)查,需要分清楚是在評價公共治理的善惡還是在評論對公共產(chǎn)品的滿意度。一個是對治理本身運行機制(權(quán)利分配、決策程序等等)的評價,另外一個是看政府提供的福利多不多、老百姓有沒有房子住。我們需要對二者有謹慎的區(qū)分。弄不好就變成了對公共產(chǎn)品的評價,公共產(chǎn)品好不好和錢多不多關(guān)系比較大。北京政府錢多,因此補貼多、教育資源也多。
盛洪:東城區(qū)搞了一個數(shù)字化城市管理系統(tǒng),我們對其做了一個評價。那不是一個排序評價,而是一個絕對的財富數(shù)量的評價。我們最后評價出的結(jié)果是多少億這這樣的數(shù)字。盡管很復雜,但是我們還是做出來了。所謂的主觀數(shù)據(jù)就是主觀效用論,F(xiàn)代經(jīng)濟學是建立在主觀效用論上的。說這個商品有多少價值,完全是個人的主觀評價。我們做的那個研究也是這樣的。先問老百姓到底值多少,讓其給出數(shù)。然后經(jīng)過一堆技術(shù)處理得出最后的財富數(shù)字。那個項目做得很成功,但它沒有城市間的比較。其實可以對不同政府的公共物品的提供做出評價,然后再做比較。這叫標尺競爭。天則所這方面做了很多工作,也積累了不少經(jīng)驗。
這個課題也是很有意義的。一個是結(jié)果的評價,一個是過程的評價,還有一個是綜合評價。是不是可以這樣比擬。結(jié)果就像物質(zhì)產(chǎn)品(私人物品)以及服務水平。關(guān)于服務的評價好像不太獨立。我買賣電視機的時候,會接受買賣電視機的服務。這其中包括店員是不是熱情地招待我、向我介紹產(chǎn)品性能、讓我挑選、最后送貨到家、幫助安裝。之后還有售后服務,我打了電話他們必須迅速派人上門維修。大的廠家都能做到這點。我想強調(diào)的是:這些服務都是涵蓋在價格里面的。我們平?赡懿惶⒁。如果我們花了2000塊買了臺電視機,實際上買的是機器加服務。為什么海爾的產(chǎn)品比別家的貴?因為海爾的服務好,價格包含了服務提供的成本。剛才曉維說得很對:不只要看提供了什么公共物品,公共物品的服務也很重要。也就是說產(chǎn)品和交易服務也是有價格的,而且應該納入公共治理的評價之中。政治過程和權(quán)利需要辨析,這就像生產(chǎn)產(chǎn)品。同樣是生產(chǎn)電視機,但是不見得所有的企業(yè)用的是同一種生產(chǎn)工藝。比如一種是民主方式的,還有一種是哲學王的方式。這種哲學王的方式非常極端,但也是可能的。這種方式中,有人把老百姓想透了,提供的服務非常到位。
第二,為什么我們要評價生產(chǎn)過程?因為這個生產(chǎn)過程和物質(zhì)產(chǎn)品(私人物品)的生產(chǎn)過程不一樣。這個過程需要消費者參與。比如我們需要立法,這個立法不可能和消費者沒有關(guān)系。也就是說,這個立法必須和老百姓有關(guān),讓老百姓參與。從這個意義上講,我贊成將政治過程納入考慮。(點擊此處閱讀下一頁)
這就相當于把生產(chǎn)過程納入考慮。在評價私人物品的時候,我們是不管生產(chǎn)過程的。海爾怎么生產(chǎn)電視我們不管,我們只管看電視。我們的課題組將政治過程納入考慮還是有道理的。我們?nèi)绾卧u價它?這需要我們的學者或者精英的判斷。首先,這不是老百姓非常了解的。比如,基本的憲政框架怎樣,這需要對歷史上的憲政原則的成敗得失進行分析總結(jié)才會知道。剛才有人提到政府機構(gòu)的預算大都是不公開的。負責人想公開就公開,不公開大家就無從了解。對此的判斷很簡單,財政透明就是正的指標,財政不透明就不是正的指標。老百姓可能不關(guān)心,但是我們必須關(guān)心。再比如,對財政支出有沒有憲政約束?收多少就花多少是不行的。隨意地想增加多少公務員就增加多少,這也是不對的。這都是有公認的憲政原則的。再比如,上海突然出臺一個不許群租的規(guī)定。我不知道這個荒謬的政策是如何出臺的。它就是一個行政部門的法規(guī),違反了中國的憲法或者任何上位法。這本身是違憲的。如果這樣的地方政府做了違憲的事情,我們是不是應該記錄下來。這是很嚴重的問題。我們也可以在老百姓中去調(diào)查得到結(jié)果,但是必須剛還找到了群租的人。如果沒有碰到,那就無法有所涉及。但是我們可以看得很清楚,這個事情的確是系統(tǒng)性的錯誤。所以,我覺得政治過程的評價確實應該納入考慮。而這個東西不能光靠進行對老百姓的抽樣調(diào)查,需要理論提供一個公正的標準。按照這個思路,我們每次在公布結(jié)果的時候應該給出解釋。為什么福州最后,為什么杭州第一?都必須有個解釋。如果把這些有關(guān)政治過程(比如憲政框架)的原則放進去,上海的名次掉下來就不難理解了。數(shù)據(jù)出來并且附帶我們的解釋,如果得到中央政府的支持將是非常不錯的。想要名次提高,可以改正一些行為。比如,不出臺這樣違憲的政策。這樣一來,數(shù)據(jù)的影響將會很大。
茅于軾:剛才大家的發(fā)言對我很有啟發(fā)。其中談到了不同量綱的加總。經(jīng)濟學有一個功能,讓不同的量綱可以加總。一度電四千瓦小時、一公斤煤、一尺布都是可以加總的。價值度量上是可以比較的。一度電的價值高還是一尺布的價值高,這是可以換算比較的。經(jīng)濟學上市場價格就可以換算出來。我們心里要有一個關(guān)于公共治理的尺度。對于公共治理滿意不滿意、花了多少錢變成公共治理中的指標分數(shù)。然后就可以將之加總了。最后打分是全組平均0.35(65分)。這樣的分數(shù)就有意義了。不僅是排序中有比較,絕對值也可以比較。100的滿分我們?nèi)珖骄绞?5分。這也是有意義的。
周業(yè)安:這種會每開一次都會有不小的收獲,每個人都會從各自的角度提出不同的意見。張昕老師提到的治理變量的補充值得我們的斟酌。當時我們在綜合治理概念的時候,主要是從可度量性的角度來思考的,不完全是從學理角度思考的。曉維提到的也很重要,我們至少需要描述一下公共治理的現(xiàn)實過程。還有溫老師提到的需要考慮可接受性,這都很好。
有些大家提到的在這個課題中沒法做,因為我們做的是地區(qū)評價。有些是整個國家的模式,我們在做地區(qū)評價的時候就沒必要考慮。如果是在每個地方找專家咨詢,也會有一些問題。各個地方的專家的類型以及水準都是不一致的,這就給評價帶來了困難。但是事件記錄的方法很有價值,但是不知道是否能夠操作。如果能夠把每個省的相關(guān)事件記錄下來,那當然是很好的數(shù)據(jù)。這就是客觀的度量。但是客觀度量對能力的要求很高。記錄客觀事件是很麻煩的。比如考察同樣規(guī)模的企業(yè)注冊過程也是可以的,但是需要花很大的人力物力。在管制嚴格的條件下,居民調(diào)查是最容易的。很多企業(yè)調(diào)查是受到限制的,需要經(jīng)過審批才能進行。我們原先也設想過很多方法,現(xiàn)在的方法是最容易的。我們的樣本家庭有3000多個,每個城市的樣本大概是100多個。住戶調(diào)查也是花費很高的。我們的想法就是先做下去,以后有了更多的人力物力就可以使用更多樣的方法。再次感謝大家提出了很好的建議。
盛洪:謝謝業(yè)安和茅老師,謝謝參加討論的教授,謝謝參加雙周的朋友,我們的
2007年09月28日
來源:天則雙周
原文鏈接:http://www.unirule.org.cn/SecondWeb/DWContent.asp?DWID=373
熱點文章閱讀