文章

在分歧中尋找共識——中國低生育水平下的人口政策研究與演進

發稿時間:2019-06-14 14:10:20   來源:“ 社會(hui) 學研究雜誌”微信公眾(zhong) 號   作者:王軍(jun) 劉軍(jun) 強

  一、引言

  習(xi) 近平總書(shu) 記在談及人口形勢時指出:“當前,我國人口結果呈現明顯的高齡少子特征,適齡人口生育意願明顯降低,婦女總和生育率明顯低於(yu) 更替水平”(習(xi) 近平,2015)。中國日趨嚴(yan) 峻的少子化和老齡化形勢會(hui) 影響到勞動力與(yu) 整體(ti) 競爭(zheng) 力、社會(hui) 保障體(ti) 係的可持續性,甚至威脅到國家安全。

  縱向來看,1992年起中國就已經進入了低生育水平(郭誌剛,2004a;中國國家統計局、美國東(dong) 西方中心編,2007;翟振武、陳衛,2007)。當年中國生育率抽樣調查(即“38萬(wan) 人調查”)得到的總和生育率為(wei) 1.57(郝虹生、高淩,1996)。這一結果雖令人口學家們(men) 集體(ti) 震撼,卻遺憾地促成了一個(ge) 虛假的共識,即相信低生育的結果主要由嚴(yan) 重漏報和瞞報所導致(曾毅,1995;梁中堂等,2000)。因此,人口政策也錯過了一個(ge) 早期的調整信號。其積極結果是,1992年生育率調查促使人口學家開始關(guan) 注低生育問題(中國生育率下降後果與(yu) 對策研究組,1994)。人口學界也展開了長達二十餘(yu) 年的大辯論。

  橫向來看,中國進入低生育水平至今已有27年,並且與(yu) 其他國家和地區人口政策的調整節奏形成了鮮明的對比。以周邊國家和地區為(wei) 例,韓國、新加坡和泰國分別於(yu) 20世紀60年代和70年代開始實施限製生育的政策(Palen, 1986; Guest & Jones, 1996;Atoh et al., 2004)。但隨著實際總和生育率跌破更替水平,這些國家和地區先後取消了限製生育的政策(Atoh et al., 2004)。相比之下,中國人口政策調整的滯後時間要明顯高於(yu) 國際平均水平。

  為(wei) 什麽(me) 中國人口政策的調整過程更為(wei) 艱難?除了政策調整機製本身非常複雜之外,一個(ge) 不可忽視的原因是人口學界長期以來對三個(ge) 關(guan) 鍵問題存在分歧,導致政策調整信號沒有及時傳(chuan) 遞。這三個(ge) 問題是:(1)政策調整前的生育水平到底是多少?(2)政策調整後的生育水平會(hui) 回升到什麽(me) 程度?(3)政策調整初期的出生堆積風險有多高?這三個(ge) 問題涉及人口政策是否需要調整以及人口政策應該調整到什麽(me) 程度等核心問題。

  與(yu) 公眾(zhong) 的印象相反,中國人口學家並不是高度同質化的群體(ti) 。針對人口政策調整,內(nei) 部分歧一直存在。不過隨著時間的推移,共識性因素也正在達成。本文從(cong) 學術史的角度係統梳理了從(cong) 1992年至今人口學界對以上三個(ge) 關(guan) 鍵問題的爭(zheng) 論及其演化,尤其是爭(zheng) 論焦點、爭(zheng) 論依據與(yu) 邏輯,希望推進政策與(yu) 理論兩(liang) 個(ge) 方麵的發展:首先,我們(men) 需要判斷,當前人口形勢是否發生了根本變化?中國人口的主要矛盾是否發生了根本改變?人口政策調整的難點和分歧到底在哪些方麵?理論界已經針對這些問題展開了豐(feng) 富的研究,係統梳理有利於(yu) 澄清爭(zheng) 議、凝聚共識。

  其次,過去半個(ge) 世紀的人口政策和二十餘(yu) 年的爭(zheng) 論為(wei) 我們(men) 提供了係統思考人口理論的機會(hui) :發展中國家進入低生育社會(hui) 的動力機製有哪些?人們(men) 對低生育的認識,尤其是人口政策的應對為(wei) 什麽(me) 通常會(hui) 滯後於(yu) 低生育的人口現實?這些問題的回答不僅(jin) 有助於(yu) 中國今後製定更為(wei) 科學有效的人口政策,還將為(wei) 其他國家的人口發展提供寶貴的中國經驗。

  二、背景:世界人口形勢及人口認識的轉變

  出生率與(yu) 死亡率是驅動世界人口變化的兩(liang) 個(ge) 關(guan) 鍵機製。世界人口增長率在20世紀50年代開始逐漸上升,1963年更是達到了有史以來的最高值2.2%(Lam, 2011)。這意味著如果保持該增長率,世界人口將在32年後再次倍增。人口轉變理論可以解釋這一時期的人口快速增長。隨著社會(hui) 經濟發展和醫療衛生水平提高,一個(ge) 社會(hui) 的人口將完成從(cong) “高出生率、高死亡率”到“低出生率、低死亡率”的轉變(Davis, 1945; Caldwell, 1976)。但由於(yu) 出生率的下降一般滯後於(yu) 死亡率的下降,因此在這一轉變過程中會(hui) 存在一個(ge) 過渡階段,即“高出生率、低死亡率”階段,而這一過渡階段的典型特征就是人口的快速增長。

  (一)低生育水平的出現與(yu) 理論解釋

  人口轉變理論的核心假設就是出生和死亡的大致平衡。從(cong) 總和生育率來看,人口轉變理論認為(wei) ,當各個(ge) 國家完成人口轉變過程成為(wei) “低生育、低死亡”的社會(hui) 時,其總和生育率將維持在2.1的更替水平並長期保持不變。在20世紀的大部分時間裏,人口學界將總和生育率下降到2.1的更替水平作為(wei) 發展中國家完成生育轉變的主要標誌(Bongaarts, 2002; Goldstein et al., 2009)。

  但世界人口轉變的現實挑戰了人口學界的這種共識。從(cong) 時間上來看,首先是歐美和日本等發達國家的總和生育率從(cong) 20世紀60年代後期開始相繼降到更替水平。然後,截止到90年代中期,發展中國家大多已經開始甚至許多已經完成了人口轉變過程。但出乎意料的是,在許多發達國家和發展中國家,生育率並沒有維持在更替水平不變,而是繼續下降到更替水平以下(Mason, 1997;Foster, 2000; Bongaarts, 2002)。許多國家甚至出現了遠低於(yu) 更替水平的極低生育率。

  傳(chuan) 統的人口轉變理論顯然無法解釋上述低生育現象的出現。為(wei) 了解決(jue) 這一困惑,“第二次人口轉變理論”應運而生(Kaa,1987, 2001; Lesthaeghe & Neidert, 2006; Lesthaeghe, 2014)。“第二次人口轉變理論”主要關(guan) 注社會(hui) 層麵和生育觀念方麵的徹底變革。隨著“後工業(ye) 社會(hui) ”和“消費社會(hui) ”的興(xing) 起,女性受教育程度和勞動參與(yu) 率提高,個(ge) 人生育的自主意識空前高漲(Beck,1999;Ryder, 2010;鮑德裏亞(ya) ,2014)。在現代社會(hui) ,生育的價(jia) 值和重要性受到重新審視,當生育與(yu) 女性受教育機會(hui) 、職業(ye) 發展、自我價(jia) 值實現等相衝(chong) 突時,生育往往成為(wei) 被犧牲的目標。因此,個(ge) 體(ti) 生育決(jue) 策匯總到社會(hui) 層麵,便往往會(hui) 出現低生育現象。

  基於(yu) 大多數低生育國家和地區鼓勵生育的政策提升效果並不顯著的現實,魯茨等人提出了“低生育率陷阱”假說。該假說認為(wei) ,總和生育率一旦下降到1.5以下,受低生育率的自我強化機製影響,扭轉或者提升異常困難(Lutz & Skirbekk, 2005; Lutz et al., 2006)。這些自我強化機製主要包括:長時期的低生育水平導致育齡女性規模銳減,人口負增長慣性導致出生人口數量變得更少;在低生育社會(hui) 中成長起來的一代由於(yu) 受到小家庭生活環境以及低生育文化的影響,其生育意願比上一代更低;年輕一代通常比上一代消費意願更強,在收入水平增加程度明顯不如消費提升程度的情況下,其生育意願將更加低迷。

  (二)世界範圍內(nei) 對於(yu) 低生育問題認識的反思

  從(cong) 20世紀50年代以來世界人口發展及人們(men) 對人口問題的認識曆程來看,值得反思的地方很多。首先是人們(men) 對低生育水平的認識滯後,很長一段時間都不願意接受低生育水平這一既成人口事實。20世紀70、80年代,人口學家通常都認為(wei) 生育水平即使下降,最終也會(hui) 停留在2.1的更替水平上,他們(men) 對許多國家出現的低於(yu) 更替水平的生育率普遍感到迷惑不解,甚至覺得有違“常識”(McDonald, 2006)。直到20世紀90年代開始,越來越多的人口學家才逐漸接受低生育水平這一人口事實,認識到更替水平這一概念隻是一個(ge) 理論上的門檻而已,對於(yu) 正在計劃組建家庭的夫婦來說並沒有太大的實際意義(yi) (Bongaarts, 2002)。

  其次是人口政策調整的滯後。國際上一般認為(wei) 21的更替水平是人口政策介入幹預的臨(lin) 界點。如果一個(ge) 發展中國家沒有發現進入低生育水平的人口事實,或者缺少對低生育水平的應對措施並且持續時間長達10年以上,那麽(me) 該社會(hui) 將會(hui) 在某種程度上全麵陷入低生育危機(Morgan, 2003)。事實表明,東(dong) 亞(ya) 國家和地區的人口政策調整往往比較滯後,比如中國台灣地區、韓國人口政策調整的滯後時間分別長達15年和10年之久(沈可等,2012)。

  盤點造成人口政策調整滯後的原因,除了對生育水平低於(yu) 更替水平時人口繼續慣性增長的恐慌、對低生育水平導致的經濟和社會(hui) 消極後果認識不足之外,對生育水平將來會(hui) 大幅反彈的擔心也是重要原因。在很長時間內(nei) ,許多人口學家仍然認為(wei) 低生育水平隻是由於(yu) 婚姻和生育推遲所導致的一個(ge) 暫時現象,以後隨著時期效應的消失,生育率便會(hui) 回升到更替水平或以上,但事實並非如此(McDonald, 2006)。

  最後是反思人口政策的效果問題。雖然許多國家在實行人口控製之後生育率有了顯著下降,即人口政策通過提供節育設施和服務加速了生育率下降的過程,但是假如這些國家沒有實施限製生育的人口政策,伴隨經濟和社會(hui) 的快速發展,人們(men) 思想觀念的劇烈改變,這些國家的生育率是否同樣會(hui) 出現顯著下降?有研究認為(wei) ,人口政策的作用主要表現在生育下降的啟動方麵,隨著社會(hui) 經濟發展以及生育規範和生育意願的劇烈改變,限製生育的人口政策的作用會(hui) 變得越來越微弱(McNicoll, 2001, 2006)。

  三、政策調整前的生育水平到底是多少?

  與(yu) 許多國家一樣,中國從(cong) 20世紀70年代以來同樣經曆了生育水平的大幅下降過程。由於(yu) 中國的生育水平下降是人口政策和社會(hui) 經濟因素共同作用的結果,因此中國人口政策的調整涉及三個(ge) 關(guan) 鍵問題:(1)政策調整前的生育水平到底是多少?(2)政策調整後的生育水平會(hui) 回升到什麽(me) 程度?(3)政策調整初期的出生堆積風險有多高?其中第一個(ge) 問題直接關(guan) 係到人口政策需不需要調整。雖然關(guan) 於(yu) 中國實際生育水平的爭(zheng) 論非常激烈,但其實對中國20世紀90年代初期已進入低生育社會(hui) 這一點,學者們(men) 於(yu) 2000年前後基本已達成共識。後來的爭(zheng) 論隻是圍繞實際生育水平到底是1.8、1.6還是1.5或者更低的問題。

  (一)爭(zheng) 論焦點

  1.觀點分歧

  學者關(guan) 於(yu) 人口政策調整的核心爭(zheng) 論領域就是中國的實際生育水平到底是多少。按照對生育水平的估計結果來劃分,可以分為(wei) “較高生育水平估計”和“較低生育水平估計”兩(liang) 個(ge) 陣營,人口政策調整前生育水平估計爭(zheng) 論的焦點從(cong) 2010年之前的是否低於(yu) 1.8,到2011年之後逐漸演變為(wei) 是否低於(yu) 1.7、1.6,近年來又變成是否低於(yu) 1.5。一般來說,持“較高生育水平估計”觀點的一部分學者認為(wei) 生育率還不太低,不應急於(yu) 調整政策。但也有不少持“較高生育水平估計”觀點的學者認為(wei) 生育率已經低於(yu) 更替水平,所以也支持政策調整。當然,持“較低生育水平估計”觀點的學者一般認為(wei) 調整人口政策刻不容緩。

  可以看出,不同學者關(guan) 於(yu) 人口政策調整前生育水平爭(zheng) 論的背後,反映的是各自認可的人口政策調整標準的差異。持“較低生育水平估計”觀點的學者一般將國際上通用的實際生育水平是否低於(yu) 2.1的更替水平作為(wei) 人口政策調整的依據,認為(wei) 實際生育水平如果低於(yu) 更替水平,則需要調整限製生育的人口政策。否則,如果國家長期處於(yu) 低生育水平,將會(hui) 導致人口老化、經濟活力受限、養(yang) 老金支出壓力變大等社會(hui) 經濟問題(曾毅,2006;Peng, 2011; 彭希哲、胡湛,2011)。

  而持“較高生育水平估計”觀點的一部分學者則長期將總和生育率是否低於(yu) 1.8作為(wei) 人口政策是否需要調整的標準,即隻要生育水平不顯著低於(yu) 1.8則不需要進行大幅調整。隨著“單獨二孩”和“全麵兩(liang) 孩”政策的實施,持“較高生育水平估計”觀點的一部分學者又將1.8的標準逐步置換為(wei) 1.5,即“低生育率陷阱”的進入警戒線,認為(wei) 隻要總和生育率不低於(yu) 1.5則問題不大。

  2.爭(zheng) 論的時間脈絡

  1992年在中國人口轉變過程中的地位舉(ju) 足輕重,這一年是中國進入低生育社會(hui) 的第一年,但當時幾乎所有人口學家都不這樣認為(wei) 。當年中國生育率抽樣調查得到的總和生育率為(wei) 1.57,大大低於(yu) 更替水平(郝虹生、高淩,1996)。當時的人口學家普遍對這一結果感到困惑不解,將主要原因歸於(yu) 出生人口的嚴(yan) 重漏報和瞞報,認為(wei) 這一時期的總和生育率至少在更替水平左右(曾毅,1995;梁中堂等,2000)。不過自1992年後,中國人口學家逐漸開始關(guan) 注低生育問題,開展了一係列研究和探討(中國生育率下降後果與(yu) 對策研究組,1994;陳友華,1999)。

  第一次真正有關(guan) 中國生育水平的爭(zheng) 論發生在2000年人口普查之後。由於(yu) 1995年1%人口抽樣調查和1997年全國人口與(yu) 生殖健康調查同樣重現了很低的生育率結果,而且由於(yu) 1990年人口普查的數據質量較高,當時的人們(men) 對2000年人口普查寄予厚望(郭誌剛,2010)。但2000年人口普查得到的生育率結果卻再一次讓人意外,直接匯總的總和生育率僅(jin) 為(wei) 1.22。

  2000年人口普查的真實總和生育率到底是多少?學者圍繞這一問題展開了爭(zheng) 論。對2000年總和生育率估計的最高值為(wei) 2.1(喬(qiao) 曉春、任強,2010),而最低值僅(jin) 為(wei) 1.5(郭誌剛,2004a,2004b),二者相差0.6,這也是自1992年至2010年曆次人口估計的最大差異。總體(ti) 來說,人口學家對2000年中國生育水平的估計均值在1.8左右,認為(wei) 中國處於(yu) 1.5及以下生育水平的估計在所有估計中的占比僅(jin) 為(wei) 8%左右。這也在一定程度上解釋了為(wei) 什麽(me) 2000年之後中國官方使用的總和生育率很長一段時間內(nei) 保持1.8的水平不變。

  第二次中國生育水平的爭(zheng) 論發生在2010年人口普查之後。2010年人口普查的總和生育率僅(jin) 為(wei) 1.18,緊接著2015年1%人口抽樣調查的結果僅(jin) 為(wei) 1.047,又一次讓人大感意外。人口學家對中國2010年前後的生育水平又掀起了一番激烈討論。2011-2013年,主要基於(yu) 2010年人口普查數據,大多數學者認為(wei) 中國當前生育水平很可能在1.5左右甚至以下(郭誌剛,2011b,2013;趙中維、陳衛,2011;李漢東(dong) 、李流,2012;朱勤,2012;王廣州、張麗(li) 萍,2012;王廣州等,2013;尹文耀等,2013)。2014-2015年,又湧現出了一批基於(yu) 人口普查匯總數據對生育水平的間接估計,或者使用戶籍數據、教育統計數據對生育水平的重新估計,認為(wei) 中國自2000年以來,尤其是2010年前後的生育水平至少在1.6-1.7的範圍內(nei) (陳衛、楊勝慧,2014;陳衛,2014,2015;陳衛、張玲玲,2015;翟振武等,2015)。

  (二)基本邏輯

  1.基礎數據和估計方法

  從(cong) 計算總和生育率的數據來源來看,持“較低生育水平估計”觀點的人口學者主要基於(yu) 人口普查或抽樣調查數據,一般通過人口普查或抽樣調查的原始數據直接計算得出總和生育率。而持“較高生育水平估計”觀點的人口學者則一般認為(wei) 人口普查和抽樣調查等數據有嚴(yan) 重的出生漏報問題,因此轉而使用戶籍數據、教育統計數據等年齡別匯總數據來間接推算總和生育率,或者對人口普查計算得出的總和生育率進行較大幅度的調整(翟振武等,2015)。

  使用的數據不同,所采用的總和生育率估計方法也會(hui) 很不一樣。由於(yu) 基於(yu) 人口普查或抽樣調查的估計可以得到相關(guan) 原始數據,因此一般采用“直接估計”的方法,這也是持“較低生育估計”觀點的學者通常采用的方法。而持“較高生育估計”觀點的學者由於(yu) 主要使用戶籍數據或教育統計數據來間接計算總和生育率,或者對人口普查得到的總和生育率進行較大幅度的調整。而無論戶籍數據還是教育統計數據都是匯總數據,雖然可以按年齡別匯總,但不存在人口普查包括的各類生育信息,因此隻能采用“間接估計”的方法。

  正是由於(yu) 基礎數據和估計方法的不同,不同學者得到的總和生育率存在明顯差異。基於(yu) 人口普查和抽樣調查數據的“直接估計”方法,一般得出的總和生育率在1.4-1.5之間,而基於(yu) 戶籍數據和教育統計數據然後對人口普查或抽樣調查進行調整得到的總和生育率一般在1.5-1.6之間,完全基於(yu) 戶籍數據和教育統計數據“間接估計”的總和生育率在1.6-1.7之間(翟振武等,2015)。

  2.雙方的合理化詮釋

  持“較低生育水平估計”觀點的人口學者認為(wei) ,盡管人口普查或抽樣調查數據存在“出生漏報”問題,但與(yu) 其他數據相比,人口普查或抽樣調查仍然是比較理想的數據來源,理由有三:首先,雖然“出生漏報”問題客觀存在並且無法確定具體(ti) 漏報程度,但針對相近年份不同來源調查數據所得總和生育率所做的比較的一致性程度較高,說明人口普查或抽樣調查本身數據質量較高。其次,通過對不同年份人口普查或抽樣調查所得總和生育率的比較,可以清晰地看出中國生育率總體(ti) 下行的變化趨勢。相比其他數據,人口普查或抽樣調查捕捉此種變化趨勢的敏感度更高。再次,人口普查或抽樣調查雖然不是完美數據,但這種不完美不代表其他數據可以將其替代。使用戶籍、教育統計等匯總數據,需要做出許多往往缺乏堅實基礎的主觀假定;采用“間接估計”方法通常會(hui) 對總和生育率調整過大,從(cong) 而高估生育水平(郭誌剛,2017)。

  持“較高生育水平估計”觀點的人口學者則認為(wei) ,隻有通過人口普查或抽樣調查之外的數據,才能對中國真實的生育水平獲得較為(wei) 準確的估計。其理由同樣有三:首先,由於(yu) 受計劃生育政策的影響,中國人口普查和抽樣調查存在比較嚴(yan) 重的“出生漏報”。如果直接計算其總和生育率,將會(hui) 嚴(yan) 重低估實際生育水平。其次,由於(yu) 無法直接判斷人口普查或抽樣調查的“出生漏報”到底有多嚴(yan) 重,必須依靠戶籍、教育統計等數據對人口普查或抽樣調查所得的總和生育率進行調整。再次,戶籍、教育統計等數據由於(yu) 受計劃生育政策影響發生“數據失真”的可能性相對較小,因此一定程度上可以作為(wei) 確定人口普查或抽樣調查所得總和生育率調整幅度的“黃金標準”。

  (三)評價(jia) :如何在分歧中尋找共識

  在真實生育水平成“謎”的背景下,如何在爭(zheng) 議中尋找共識,成為(wei) 對中國人口政策調整的認識中首先需要解決(jue) 的問題(郭誌剛,2011b)。目前國際上已經達成共識,當生育水平低於(yu) 2.1的更替水平時,發展中國家和地區需要停止或放寬限製生育的人口政策,最好采取鼓勵生育的措施,以期將生育率提升至更替水平以上(Morgan,2003)。研究表明,生育率長期低於(yu) 更替水平必然導致人口負增長,以中國平均世代26年計算,1.8的總和生育率對應的人口減半時間為(wei) 117年,而1.5的生育率對應的人口減半時間為(wei) 54年(王豐(feng) 等,2008;郭誌剛,2010)。因此,考慮到就業(ye) 、消除貧困等問題,堅持1.8的生育率可以作為(wei) 權宜之計,但不能長期一直堅持此標準。如果生育率繼續下降到1.5以下,即使實行鼓勵生育的政策,其效果也可能並不樂(le) 觀(Lutz et al.,2006;Mcdonald,2006;陳友華、苗國,2015)。國際經驗表明,生育水平一旦長期低於(yu) 更替水平就很難回升,在此情況下很少有國家可以把生育水平提升至2.1的更替水平(“21世紀中國生育政策研究”課題組,2010)。

  因此,如果將總和生育率是否低於(yu) 2.1作為(wei) 判斷人口政策是否需要調整的臨(lin) 界點,將總和生育率是否低於(yu) 1.5作為(wei) 判斷人口政策調整是否會(hui) 收效甚微的警戒線標準,然後再來看中國1992年進入低生育社會(hui) 以來的曆次爭(zheng) 論,原來所謂的生育水平之“謎”便會(hui) 迎刃而解。

  首先來看1992年。當年調查發現的總和生育率僅(jin) 有1.57,當時學者的估計基本認為(wei) 實際生育水平在2.13左右。但即使不考慮2000年以後學者對1992年生育水平的重新估計中給出的更低的生育水平,2.1的更替水平也標誌著中國正式進入低生育社會(hui) 。

  然後再看2000年。當年人口普查得到的總和生育率隻有1.22,當時絕大多數學者都把人口出生漏報作為(wei) 普查所得生育率過低的主要甚至唯一原因。但即使隻看學者們(men) 當時的估計均值,也僅(jin) 為(wei) 1.82左右,已經顯著低於(yu) 更替水平。即使不考慮學者們(men) 對低生育形勢認識的滯後,僅(jin) 僅(jin) 依據當時的生育水平估計,從(cong) 1992年到2000年已經從(cong) 2.13大幅下降到了1.82。這麽(me) 大的下降幅度本身已經是一個(ge) 非常強烈的預警信號,即中國不僅(jin) 進入了低生育社會(hui) ,而且低生育態勢還在不斷加劇。

  最後聚焦到2010年以來。2010年人口普查得到的總和生育率僅(jin) 為(wei) 1.18,學者對該時期的估計均值在1.57左右,其中2011-2013年在1.5左右,2014-2015年在1.65左右。1.57的均值不僅(jin) 已經比2.1的更替水平低了0.53,而且距離“低生育陷阱”的警戒線1.5僅(jin) 僅(jin) 高出0.07,而且這個(ge) 還隻是學者估計的均值而已,真實的生育水平可能還要顯著低於(yu) 這一估計均值。低生育水平的人口形勢已經非常清晰。

  此外,從(cong) 時間趨勢上來看,從(cong) 1992年到2010年,學者有關(guan) 中國生育水平爭(zheng) 論的分歧經曆了先擴大再減小的過程(見圖1、圖2)。其中對2000年生育水平估計的分歧最大(最大值和最小值相差0.6),而對1992年和2010年生育水平估計的分歧最小(最大值和最小值均相差0.2左右)。1992年分歧較小的原因是當時學者對低生育的到來的認識普遍存在滯後性,是一種“虛假”的共識。而2000年分歧較大的原因是學者對該次人口普查的數據質量、出生漏報等認識存在較大差異,大多數學者當時無法接受總和生育率比1992年調查更低的普查結果。學者對2010年生育水平的估計結果雖然依然存在分歧,但共識基本形成,其估計的最大值(1.7)和最小值(1.5)也僅(jin) 僅(jin) 相差0.2,都屬於(yu) 較低生育水平。中國人口政策研究數據庫由筆者所在研究團隊創建,共收集了有關(guan) 中國人口政策研究的文獻共計989篇,並對關(guan) 鍵指標進行了量化處理。

  即使隻看持“較高生育水平估計”觀點的學者所估計的生育水平(翟振武、陳衛,2007;陳衛、楊勝慧,2014;陳衛、張玲玲,2015;陳衛,2015,2016;翟振武等,2015),從(cong) 1995年到2015年這20年間的下降趨勢也非常明顯。其中,對2000年及以前中國生育水平的估計基本在1.8左右,而對2010年生育水平的估計已經大幅下降到了1.63,對2015年生育水平的估計又進一步下降到1.6(見圖3)。可以看出,1.6的生育水平距離“低生育率陷阱”1.5的警戒線已經僅(jin) 一步之遙。

  四、政策調整後的生育水平會(hui) 回升到什麽(me) 程度?

  人口政策調整涉及的第二個(ge) 關(guan) 鍵問題是:沒有人口政策限製,中國的生育水平將會(hui) 回升到多少?這直接關(guan) 係到中國人口政策最終應該調整到什麽(me) 程度。完全取消生育限製的中國生育水平到底是多少,是一個(ge) 典型的“反事實”問題,其答案決(jue) 定了人口政策調整的最大限度。要直接回答這一問題並不容易,由於(yu) 基礎數據、研究假設和模型方法等存在差異,不同學者對此的估計差距懸殊。不過從(cong) 生育意願的角度回答這一問題則要容易得多。作為(wei) 政策調整後生育水平的上限,2010年以來學者對中國生育意願的研究逐漸達成共識,普遍認為(wei) 即使完全取消限製生育的人口政策,中國的實際生育水平也會(hui) 明顯低於(yu) 更替水平。

  (一)爭(zheng) 論焦點

  1.觀點分歧

  對於(yu) 生育政策調整後的生育水平的估計,爭(zheng) 論的焦點集中於(yu) 生育率是否會(hui) 在政策調整後“大幅反彈”。有關(guan) 政策調整後最初幾年的出生堆積問題及生育率是否會(hui) 暫時大幅上升問題,本文下一部分將會(hui) 具體(ti) 討論,本部分主要討論政策調整後中國生育水平的長期趨勢。

  學界對於(yu) 這一問題的觀點分歧可以分為(wei) 三類:第一類認為(wei) 如果沒有限製生育的人口政策,中國實際生育水平會(hui) 大幅高於(yu) 更替水平,即“大幅提升論”(陶濤、楊凡,2011)。第二類認為(wei) 如果沒有生育限製,中國生育水平會(hui) 回升到更替水平左右,即“適度提升論”(Goodkind,2017)。第三類觀點認為(wei) 即使沒有生育限製,中國生育水平也會(hui) 明顯低於(yu) 更替水平(王軍(jun) 、王廣州,2013,2016;侯佳偉(wei) 等,2014),甚至有可能在1.5的“低生育率陷阱”警戒線周圍,可以稱之為(wei) “依舊低生育論”(Wang et al.,2013)。

  2.觀點爭(zheng) 論集中的兩(liang) 個(ge) 領域

  對於(yu) 政策調整後的生育水平到底是多少這一“反事實”問題,一般來說有兩(liang) 種估計路徑。

  第一種路徑是以與(yu) 中國社會(hui) 經濟發展狀況相似但並沒有實行限製生育政策的國家和地區的總和生育率為(wei) 參照,采用各種回歸模型模擬出中國的“假想”總和生育率,以此作為(wei) 沒有生育限製下的生育水平估計。該領域學者的爭(zheng) 論很大,而且估計結果差距非常懸殊,最高的達2.5,最低的僅(jin) 1.5左右(陶濤、楊凡,2011;Wang et al.,2013)。

  第二種路徑是將生育意願作為(wei) 沒有生育限製下的生育水平的估計上限。雖然2000年以來的調查多次得到明顯低於(yu) 更替水平的生育意願,但大多數學者並不相信這個(ge) 結果,認為(wei) 是生育政策問題的敏感性導致的嚴(yan) 重低估。2010年以來,隨著各種非官方至少是非計劃生育主管部門組織的全國生育意願調查的逐漸普及以及生育意願測量指標的精準化,生育意願的測量結果才逐漸得到學界的重視。

  (二)基本邏輯

  首先看基礎數據。采用第一種路徑的學者,一般采用聯合國人口基金會(hui) 、世界銀行、世界衛生組織等公布的世界各國人口、經濟和社會(hui) 的年度匯總數據。而采用第二種路徑的學者,則主要基於(yu) 2000年以來尤其是2010年以來各種涉及生育意願測量的全國抽樣調查原始數據。

  其次看估計方法。采用第一種路徑的學者通常假設與(yu) 中國經濟和社會(hui) 狀況相似的國家和地區會(hui) 有相似的總和生育率,因此采用的是“間接估計”的方法。大致估計流程如下:首先將與(yu) 中國經濟和社會(hui) 狀況相似並且沒有實行生育限製政策的國家和地區挑選出來;然後算出其主要經濟和社會(hui) 指標與(yu) 總和生育率的關(guan) 係;最後將中國相應的經濟和社會(hui) 指標代入通過前兩(liang) 步得出的線性或非線性多元回歸方程中,從(cong) 而求出中國“假想”的總和生育率,進而間接估計出沒有生育限製下的中國生育水平。

  采用第二種路徑的學者主要基於(yu) 全國抽樣調查原始數據來對生育意願進行直接估計,將其作為(wei) 沒有生育限製情況下中國生育水平的上限。而生育意願的測量指標早期主要使用的是“理想子女數”,2007年以來則逐漸嚐試使用“計劃擁有子女數”這一更為(wei) 可靠和有效的指標。2007年江蘇群眾(zhong) 生育意願和生育行為(wei) 調查首次對女性“計劃擁有子女數”這一指標進行測量,後來的中國家庭幸福感調查(2012,2013,2014)、中國勞動力動態調查(2014,2016,2018)等都對該指標進行了測量。

  (三)評價(jia) :如何在分歧中尋找共識

  首先看第一種路徑的研究。與(yu) 對政策調整前生育水平估計所采取的各種間接方法類似,該路徑的研究由於(yu) 采取了大量的人為(wei) 假設,而這些假設本身往往存在或多或少的問題。比如要假設除了生育限製政策之外,中國與(yu) 其他社會(hui) 經濟情況類似的國家和地區生育率下降的速度和趨勢大致相同,這樣就忽略了文化和社會(hui) 的地區特殊性問題,比如儒家文化圈的國家和地區普遍存在的低生育率甚至極低生育率問題。

  其實在現實中社會(hui) 經濟因素和政策因素往往相互影響,無論在統計上還是經驗上都很難將二者完全分開(Hvistendahl,2017)。由於(yu) 基於(yu) 不同的假設,學者們(men) 使用的樣本案例庫也不同。這就解釋了為(wei) 什麽(me) 同樣采用這種路徑的學者會(hui) 得出相差非常懸殊的估計結果。由此可見,采用第一種路徑很難達成共識。

  第二種路徑的研究由於(yu) 采用全國調查數據對生育意願進行直接估計,因此數據質量成為(wei) 重中之重。與(yu) 中國生育水平受“出生漏報”影響很大的認識類似,學者們(men) 最初並不相信由計劃生育主管部門組織的生育意願調查,但2010年以後,隨著非計劃生育主管部門組織的生育意願調查逐漸增多,學界逐漸認可了生育意願的調查結果(喬(qiao) 曉春,1999;鄭真真,2004,2011)。

  2010年及以後的多次有關(guan) 生育意願的非官方抽樣調查結果顯示,中國“理想子女數”的平均值在1.82至1.88的區間範圍內(nei) (王軍(jun) 、王廣州,2013,2016)。這充分說明,即使完全取消限製生育的人口政策,中國的實際生育水平也不會(hui) 超過2.1的更替水平。如果考慮到生育意願與(yu) 實際生育行為(wei) 之間的差異,實際生育水平甚至會(hui) 明顯低於(yu) 更替水平,學者對此已經逐漸達成共識(鄭真真,2011;王軍(jun) 、王廣州,2013,2016;侯佳偉(wei) 等,2014)。

  五、政策調整初期的出生堆積風險有多高?

  人口政策爭(zheng) 論的第三個(ge) 問題是:政策調整初期出現生育堆積的風險有多高?這直接關(guan) 係到人口政策調整的具體(ti) 路徑。其中,學者對“單獨二孩”政策出生堆積規模的估計雖有分歧,但都普遍認為(wei) 該政策導致的出生堆積風險不大,真正的分歧在“全麵兩(liang) 孩”政策。雖然學者沒有對“全麵兩(liang) 孩”政策導致的出生堆積人口規模達成共識,但對該政策導致的出生堆積風險的判斷卻經曆了從(cong) “分歧”趨向“共識”的過程。即使是2014年左右認為(wei) “全麵兩(liang) 孩”政策導致的出生堆積風險極大並且不可控的少部分學者,也逐漸認識到該政策導致的出生堆積風險其實並不大並且可控。

  (一)爭(zheng) 論焦點

  1.觀點分歧

  學者對於(yu) “單獨二孩”政策可能導致的出生堆積規模雖然有所分歧,但在風險可控方麵基本達成了共識。學者的分歧主要集中在對於(yu) “全麵兩(liang) 孩”政策可能導致的出生人口堆積問題的判斷,主要有兩(liang) 個(ge) 爭(zheng) 論的焦點:第一個(ge) 是“全麵兩(liang) 孩”政策導致的最初幾年的出生堆積人口規模到底有多少?第二個(ge) 是政策調整導致的出生堆積風險到底可不可控?至少在爭(zheng) 論的前期,不同學者的分歧很大。

  2.爭(zheng) 論的時間脈絡

  (1)“單獨二孩”政策實施前。“單獨二孩”政策雖然直到2014年才開始在全國各省份陸續實施,但關(guan) 於(yu) “單獨二孩”政策可能導致的最初幾年的出生堆積問題早在2012年就已開始研究。

  比如,王廣州、張麗(li) 萍(2012)認為(wei) 如果2015年放開“單獨二孩”政策,每年因為(wei) 政策調整增加的出生人口規模大約在100萬(wan) 人左右,風險基本可控;翟振武、趙夢涵(2014)則認為(wei) 在“單獨二孩”政策實施的前五年時間內(nei) ,政策年度新增出生人口規模大約在200萬(wan) 人左右;石人炳(2014)、喬(qiao) 曉春(2014)、姚引妹等(2014)對政策年度新增出生人口規模的估計基本都在300萬(wan) 人以上。雖然上述學者的估計結果存在一定差異,但都認為(wei) 風險處於(yu) 可控範圍。

  (2)“全麵兩(liang) 孩”政策實施前。學者對“全麵兩(liang) 孩”政策可能導致的出生堆積問題的研究也早在該政策正式實施之前即已開始。不過相比“單獨二孩”政策,不同學者在爭(zheng) 論前期對“全麵兩(liang) 孩”政策可能導致的出生堆積規模的估計和風險認知相差懸殊。

  最高的估計認為(wei) 實施“全麵兩(liang) 孩”政策後的年度出生人口將會(hui) 急劇增加,年度出生人口峰值將可能達到4995萬(wan) 人,即由於(yu) “全麵兩(liang) 孩”政策實施導致的新增出生人口峰值為(wei) 2425萬(wan) 人(翟振武等,2014)。最低的估計則認為(wei) 由於(yu) 政策調整導致的年度新增出生人口峰值僅(jin) 為(wei) 583萬(wan) 人左右(王廣州,2015)。可以看出,不同學者關(guan) 於(yu) “全麵兩(liang) 孩”政策導致的年度新增出生人口峰值估計的最高值是最低估計值的4.16倍,二者相差1842萬(wan) 人。

  (二)基本邏輯

  首先看基礎數據。不同學者的觀點雖然有分歧甚至分歧很大,但通常都采用全國人口普查作為(wei) 基礎數據。這是因為(wei) 無論要判斷“單獨二孩”政策還是“全麵兩(liang) 孩”政策所導致的出生人口堆積規模,都需要首先確定政策調整所涉及的人群規模及其年齡結構特征。而政策涉及的人群規模判斷又需要確定該女性是否結婚、已有子女數量和性別等基本社會(hui) 人口信息。當前也隻有人口普查的原始(抽樣)數據才能滿足如此苛刻的數據要求。

  其次看估計方法。學者一般采用人口預測的方法進行估計,如使用人口微觀仿真模型、隊列要素構成法等。人口預測的基本參數主要包括政策所涉及的育齡女性人口規模和年齡結構、育齡女性群體(ti) 的二孩生育意願及生育時間安排等(王廣州、張麗(li) 萍,2012;張麗(li) 萍、王廣州,2014;王廣州,2015)。

  通過人口普查數據,可以得出政策影響人群規模的大致估計及其年齡結構特征,但其二孩生育意願及生育時間安排則無法從(cong) 普查數據中直接獲得。不同學者獲得這兩(liang) 個(ge) 參數的渠道和參數設定也存在較大差異,這種差異也是導致不同學者對於(yu) 政策調整,尤其是“全麵兩(liang) 孩”政策調整導致的出生堆積人口規模估計差異較大的主要原因之一。

  (三)評價(jia) :如何在分歧中尋找共識

  學者對於(yu) “單獨二孩”政策出生堆積風險的認知基本沒有爭(zheng) 議,都認為(wei) 風險可控。但對於(yu) “全麵兩(liang) 孩”這一涉及中國城鄉(xiang) 各階層的重大人口政策調整,爭(zheng) 論的前期階段不同學者無論是對於(yu) 出生堆積人口規模的估計,還是對於(yu) 出生堆積風險是否可控的認知都存在很大分歧。並且,由於(yu) 學者們(men) 各自使用了不同的預測假設和參數設定,這種分歧看似不可調和。

  不過,隨著時間的推移,學者對“全麵兩(liang) 孩”政策所導致的年度出生堆積規模的“分歧”大幅減少,對出生堆積風險的認知更是基本達成了“共識”。

  首先來看對因“全麵兩(liang) 孩”政策調整導致最初幾年新增出生人口規模的估計結果(見圖4)。雖然在“全麵兩(liang) 孩”政策實施前及實施初期不同學者的估計結果差異較大,其中2014年學者對此的估計曾達到最高值,即2400萬(wan) 人以上,但2015年的相應估計則驟降到了583萬(wan) 人,2016年的相應估計又進一步下降到了470萬(wan) 人。可以看出,雖然不同學者有關(guan) 年度出生堆積人口規模的預測結果依然無法取得根本的一致,但是不同學者之間,甚至同一學者不同年份的估計結果之間的差異都隨時間推移呈大幅減少的趨勢(翟振武等,2014;王廣州,2015;翟振武等,2016)。

  其次來看對“全麵兩(liang) 孩”政策將導致的最初幾年出生堆積風險的認知。2014年是實行“單獨二孩”政策的第一年。當年有部分學者認為(wei) 如果以後還要實行“全麵兩(liang) 孩”政策,因政策調整導致的年度出生人口可能發生急劇增加,使人口形勢變得不可控,因而“全麵兩(liang) 孩”政策不宜過早實施(翟振武等,2014)。不過隨著“單獨二孩”政策“遇冷”以及中國生育率持續走低,到2015年左右,即“全麵兩(liang) 孩”政策實施的前夕,這些學者也基本轉變了態度,普遍認為(wei) “全麵兩(liang) 孩”政策實施所導致的新增出生人口規模相對有限,出生堆積風險基本處於(yu) 可控範圍(翟振武等,2016)。

  六、結論

  人口規模和結構及其變化趨勢是影響甚至決(jue) 定中國當前及未來經濟、社會(hui) 發展的基礎要素。自計劃生育政策實施以來,中國人口、經濟和社會(hui) 各方麵都鐫刻上了人口政策的深刻印記。由於(yu) 中國是在實行計劃生育的情況下實現了低生育水平,但同期經濟結構、民眾(zhong) 教育水平、女性勞動參與(yu) 率都有巨大變化,因此人口政策與(yu) 低生育水平之間的關(guan) 係比其他國家更為(wei) 錯綜複雜。

  有鑒於(yu) 此,人口學界對生育水平等關(guan) 鍵問題展開了長達二十餘(yu) 年的辯論。本文主要致力於(yu) 繪製中國低生育水平下人口政策爭(zheng) 論的路線圖,重點關(guan) 注與(yu) 政策調整有關(guan) 的三個(ge) 核心問題:(1)政策調整前中國的實際生育水平是多少,這關(guan) 係到人口政策需不需要調整;(2)政策調整後的生育水平會(hui) 回升到什麽(me) 程度,這關(guan) 係到人口政策調整的限度;(3)政策調整後最初幾年的出生堆積風險有多大,這關(guan) 係到人口政策改革的具體(ti) 實施路徑。

  通過係統梳理,我們(men) 發現這三個(ge) 問題雖然表麵上“分歧”很大,但其實爭(zheng) 論本身已經蘊含了達成“共識”的關(guan) 鍵要素:(1)有關(guan) 政策調整前的生育水平到底是多少這一問題,爭(zheng) 論各方普遍認為(wei) 中國自2000年至今的生育水平已經明顯低於(yu) 更替水平,而且下降趨勢非常明顯,近年至少有趨近於(yu) 1.5的“低生育率陷阱”警戒線的可能。(2)對於(yu) 政策調整後的生育水平會(hui) 回升到什麽(me) 程度,2010年以來學者們(men) 基本一致認為(wei) ,即使沒有計劃生育政策,中國的實際生育水平也明顯低於(yu) 更替水平。(3)有關(guan) 政策調整後最初幾年的出生人口堆積問題,即使以往認為(wei) “全麵兩(liang) 孩”政策導致的出生堆積風險很大的學者,也逐漸認識到出生堆積風險其實並不大而且可控。

  在分歧中尋找共識的過程體(ti) 現了人口學界對低生育現象認識的逐步深化,更為(wei) 人口政策未來的進一步優(you) 化提供了學理支持。為(wei) 避免跌入低生育率陷阱,國家需要營造友好的生育環境,構建和改善與(yu) 生育配套的各項社會(hui) 政策和製度安排,包括夫婦在養(yang) 育子女過程中共同分擔家務勞動、對懷孕和生育女性加強職業(ye) 保護、社區對家庭撫育工作進行分擔等。在生育水平仍然存在一定提高“彈性”的前提下,通過實行一攬子“生育友好”的社會(hui) 政策,避免落入“低生育率陷阱”,保證中國人口、經濟和社會(hui) 的永續安全。

友情鏈接: