基于替代数据法和MF-DFA的合意工业产能利用率区间估计方法及应用
毛锦琦, 王德鲁, Xunpeng Shi
(1.中国矿业大学 经济管理学院,江苏 徐州 221116; 2.Australia-China Relations Institute, University of Technology Sydney, Ultimo, NSW 2007, Australia)
多年来我国工业产能过剩“久调未决”,严重制约了工业行业的结构升级,并成为国家供给侧结构性改革和高质量发展的桎梏。我国工业产能过剩呈现出普遍性、持久性、复杂性等显著特征。国家统计局相关数据显示,2019年我国钢铁、电解铝、化纤等16个重点工业行业产能利用率不足70%。值得关注的是,在新冠疫情全球肆虐、地缘政治冲突加剧、环境约束加强等多重因素叠加背景下,这些产能过剩的行业仍有一批在建、待建的大型项目,产能过剩呈加剧之势。为此,各级政府制定了一系列产能过剩化解措施,但产能过剩问题并未得到有效抑制,反而陷入“产能过剩—产能化解—产能不足—产能激励—产能再过剩”的治理困境[1]。究其原因,主要在于产能过剩治理缺乏必要的前瞻性和精准性。
实现产能过剩精准治理的前提条件是对产能过剩的准确判别以及过剩程度的精确度量,其核心问题可以归结为合意产能利用率区间的确定。对产能利用率标准的误判极易加大决策偏差风险,并给行业、经济、社会带来一系列连锁性、灾难性的影响。具体而言,若合意产能利用率区间设定过高,那么政府决策者为缩小现实与标准间的差距,可能会实施去产能政策,进而增加资产处置、人员安置等成本[2],甚至导致产能短缺;
反之,那么会给政府决策者产能不足的错觉,从而鼓励投资,引发新一轮的产能过剩[3]。因此,合意产能利用率区间的精准确立是跳出产能过剩与产能不足间恶性循环的关键。
目前,现有研究聚焦于产能过剩的形成机理[4]、治理机制[5]、测度方法[6]等方面,而鲜少关注合意产能利用率区间的估计方法。在实践中,合意产能利用率区间没有统一标准。西方国家普遍认可的产能利用率的标准区间为83~86%,但其是根据本国经济运行总结出来的本国经验,可能不适用于中国情境。我国通常将现行经验标准(79~82%)作为调控依据。实际上,基于经验确定的合意产能利用率区间有其合理性,但也存在一定问题。一方面,基于经验总结的“合意区间”是否精确,是否“合意”值得商榷;
另一方面,这一标准忽略了行业间的异质性,我国工业行业众多,各行业的行业特征、技术特点、发展阶段等方面存在显著差异[7],拿“一把尺子”去度量不同行业产能利用情况显然是不适宜的。
当前常用的阈值确定方法包括经验分析和统计分析法,为阈值的确定提供了一定的参考,但存在主观性强,理论依据不严谨等缺陷[8]。经验分析法中常用多数原则、半数原则、少数原则来划分区间,这些原则的设置和应用缺乏严格的理论依据。统计分析法根据统计误差理论,用中心值加上标准差的倍数来确定阈值。该方法能够从数据分布规律中定量地确定阈值,但倍数的选取往往会受研究人员个人经验、风险偏好等影响。因此,亟须探索更客观的阈值确定方法。多重分形去趋势波动分析(Multifractal Detrended Fluctuation Analysis,MF-DFA)和替代数据法(Surrogate DataMethod,SD)的结合能够从数据自身演化规律中自适应地识别时序异常值[9],这为合意工业产能利用率区间估计提供了新思路。
鉴于此,本文拟融合SD和MF-DFA方法对合意工业产能利用率区间估计进行探索性研究,并选取煤炭行业进行方法有效性的实证检验,以期为工业产能过剩风险监测与判别提供科学有效的量化分析工具,并为深化煤炭产能过剩治理提供政策靶向和决策依据。
1.1 模型框架
鉴于传统合意产能利用率区间确定方法主观性、经验性以及缺乏动态性,提出一种基于SD和MF-DFA的合意工业产能利用率区间估计方法,简称为SMF-DFA方法,其流程如图1所示。首先,对时间序列基本特征进行分析,时序具有长程相关性和多重分形结构是能利用SMF-DFA方法识别异常值的基础;
其次,采用SD对原序数据进行重排,并运用MF-DFA计算出所有重排序列的Hurst指数;
然后,用卡方检验确定Hurst指数序列陡变并偏离原序Hurst指数的唯一临界点;
最后,根据临界点确定合意产能利用率区间。
图1 合意工业产能利用率区间估计流程
1.2 MF-DFA方法
MF-DFA是描述复杂非线性的时间序列自相似结构特征的算法[10],能够判断时序的长程相关性和多重分形结构。MF-DFA步骤如下:
Step2等间隔划分子区间。将y(i)从左侧与右侧分别进行划分,形成长度均为s的2Ns(Ns=int(N/s))个不重叠子区间,避免N不为s整数倍而丢失信息。
Step5计算q阶Hurst指数hq,公式为Fq(s)=∝sh(q)。当q=2时,hq为经典Hurst指数。当0 Step6计算多重分形质量指数τq,公式为τq=qhq-1。当τq与q为非线性关系时,时序具有多重分形结构。奇异指数α和多重分形谱f(α)可通过Legendre变换得到,表达式为α=τ′(q),f(α)=qα-τ(q)。Δα越大表示多重分形特征越显著。 SD是识别时间序列非线性特征的可靠工具[11],为获得与原始序列同均值、同方差以及概率分布函数、自相关函数都相同的替代数据,采用相位随机化方法,具体步骤如下: Step1对原始序列{xk,k=1,2,…,N}进行Fourier变换,得x(f)=A(f)eiφ(f)。 Step2对φ(f)随机旋转一个相位角,即ψ(f)=φ(f)+φ(f);x′(f)=A(f)ei(φ(f)+φ(f))=A(f)eψ(f)。其中,φ(f)是在区间[0,2π]内生成的随机数。 Step3对x′(f)进行Fourier逆变换,得x′(n)=F-1{A(f)eiψ(f)},n=1,2,…,N。 (1)SMF-DFA方法 各行业的产能利用变化具有周期性与规律性,其演化状态也应呈现出一定规律性。正常运行的行业产能系统演化状态具有持续性,当其受到异常事件干扰时,这种持续性必将受到不同程度的影响。因此,融合SD与MF-DFA来分析时序的长程相关性及其收敛情况,并据此确定时序的异常值域[9],其步骤如下: Step1确定原序X的最小值xmin、最大值xmax以及序列平均值R; Step2计算每个新序列YJ的Hurst指数,形成序列hq(J),并根据hq(J)收敛于原序Hurst指数值的收敛点确定正常值与异常值的临界点。 (2)SMF-DFA方法识别异常值域有效性验证 生成的Lorenz曲线如图2所示,可以发现,x分量曲线虽然呈现出复杂性、非线性,但其在严格的[-18.42,18.42]范围内稳定运行。因此,可以将x分量数据看作是系统正常演化状态的样本数据,且正常值域为[-18.42,18.42]。为模拟异常情况,用异常数据(小于-18.42或大于18.42)随机替代少量正常数据,形成序列{xi}。首先,用MF-DFA计算{xi}的Hurst指数,结果为0.8341,说明序列具有长程相关性,可用SMF-DFA方法识别其异常值域。其次,利用SMF-DFA方法识别异常值,其中m=2,q=2,R=0,识别结果如图3所示。 图2 Lorenz曲线 图3 SMF-DFA方法识别异常值结果 煤炭行业作为我国基础性行业,关系着国家能源安全和经济命脉。自2012以来,在经济下行、能源转型等因素的叠加作用下,煤炭行业产能过剩问题日益严重。近年来,煤炭去产能工作取得了阶段性成就,产能利用率也得到了相应提升。然而,煤炭产能利用率是否已经达到合理状态,以及到底还需去多少产能等问题尚存争议[12]。为此,本文以煤炭行业为例,进行模型应用及分析。 由于产能利用率时间序列波动幅度较小,本文以也能有效反映产能利用情况的产能过剩规模时序为对象,求出合理的产能过剩规模区间,进而根据产能利用率与产能过剩规模间的关系得到合意产能利用率区间。本文选取1989~2019年这一时间窗口进行实证研究,原因在于煤炭行业在此期间经历了产能过剩—不足—再过剩的周期性过程[13],从而使合意产能利用率区间估计结果更具说服力。 煤炭产能过剩规模计算公式为OC=C-P=P/CU-P[14]。其中,OC为煤炭产能过剩规模; 图4 1989~2019年煤炭产能过剩规模 2.2.1 时间序列基本特征分析 (1)残差序列的Gauss-Markov假设验证 对消除趋势后得到的残差序列进行Gauss-Markov假设验证。其中,采用Spearman等级相关系数检验判断是否同方差; 表1 子区间残差序列Gauss-Markov假设验证结果 (2)长程相关性判断及多重分形结构的存在性检验 煤炭产能过剩规模时序的Hurst指数及多重分形谱如图5所示,多重分形参数如表2所示。可以发现:第一,当q=2时,时序{zk}的h(q)为0.77,表明{zk}具有较强的长程相关性。由此可知,在未来一段时间内,煤炭产能过剩规模波动变化与前一阶段变化相同。第二,时序{zk}的Hurst指数h(q)是关于q的函数,而非常数,表明{zk}存在多重分形结构。第三,时序{zk}的多重分形谱为单峰函数,进一步表明{zk}存在显著的多重分形特征。{zk}的Δf小于0,Ω大于0,表明煤炭产能过剩规模较大的事件占更主导的地位。综上,煤炭产能过剩规模时序具有长程相关性和多重分形特征,可采用SMF-DFA方法识别其异常值。 图5 煤炭产能过剩规模时序的q阶广义Hurst指数及多重分形谱 表2 煤炭产能过剩规模时序的多重分形参数 2.2.2 SMF-DFA方法识别时序异常值 利用SMF-DFA方法识别煤炭产能过剩规模时序的异常值域。计算过程中令参数m=1,q=2,R取均值,结果如图6所示。图6中右侧曲线(J>R)是xmin以为起点的随机重排序列的Hurst指数序列; 图6 煤炭产能过剩规模时序异常值识别结果 表3 极大阈值收敛区域内转折点差异显著性检验 表4 极小阈值收敛区域内转折点差异显著性检验 将得到的煤炭产能过剩规模月度阈值换算成年度阈值,并根据公式CU=P/(OC+P),得到合意煤炭产能利用率区间为[73.73%,86.23%]。为进一步验证所确定的合意煤炭产能利用率区间的有效性,结合1989~2019年煤炭产能利用率,对比分析本文确定的合意区间与我国现行经验标准[79%,82%]的合理性,如图7所示。其中,实线为本文所估计的合意区间,虚线为我国现行经验标准,带实点的曲线为历年实际产能利用率曲线。可以发现: (1)1989~2000年煤炭产能利用率均在两个合意区间下限的下方,即煤炭产能处于过剩状态。回顾煤炭行业发展历程可知,1989~2000年属于煤炭行业转型发展期[15],从计划经济体制向市场经济体制过渡。体系变革以及经济快速增长使得煤炭供不应求,大量乡镇企业、村办企业进入煤炭行业。行业的无序发展和管制薄弱使得产能利用率低下。 (2)2001~2003年煤炭产能利用率在两个合意区间内或附近。其原因在于2001年国家发文关闭整顿小煤矿, 煤炭产量得到控制, 煤炭市场由长期供大于求向供求平衡转化。 (3)2004~2011年煤炭产能利用率变化较平稳。若以为[73.73%,86.23%]标准,其围绕区间上限略微波动,即煤炭行业处于产能略微不足的状态; (4)2012~2016年煤炭产能利用率低于两个合意区间的下限。2012年以后,由于“黄金十年”的投资积累和产能释放,产能依旧呈扩张之势。然而在经济下行、能源转型、环境约束等多种因素的共同作用下,需求快速萎缩。煤炭产能变化与需求变化的极度不匹配引发新一轮产能过剩,产能利用率低下。 (5)2017~2019年煤炭产能利用率趋于平稳。其原因在于为帮助煤炭行业脱困,2016年以来国家出台了一系列煤炭去产能政策。以[73.73%,86.23%]为标准,煤炭产能利用率略低于区间下限,尚需化解产能约15000万吨,这与煤炭工业规划设计研究院发布的去产能规模相近。以[79%,82%]为标准,尚需化解产能约35000万吨,而煤炭行业若再次大规模去产能,则必会影响当前相对平稳的煤炭供需,引起煤炭价格剧烈波动,反而不利于煤炭行业健康发展。 此外,我国现行经验标准区间较为狭小,而产能利用率易受供需随机扰动的影响,易偏离这一区间,加剧政府政策措施变动。政策措施的频繁变更无法对企业提供合理的信号显示机制,还会对行业造成巨大冲击,同时严重损害了政府信誉和政策公信力。综上所述,本文确定的合意煤炭产能利用率区间更加符合煤炭行业发展实际,对煤炭行业发展判断更为合理。换言之,合意煤炭产能利用率区间为[73.73%,86.23%]更为合理与科学。 图7 1989~2019年煤炭产能利用率 鉴于传统合意产能利用率区间确定方法的主观性、缺乏动态性,本文融合SD和MF-DFA方法对合意工业产能利用率区间估计进行了探索性研究,主要研究结论如下。 首先,鉴于产能过剩时序长程相关性、多重分形结构等数据特征,提出了一种基于SMF-DFA的合意工业产能利用率区间估计新方法。该方法从数据自身演化规律中自适应地确定阈值,有效克服了传统统计与经验方法的主观性和缺乏理论依据的局限性,并以煤炭行业为例验证了方法的有效性。其次,采用SMF-DFA方法确立了合意煤炭产能利用率区间,即73.73%~86.23%。相较于我国现行经验标准(79~82%),该区间更加符合煤炭行业发展实际,且有助于提高煤炭产能过剩调控时机和力度的精准性。最后,识别了当前煤炭产能过剩状态和风险水平,煤炭产能利用率趋近但仍低于合意产能利用率区间下限,这为煤炭产能过剩治理提供了决策参考。 基于以上发现,为未来我国深化去产能工作、优化供给侧结构性改革、促进高质量发展,提出如下政策建议。一方面,就工业行业而言,存在异质性的行业应根据自身发展实际和时序数据特征确定相适的合意产能利用率区间,从而提高产能过剩调控策略的针对性、适用性和精准性。另一方面,具体到煤炭行业,经过多年的调控,煤炭去产能工作现已取得了阶段性进展,落后产能逐步淘汰。今后去产能工作的重点应放在“提质”、“增效”的目标上,避免“一刀切”和简单关停等政策,积极推进煤炭行业进行战略性兼并重组。在控制煤炭产能总量的前提下,持续通过科技创新发展先进产能,优化产能供给体系。1.3 SD方法
1.4 基于SMF-DFA的异常值识别方法
分别以xmax与xmin为起点,R为终点,随机化(xi,ifxi≥max-d×k)(xi,ifxi≤min+d×k)内数据的顺序,同时保留其余数据顺序不变,依次得到新序列YJ,J=max-d×k(J=min+d×k),其中d为区间间隔,k=int(1,2,…,(max-R)/d)(k=int(1,2,(R-min)/d));2.1 样本与数据
C为煤炭产能;
P为煤炭产量;
CU为煤炭产能利用率。煤炭产量数据来源于国家统计局数据库;
CU数据来源于Wang等的文献[14]与国民经济和社会发展统计公报。煤炭产能过剩规模时序{zk}如图4所示。可以发现,时序呈现出显著的非线性、复杂性与波动性特征,这与我国工业产能过剩致因多源性和复杂性相契合;
在此时间窗口,产能过剩规模的最大值为16559.25万吨,最小值为1208.36万吨,平均值为6025.89万吨。2.2 煤炭产能过剩规模异常值域识别结果
采用DW检验判断独立性。子区间残差的Gauss-Markov假设验证结果如表1所示,可以发现其均不能同时满足零均值、同方差且不相关的假设。因此,残差序列具有相关性,原序为有偏的随机游走过程,需进一步分析其波动特征。
左侧曲线(J2.3 卡方检验确定Hurst指数序列收敛点
2.4 合意产能利用率区间估计与分析
而以[79%,82%]为标准,其高于区间上限一大段,即煤炭行业处于产能相当不足的状态。2004~2011年,我国工业进入重化工业阶段,对煤炭需求大幅提升。但通过历史检验可知,正是因为对当时情景判断失误,认为煤炭产能相当不足,进而鼓励投资,引发投资潮涌,导致2012年以来煤炭市场供大于求问题凸显, 煤炭产能过剩日益严重。