刘会醒,程建华
摘要(Abstract):
管理层讨论与分析(MD&A)作为公司年报的重要组成部分,在财务欺诈识别中具有不可或缺作用。选取2019—2020年沪深两市A股制造业中具有财务欺诈行为的上市公司作为研究样本,对年报中MD&A所披露的信息进行度量,实现中文文本信息的量化;并在对结构化文本数据和定量数据进行融合的基础上提出基于Stacking集成算法的财务欺诈识别模型。实验结果表明:Stacking集成分类器在准确率、查准率、F1-score以及AUC这4个评价指标得分上均取得了最优值,识别性能显著优于传统单分类器;相较于使用传统定量数据,MD&A中文文本信息的加入使Stacking集成分类器的识别性能得到显著提升。应充分挖掘年报文本信息,并持续优化模型和算法,以提升财务欺诈识别系统的准确性。
关键词(KeyWords): 管理层讨论与分析;财务欺诈;集成学习;文本分析
基金项目(Foundation): 安徽省哲学社会科学规划一般项目“大数据背景下数据驱动模式的经济运行预警体系研究”(AHSKF2019D019)
作者(Author): 刘会醒,程建华
DOI: 10.19473/j.cnki.1008-4940.2023.04.012