共形预测初学者教程
【摘 要】 黑盒机器学习模型现在常被应用于高风险环境中,例如医疗诊断,这需要量化不确定性以避免模型失败。共形预测是一种用户友好的范式,用于为上述高风险的预测创建统计上严格的不确定性集合(或区间)。至关重要的是,这些集合在数据分布不明确的意义上也是有效的:即使没有分布假设或模型假设,这些集合也具有明确的、非渐近的保证。可以将共形预测与任何已经训练好的模型(例如神经网络)一起使用,以生成能够按照用户指定概率(如 90%90\%90% )包含基本事实的集合。共形预测易于理解、易于使用并且具备通用性,适用于计算机视觉、自然语言处理、深度强化学习等领域出现的各类问题。本文旨在通过一个自包含的文档,使读者能够理解共形预测和相关无分布不确定性量化技术工作原理。我们将引导读者了解共形预测的实用理论和示例,并描述其对复杂机器学习任务的扩展,包括结构化输出、分布偏移、时间序列、异常值、Dropout 模型等。
【原 文】 Angelopoulos, A. N. and Bates, S.(2021). “A Gentle Introduction to Conformal Prediction ...
现代神经网络的校准
【摘 要】 “信念校准”(预测器输出的概率性预测结果与真实正确结果之间的可代表性纠正问题)对于许多分类模型非常重要。我们发现,与十年前不同,现代神经网络的校准很差。通过大量实验,我们观察到深度、宽度、权重衰减和批量归一化是影响校准的重要因素。我们评估了各种后处理校准方法在图像和文档分类数据集及现代神经网络架构上的性能。我们的分析和实验不仅提供了对神经网络学习的见解,而且还为实际场景提供了一个简单而直接的方法:在大多数数据集上,温度定标法(一种 Platt 定标法 的单参数变体)在校准预测方面非常有效。
【原 文】 Guo, C., Pleiss, G., Sun, Y., and Weinberger, K. Q. 2017. On Calibration of Modern Neural Networks. Proceedings of the 34th International Conference on Machine Learning, PMLR, 1321–1330.
【阅后感】 本文是近年有关现代神经网络的不确定性校准问题的最重要的一篇文献。作者在总结了分类神 ...