西山晴雪的知识笔记

发表于2022-12-10|贝叶斯统计GeoAI贝叶斯神经网络点参考数据空间统计深度学习

【摘要】地球系统模型 (ESM) 是量化地球物理状态并预测未来可能发生的变化的主要工具。然而，近年来，人工智能 (AI) 方法越来越多地用于增强甚至取代经典的地球系统模型任务，这让人们对人工智能能够解决气候科学的一些重大挑战产生了希望。在此观点中，我们调查了过程模型和 AI 在地球系统和气候研究中的最新成就和局限性，并提出了一种方法论转变，其中深度神经网络和地球系统模型被区分为单独的方法，并重新组合为学习、自我验证和可解释的地球系统模型-神经网络混合体。沿着这条道路，我们创造了术语神经地球系统建模。我们研究了神经地球系统建模的并发潜力和陷阱，并讨论了人工智能是否可以支持地球系统模型甚至最终使它们过时的悬而未决的问题。【原文】 Irrgang, C. et al. (2021) ‘Towards neural Earth system modelling by integrating artificial intelligence in Earth system science’, Nature Machine Intelligence, 3(8), pp. 667 ...

狄利克雷过程混合模型

发表于2022-10-01|发现任务非参数贝叶斯模型

〖摘要〗在很多模型假设中，存在各种形式的隐变量和隐结构，其目的是使高维数据能够得到足够地解释，以发现或挖掘隐藏在可观测数据深层的知识或信息。我们可以将此类模型暂时称为发现模型或者广义隐变量模型。本文是此类模型的一个总揽，大部分内容摘自 Murphy 的《机器学习：高级主题》的第 27 章。在本部分中，我们专注于能够为问题提出发现模型假设我们能够观测到的数据 x\boldsymbol{x}x 是由某些底层的潜在因素 z\boldsymbol{z}z （通常是低维的）导致，并且通常 z\boldsymbol{z}z 代表了世界的某种 “真实” 状态。至关重要的是，这些潜在因素通常被认为对模型的最终用户有意义（也就是说，评估此类模型需要领域专业知识，具有可解释性）。我们的目的是通过对可观测数据 x\boldsymbol{x}x 的处理，得到潜在因素 z\boldsymbol{z}z 的底层作用机理，进而能够给可观测数据的生成作出一个合理的解释。这种反向建模方法广泛用于科学和工程中，其中 z\boldsymbol{z}z 代表了自然界中待估计的潜在状态 ...

预测模型概览

发表于2022-09-28|预测任务概览

基于该评分规则的最小化负对数损失（ NLL\text{NLL}NLL ）方法，应该会产生良好校准的输出类概率。但在实践中，对数损失往往会过分强调概率分布的尾部。一、问题提出绝大多数机器学习都比较关注解决一个单纯的问题：从标记训练集 D={(xn,yn),n=1:N}\mathcal{D} = \{(\boldsymbol{x}_n, \boldsymbol{y}_n), n = 1:N\}D={(xn,yn),n=1:N} 中学习得到某个函数 fff，使其能够从未来的新输入 x\boldsymbol{x}x 中预测输出 y\boldsymbol{y}y。其中，xn∈X⊆RD\boldsymbol{x}_n \in \mathcal{X} \subseteq \mathbb{R}^Dxn∈X⊆RD, yn∈Y⊆RC\boldsymbol{y}_n \in \mathcal{Y} \subseteq \mathbb{R}^Cyn∈Y⊆RC 。我们可以使用形式为 p(y∣f(x))p(\boldsymbol{y}|f(\boldsymbol{x}) ...

生成模型概览

发表于2022-09-28|生成任务概览

〖摘要〗生成模型（Generative Model）是概率统计和机器学习中的一类重要模型，泛指一系列用于随机生成可观测数据的模型。生成模型应用十分广泛，可以用于对不同类型的数据建模，如图像、文本、声音等。如果假设上述某类型的数据对象都服从一个未知分布，则生成模型通常希望通过一些观测样本来学习（估计）该分布，并能够利用该分布随机地生成未观测过的新样本。生成模型有很多种，本文是此类模型的一个简单概览，其中大部分内容来自 Murphy 的《Machine Learning: Advanced Topics》第 20 章。〖参考〗 J. M. Tomczak, Deep Generative Modeling. ch.1 / Murphy, 《Machine Learning: Advanced Topics》ch. 20 / Deep Generative Modelling: A Comparative Review of VAEs, GANs, Normalizing Flows, Energy-Based and Autoregressive Models / An In ...

发现模型概览

发表于2022-09-23|发现任务概览

发现模型概览〖摘要〗在很多模型假设中存在各种形式的隐变量和隐结构，其目的是使高维数据能够得到足够地解释，以便发现或挖掘隐藏在可观测数据深层的知识或信息。我们将此类模型称为发现模型或者广义隐变量模型。本文是此类模型的一个总揽，大部分内容摘自 Murphy 的《机器学习：高级主题》的第 27 章。问题提出发现模型假设我们能够观测到的数据 x\boldsymbol{x}x 是由某些底层的潜在因素 z\boldsymbol{z}z （通常是低维的）导致，并且通常 z\boldsymbol{z}z 代表了世界的某种 “真实” 状态。至关重要的是，这些潜在因素通常被认为对模型的最终用户有意义（也就是说，评估此类模型需要领域专业知识，具有可解释性）。我们的目的是通过对可观测数据 x\boldsymbol{x}x 的处理，得到潜在因素 z\boldsymbol{z}z 的底层作用机理，进而能够给可观测数据的生成作出一个合理的解释。这种反向建模方法广泛用于科学和工程中，其中 z\boldsymbol{z}z 代表了自然界中待估计的潜在状态，而 x\boldsy ...

决策任务索引帖

发表于2022-09-23|决策任务概览

待完善 #refplus, #refplus li{ padding:0; margin:0; list-style:none; }； document.querySelectorAll(".refplus-num").forEach((ref) => { let refid = ref.firstChild.href.replace(location.origin+location.pathname,''); let refel = document.querySelector(refid); let refnum = refel.dataset.num; let ref_content = refel.innerText.replace(`[${refnum}]`,''); tippy(ref, { content: ref_content, ...

决策模型概览

发表于2022-09-23|决策任务概览

决策模型概览〖摘要〗在很多模型假设中，存在各种形式的隐变量和隐结构，其目的是使高维数据能够得到足够地解释，以发现或挖掘隐藏在可观测数据深层的知识或信息。我们可以将此类模型暂时称为发现模型或者广义隐变量模型。本文是此类模型的一个总揽，大部分内容摘自 Murphy 的《机器学习：高级主题》的第 27 章。在本部分中，我们专注于能够为问题提出发现模型假设我们能够观测到的数据 x\boldsymbol{x}x 是由某些底层的潜在因素 z\boldsymbol{z}z （通常是低维的）导致，并且通常 z\boldsymbol{z}z 代表了世界的某种 “真实” 状态。至关重要的是，这些潜在因素通常被认为对模型的最终用户有意义（也就是说，评估此类模型需要领域专业知识，具有可解释性）。我们的目的是通过对可观测数据 x\boldsymbol{x}x 的处理，得到潜在因素 z\boldsymbol{z}z 的底层作用机理，进而能够给可观测数据的生成作出一个合理的解释。这种反向建模方法广泛用于科学和工程中，其中 z\boldsymbol{z}z 代表了自然界中待 ...

➃ 系统化掌握集成学习方法

发表于2022-03-14|预测任务非参数模型

系统化掌握集成学习 1. 简单的集成学习方法平均法加权平均法最大投票法 2. 二次采样方法与统计机器学习基础 3. Bagging 方法 – 等权重的装袋法 Bootstrap Aggregation 4. Random Forest 随机森林法 – 5. Boosting 方法 – 权重逐步增大的提升法 6. Stacking 方法 – 学习最优的模型组合 7. 应用案例同质分类器的集成学习 – 以手写数字识别为例异质分类器的集成学习 – 以信用卡违约预测为例异质分类器的集成学习 – 以垃圾邮件为例异质分类器的集成学习 – 以电影评论情感分析为例同质分类器的集成学习 – 以时尚产品分类为例 #refplus, #refplus li{ padding:0; margin:0; list-style:none; }； document.querySelectorAll(".refplus-num").forEach((ref) => ...

➃ 集成学习：初识

发表于2022-03-13|预测任务非参数模型

集成学习–Ensembling Learning 偷懒了，直接转载 Juicy B 关于集成学习的系列博客。 1. AdaBoost分类算法原理及sklearn应用 2. AdaBoost回归算法原理及sklearn应用 3. GBDT分类算法原理及sklearn应用 4. GBDT回归算法原理及sklearn应用 5. LightGBM 6. Random Forest 与 Bagging #refplus, #refplus li{ padding:0; margin:0; list-style:none; }； document.querySelectorAll(".refplus-num").forEach((ref) => { let refid = ref.firstChild.href.replace(location.origin+location.pathname,''); let refel = ...

➃ 集成学习：提升法

发表于2021-09-25|预测任务非参数模型

【摘要】高斯过程 Gaussian Processes 是概率论和数理统计中随机过程的一种，是多元高斯分布的扩展，被应用于机器学习、信号处理等领域。本文对高斯过程进行公式推导、原理阐述、可视化以及代码实现，介绍了以高斯过程为基础的高斯过程回归基本原理、超参优化、高维输入等问题。【see also】《高斯过程的可视化探索》；《稀疏高斯过程及其推断》；《深度高斯过程》 p{text-indent:2em;2} 1 集成学习 #refplus, #refplus li{ padding:0; margin:0; list-style:none; }； document.querySelectorAll(".refplus-num").forEach((ref) => { let refid = ref.firstChild.href.replace(location.origin+location.pathname,''); ...