待完善
文章作者: 西山晴雪
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 西山晴雪的知识笔记!
相关推荐
2022-09-23
发现模型概览
发现模型概览〖摘要〗 在很多模型假设中存在各种形式的隐变量和隐结构,其目的是使高维数据能够得到足够地解释,以便发现或挖掘隐藏在可观测数据深层的知识或信息。我们将此类模型称为 发现模型 或者 广义隐变量模型。本文是此类模型的一个总揽,大部分内容摘自 Murphy 的《机器学习:高级主题》的第 27 章。 问题提出发现模型假设我们能够观测到的数据 $\boldsymbol{x}$ 是由某些底层的潜在因素 $\boldsymbol{z}$ ( 通常是低维的 )导致,并且通常 $\boldsymbol{z}$ 代表了世界的某种 “真实” 状态。至关重要的是,这些潜在因素通常被认为对模型的最终用户有意义 ( 也就是说,评估此类模型需要领域专业知识,具有可解释性 )。 我们的目的是通过对可观测数据 $\boldsymbol{x}$ 的处理,得到潜在因素 $\boldsymbol{z}$ 的底层作用机理, 进而能够给可观测数据的生成作出一个合理的解释。 这种反向建模方法广泛用于科学和工程中,其中 $\boldsymbol{z}$ 代表了自然界中待估计的潜在状态,而...
2022-09-23
决策任务索引帖
待完善 #refplus, #refplus li{ padding:0; margin:0; list-style:none; }; document.querySelectorAll(".refplus-num").forEach((ref) => { let refid = ref.firstChild.href.replace(location.origin+location.pathname,''); let refel = document.querySelector(refid); let refnum = refel.dataset.num; let ref_content = refel.innerText.replace(`[${refnum}]`,''); tippy(ref, { content:...
2022-09-23
决策模型概览
决策模型概览〖摘要〗 在很多模型假设中,存在各种形式的隐变量和隐结构,其目的是使高维数据能够得到足够地解释,以发现或挖掘隐藏在可观测数据深层的知识或信息。我们可以将此类模型暂时称为 发现模型 或者 广义隐变量模型。本文是此类模型的一个总揽,大部分内容摘自 Murphy 的《机器学习:高级主题》的第 27 章。 在本部分中,我们专注于能够为 问题提出发现模型假设我们能够观测到的数据 $\boldsymbol{x}$ 是由某些底层的潜在因素 $\boldsymbol{z}$ ( 通常是低维的 )导致,并且通常 $\boldsymbol{z}$ 代表了世界的某种 “真实” 状态。至关重要的是,这些潜在因素通常被认为对模型的最终用户有意义 ( 也就是说,评估此类模型需要领域专业知识,具有可解释性 )。 我们的目的是通过对可观测数据 $\boldsymbol{x}$ 的处理,得到潜在因素 $\boldsymbol{z}$ 的底层作用机理, 进而能够给可观测数据的生成作出一个合理的解释。 这种反向建模方法广泛用于科学和工程中,其中 $\boldsymbol{z}$...
2023-01-03
🔥 预测任务索引帖
待完善 #refplus, #refplus li{ padding:0; margin:0; list-style:none; }; document.querySelectorAll(".refplus-num").forEach((ref) => { let refid = ref.firstChild.href.replace(location.origin+location.pathname,''); let refel = document.querySelector(refid); let refnum = refel.dataset.num; let ref_content = refel.innerText.replace(`[${refnum}]`,''); tippy(ref, { content:...
2022-09-28
预测模型概览
基于该评分规则的最小化负对数损失 ( $\text{NLL}$ )方法,应该会产生良好校准的输出类概率。但在实践中,对数损失往往会过分强调概率分布的尾部。 一、问题提出绝大多数机器学习都比较关注解决一个单纯的问题:从标记训练集 $\mathcal{D} = {(\boldsymbol{x}_n, \boldsymbol{y}_n), n = 1:N}$ 中学习得到某个函数 $f$,使其能够从未来的新输入 $\boldsymbol{x}$ 中预测输出 $\boldsymbol{y}$。 其中,$\boldsymbol{x}_n \in \mathcal{X} \subseteq \mathbb{R}^D$, $\boldsymbol{y}_n \in \mathcal{Y} \subseteq \mathbb{R}^C$ 。 我们可以使用形式为 $p(\boldsymbol{y}|f(\boldsymbol{x}))$ 的条件概率模型,对给定输入时正确输出的不确定性建模。 当 $\mathcal{Y}$ 是一组离散标签时,此类模型(在 ML...
2023-01-03
🔥 广义线性模型索引帖
待补充 #refplus, #refplus li{ padding:0; margin:0; list-style:none; }; document.querySelectorAll(".refplus-num").forEach((ref) => { let refid = ref.firstChild.href.replace(location.origin+location.pathname,''); let refel = document.querySelector(refid); let refnum = refel.dataset.num; let ref_content = refel.innerText.replace(`[${refnum}]`,''); tippy(ref, { content:...