数据降维与可视化2 - t-SNE

2024/11/10 math MachineLearning Visualization 共 289 字,约 1 分钟

数据降维与可视化2 - t-SNE

参考链接

潜在空间可视化:PCA、t-SNE、UMAP_哔哩哔哩_bilibili

t-SNE:最好的降维方法之一 - 知乎

核心思想 就是从高维度降到低维度,能够保持 距离近的点更近,而距离远的点更远,

即高维空间数据的距离关系与低维空间的距离关系具有相似性

首先从概率论角度,将数据之间的距离转换为 属于数据中心点的邻居的概率,

然后使用 KL散度来刻画 两种不同表达之间的关系,

最后使用梯度下降来最小化KL散度,使得前后变化能够保持最大的 相似性

首先将距离转化为概率表示

image-20241112001007667

高维度 和低维度进行相同的变换

image-20241112000707928

然后使用KL散度来衡量 两种表示之间的关系 image-20241112001141922

最后使用梯度下降来最小化KL散度

image-20241112001226067

文档信息

Search

    Table of Contents