自编码器

自编码器（英語：）也称自动编码器，是一种人工神经网络，用于学习无标签数据的有效编码；属一种无监督学习。

一个具有3个全连接隐藏层的自动编码器网络结构。

自编码（autoencoding）的目的是：学习对高维度数据做低维度“表示”（“表征”或“编码”）；因此，通常用于降维。最近，自编码的概念广泛地用于数据的生成模型。[1][2] 自2010年以来，一些先进的人工智能在深度学习网络中采用了采用堆叠式稀疏自编码。[3]

基本结构

自编码器有两个主要部分组成：编码器用于将输入编码，而解码器使用编码重构输入。

实现这个功能最简单的方式就是重复原始信号。然而，自编码器通常被迫近似地重构输入信号，重构结果仅仅包括原信号中最相关的部分。

自编码器的思想已经流行了几十年，其首次应用可以追溯到20世纪80年代。[4][5][6]自编码器最传统的应用是降维或特征学习，现在这个概念已经推广到用于学习数据的生成模型。.[1][2]21世纪10年代的一些最强大的人工智能在深度神经网络中采用了自编码器。[3]

最简单的自编码器形式是一个前馈的、非循环的神经网络，用一层或多层隐藏层链接输入和输出。输出层节点数和输入层一致。其目的是重构输入（最小化输入和输出之间的差异），而不是在给定输入的情况下预测目标值，所以自编码器属于无监督学习。

最简单的自编码器形式是一个前馈的、非循环的神经网络，类似于多层感知器（MLP）中的单层感知器，用一层或多层隐藏层链接输入和输出。输出层具有与输入层相同数量的节点（神经元）。输出层节点数和输入层一致。其目的是重构输入（最小化输入和输出之间的差异），而不是在给定输入 $X$ 的情况下预测目标值 $Y$ ，所以自编码器属于无监督学习。

自编码器由编码器和解码器组成，二者可以被分别定义为变换 $\phi$ 和 $\psi$ ，使得：

{\displaystyle \phi

{\displaystyle \psi

\phi ,\psi ={\underset {\phi ,\psi }{\operatorname {arg\,min} }}\,\|{\mathcal {X}}-(\psi \circ \phi ){\mathcal {X}}\|^{2}

在最简单的情况下，给定一个隐藏层，自编码器的编码阶段接受输入 $\mathbf {x} \in \mathbb {R} ^{d}={\mathcal {X}}$ 并将其映射到 $\mathbf {h} \in \mathbb {R} ^{p}={\mathcal {F}}$ ：

\mathbf {h} =\sigma (\mathbf {Wx} +\mathbf {b} )

像 $\mathbf {h}$ 通常表示编码、潜变量或潜在表示。 $\sigma$ 是一个逐元素的激活函数（例如sigmoid函数或线性整流函数）。 $\mathbf {W}$ 是权重矩阵， $\mathbf {b}$ 是偏置向量。权重和偏置通常随机初始化，并在训练期间通过反向传播迭代更新。自编码器的解码阶段映射 $\mathbf {h}$ 到重构 $\mathbf {x'}$ （与 $\mathbf {x}$ 形状一致）：

\mathbf {x'} =\sigma '(\mathbf {W'h} +\mathbf {b'} )

其中解码器部分的 $\mathbf {\sigma '} ,\mathbf {W'} ,\mathbf {b'}$ 可能与编码器部分的 $\mathbf {\sigma } ,\mathbf {W} ,\mathbf {b}$ 无关。

自编码器被训练来最小化重建误差（如平方误差），通常被称为 "损失"：

{\mathcal {L}}(\mathbf {x} ,\mathbf {x'} )=\|\mathbf {x} -\mathbf {x'} \|^{2}=\|\mathbf {x} -\sigma '(\mathbf {W'} (\sigma (\mathbf {Wx} +\mathbf {b} ))+\mathbf {b'} )\|^{2}

其中 $\mathbf {x}$ 通常在训练集上平均。

如前所述，和其它前馈神经网络一样，自编码器的训练是通过误差的反向传播进行的。

当特征空间 ${\mathcal {F}}$ 的维度比输入空间 ${\mathcal {X}}$ 低时，特征向量 $\phi (x)$ 可以看作时输入 $x$ 的压缩表示，这就是不完备自动编码（undercomplete autoencoders）的情况。如果隐藏层大于（过完备）或等于输入层的数量，或者隐藏单元的容量足够大，自编码器就可能学会恒等函数而变得无用。然而，实验结果表明过完备自编码器（overcomplete autoencoders）仍然可能学习到有用的特征。[7]在理想情况下，编码的维度和模型容量可以根据待建模数据分布的复杂性来设定，采用这种方式的一种途径是正则化自编码器。[4]

另見

表征学习

參考

Auto-Encoding Variational Bayes, Kingma, D.P. and Welling, M., ArXiv e-prints, 2013 arxiv.org/abs/1312.6114
Generating Faces with Torch, Boesen A., Larsen L. and Sonderby S.K., 2015 torch.ch/blog/2015/11/13/gan.html
Domingos, Pedro. . . Basic Books. 2015. "Deeper into the Brain" subsection. ISBN 978-046506192-1.
Bengio, Yoshua; Courville, Aaron. . . Cambridge, Massachusetts. 2016 [2022-06-06]. ISBN 0-262-03561-8. OCLC 955778308. （原始内容存档于2021-02-17）.
Schmidhuber, Jürgen. . Neural Networks. January 2015, 61: 85–117. PMID 25462637. S2CID 11715509. arXiv:1404.7828 . doi:10.1016/j.neunet.2014.09.003.
Hinton, G. E., & Zemel, R. S. (1994). Autoencoders, minimum description length and Helmholtz free energy. In Advances in neural information processing systems 6 (pp. 3-10).
Bengio, Y. (PDF). Foundations and Trends in Machine Learning. 2009, 2 (8): 1795–7 [2022-06-06]. CiteSeerX 10.1.1.701.9550 . PMID 23946944. doi:10.1561/2200000006. （原始内容 (PDF)存档于2015-12-23）.

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.

[VAE-1] Auto-Encoding Variational Bayes, Kingma, D.P. and Welling, M., ArXiv e-prints, 2013 arxiv.org/abs/1312.6114

[gan_faces-2] Generating Faces with Torch, Boesen A., Larsen L. and Sonderby S.K., 2015 torch.ch/blog/2015/11/13/gan.html

[domingos-3] Domingos, Pedro. . . Basic Books. 2015. "Deeper into the Brain" subsection. ISBN 978-046506192-1.

[:0-4] Bengio, Yoshua; Courville, Aaron. . . Cambridge, Massachusetts. 2016 [2022-06-06]. ISBN 0-262-03561-8. OCLC 955778308. （原始内容存档于2021-02-17）.

[5] Schmidhuber, Jürgen. . Neural Networks. January 2015, 61: 85–117. PMID 25462637. S2CID 11715509. arXiv:1404.7828 . doi:10.1016/j.neunet.2014.09.003.

[6] Hinton, G. E., & Zemel, R. S. (1994). Autoencoders, minimum description length and Helmholtz free energy. In Advances in neural information processing systems 6 (pp. 3-10).

[bengio-7] Bengio, Y. (PDF). Foundations and Trends in Machine Learning. 2009, 2 (8): 1795–7 [2022-06-06]. CiteSeerX 10.1.1.701.9550 . PMID 23946944. doi:10.1561/2200000006. （原始内容 (PDF)存档于2015-12-23）.

机器学习与

范式监督学习無監督學習線上機器學習元学习半监督学习自监督学习强化学习基于规则的机器学习量子機器學習
问题统计分类生成模型迴歸分析聚类分析降维密度估计异常检测数据清洗自动机器学习关联规则学习語意分析结构预测特征工程表征学习排序学习语法归纳本体学习多模态学习
监督学习 (分类 · 回归) 学徒学习决策树学习集成学习 Bagging 提升方法随机森林 k-NN 線性回歸朴素贝叶斯人工神经网络邏輯斯諦迴歸感知器相关向量机（RVM）支持向量机（SVM）迁移学习微调
聚类分析 BIRCH CURE算法层次 k-平均 Fuzzy 期望最大化（EM） DBSCAN OPTICS 均值飘移
降维因素分析 CCA ICA LDA NMF PCA PGD t-SNE SDL
结构预测圖模式貝氏網路條件隨機域隐马尔可夫模型
异常检测 RANSAC k-NN 局部异常因子孤立森林
人工神经网络自编码器認知計算深度学习 DeepDream 多层感知器 RNN LSTM GRU ESN 储备池计算受限玻尔兹曼机 GAN SOM CNN U-Net Transformer Vision transforme 脉冲神经网络 Memtransistor 电化学RAM（ECRAM）
强化学习 Q学习 SARSA 时序差分（TD）多智能体 Self-play RLHF
与人类学习主动学习众包 Human-in-the-loop
模型诊断学习曲线
数学基础内核机器偏差–方差困境计算学习理论经验风险最小化奥卡姆学习 PAC学习统计学习 VC理论
大会与出版物 NeurIPS ICML ICLR ML JMLR
相关条目人工智能术语机器学习研究数据集列表机器学习概要