GAN Lecture 9 (2018): Sequence Generation
问题
回顾
Improving Supervised Seq-to-seq Model
方法1 RL
回顾 policy gradient
直觉解释
实际应用
对比
Alpha Go style training
方法2 GAN
Algorithm
sequence model
文字生成 是一串 token ,没法微分,
怎么求解这个问题
方法1 Gumbel-softmax
一个trick 使得不能微分能够微分
方法2
存在问题
方法3 RL
存在问题
采样不够多
Solution
方法3
More Application
Unsupervised Conditional Sequence Generation
1 Text Style Transfer
做法1 Direct Transformation
把word换成对应的embeding
做法2 Projection to Common Space
2 Unsupervised Abstractive Summarization
hh
回顾
把文章和摘要当作不同的domain
做法—类似cycle GAN
另一个角度理解
Unsupervised Machine Translation
Unsupervised Speech Recognition
文档信息
- 本文作者:zuti666
- 本文链接:https://zuti666.github.io/2022/07/11/GANLecture9-Squence-Generation/
- 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证)