GAN Lecture 9 (2018): Sequence Generation
问题

回顾

Improving Supervised Seq-to-seq Model
方法1 RL



回顾 policy gradient


直觉解释

实际应用

对比

Alpha Go style training

方法2 GAN

Algorithm

sequence model

文字生成 是一串 token ,没法微分,
怎么求解这个问题

方法1 Gumbel-softmax
一个trick 使得不能微分能够微分
方法2

存在问题

方法3 RL


存在问题

采样不够多
Solution

方法3


More Application

Unsupervised Conditional Sequence Generation

1 Text Style Transfer

做法1 Direct Transformation

把word换成对应的embeding
做法2 Projection to Common Space

2 Unsupervised Abstractive Summarization
hh
回顾
把文章和摘要当作不同的domain

做法—类似cycle GAN

另一个角度理解


Unsupervised Machine Translation

Unsupervised Speech Recognition

文档信息
- 本文作者:zuti666
- 本文链接:https://zuti666.github.io/2022/07/11/GANLecture9-Squence-Generation/
- 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证)