Ganlecture9 squence generation

2022/07/11 GAN 共 523 字，约 2 分钟

GAN Lecture 9 (2018): Sequence Generation

问题

回顾

Improving Supervised Seq-to-seq Model

方法1 RL

回顾 policy gradient

直觉解释

实际应用

对比

Alpha Go style training

方法2 GAN

Algorithm

sequence model

文字生成是一串 token ,没法微分，

怎么求解这个问题

方法1 Gumbel-softmax

一个trick 使得不能微分能够微分

方法2

存在问题

方法3 RL

存在问题

采样不够多

Solution

方法3

More Application

Unsupervised Conditional Sequence Generation

1 Text Style Transfer

做法1 Direct Transformation

把word换成对应的embeding

做法2 Projection to Common Space

2 Unsupervised Abstractive Summarization

hh

回顾

把文章和摘要当作不同的domain

做法—类似cycle GAN

另一个角度理解

Unsupervised Machine Translation

Unsupervised Speech Recognition

文档信息

本文作者：zuti666
本文链接：https://zuti666.github.io/2022/07/11/GANLecture9-Squence-Generation/
版权声明：自由转载-非商用-非衍生-保持署名（创意共享3.0许可证）

Search

Table of Contents