Quantcast
Channel: CodeSection,代码区,Linux操作系统:Ubuntu_Centos_Debian - CodeSec
Viewing all articles
Browse latest Browse all 11063

本周值得读(2016.11.21-2016.11.25)

$
0
0

【对话系统】本文对seq2seq方法在对话系统中的应用做了一个简短的对比和综述,主要是针对几位作者提出的三种深度学习模型:HRED、VHRED和MrRNN,实验数据用了Ubuntu Dialogue Corpus和Twitter Corpus。不管是用seq2seq生成也好,还是套用模板也罢,对话系统的难点仍是上下文的理解和如何输出一些高质量的对话,有些应用场景对response的要求没那么高,只要可以达到一定实际效果即可,而有的则需要生成更加接近人类的对话。本文适合研究深度seq2seq的童鞋以及想看看各种seq2seq效果如何的童鞋来读。本文总结的三个模型原文链接:

(a) MrRNN: https://arxiv.org/pdf/1606.00776.pdf

(b) VHRED: https://arxiv.org/pdf/1605.06069v3.pdf

(c) HRED: https://arxiv.org/pdf/1507.04808v3.pdf

Coherent Dialogue with Attention-based Language Models

【对话系统】考虑并理解上下文是Chatbot的一大难点,也是目前绝大多数chatbot不智能的主要原因之一。本文提出了一种动态的attention模型,在理解用户请求的时候,动态地考虑历史信息。本文用到了两个开放数据集,分别是MovieTriples和Ubuntu Troubleshoot dataset。建议对chatbot感兴趣的同学可以精读此文。

Visualizing and Understanding Curriculum Learning for Long Short-Term Memory Networks

【课程学习】Curriculum Learning是一类模拟小孩子学习过程的学习算法,简单地说是指在训练模型是从简单的样本开始,逐渐增加学习样本的难度。本文以情感分析为研究对象,对Curriculum Learning如何提升LSTM模型在情感分析任务上的效果进行了实验研究,并给出了可视化的结果。本文适合研究Curriculum Learning的童鞋以及在训练模型中想尝试下Curriculum Learning思路的童鞋研读。

Variable Computation in Recurrent Neural Networks

【RNN研究】RNN在解决序列建模问题有着天然的优势,但有些序列数据存在周期性的变化,或者短时间内变化并不明显,比如视频数据,因此固定不变的RNN训练方案会浪费计算资源,本文针对这一问题,提出了一种RNN变计算训练方案,即在计算下一个time step的hidden state时,不需要上一个time step所有的维度,只取一部分来计算,其他的维度复制过来即可。这篇工作的相关的前人研究包括:2014年的A Clockwork RNN,链接如下: https://arxiv.org/pdf/1402.3511.pdf

Learning to Distill: The Essence Vector Modeling Framework

【表示学习】本文研究的内容包括两个点,一个是无监督学习,一个是文档表示。词表示、句子表示都有比较多的解决方案,但实际应用中文档级别的表示非常重要,比如情感分析、文本摘要等任务。本文提出了一种无监督的方法对文档以及背后所蕴藏的背景知识进行低维表示。自然语言随着元素级别地提升(从字、词、短语、句子到文档),研究的难度随之增加,实用程度随之减少。建议想从无监督学习方法有所突破以及想试试文档表示的童鞋可以来读本文。

Unsupervised Learning of Sentence Representations using Convolutional Neural Networks

【句子表示】本文的贡献在于提出了一种新的CNN-LSTM auto-encoder,作为一种无监督的句子学习模型。

Emergent Logical Structure in Vector Representations of Neural Readers

【问答系统】针对最近提出的各种各样的attention based reader models,本文作者做了一个比较全面的总结和分析,并且通过数学分析和实验展示了模型之间的相关性。PaperWeekly第十四期的文章有相关的paper note可以参考地址

公益广告

美国国立卫生研究院招博士后,研究领域包括:NLP、text mining和machine learning,感兴趣的童鞋可以看过来,详情请戳 这里


Viewing all articles
Browse latest Browse all 11063

Trending Articles