当前位置: 首页 - 智能化学会动态 - 汽车行业的未解之谜5大开放问题引发紧张关怀

汽车行业的未解之谜5大开放问题引发紧张关怀

2025-01-08 智能化学会动态 0

雷锋网 AI 科技评论按:如题,虽然 NLP 研究领域已经在深度学习的帮助下取得了长足的发展,许多技术也已经商业化落地,但我们也需要知道,这个领域还有几个开放性问题等待解决 —— 如果它们也能比较好地解决,也许我们能迎来 NLP 科研成果与商业落地的一个新的突破。

下面列举了 5 个开放性问题,从轻到重排序:

评价指标这个问题在领域内不算很大的瓶颈,但是经常有研究人员觉得有必要重新讨论这个问题,因为现行惯例里往往不问原因就沿用某些固定的架构、数据集和评价指标。有人这样总结:「随着我们探索越来越高级的认知任务,弄明白为什么某些方法、某些架构在某些时候能起到好的效果,这对我们非常有帮助。」

另外一种担忧是对于评价指标自身的,这些评价技巧、这些生成的数字到底能在多大程度上对应人类语言的多样性和表达能力?对这个问题的回答也可以帮助我们构建出更有趣的自然语言推理数据集。

拓展阅读:EMNLP 2017 论文《Why We Need New Evaluation Metrics for NLG》(https://www.aclweb.org/anthology/D17-1238)

终生学习(Life long learning)NLP 领域遇到的另一个棘手问题是为这几个问题设计解决方案:

低阶模型用于下游任务时的终生适配

迁移学习应用

视觉、文本、音频等等语言相关模态无缝整合

低资源情境中高效跨任务迁移

拓展阅读:Sebastian Ruder 近期写了一篇文章,总结了NLP 领域迁移学习现状,雷锋网 AI 科技评论也做了编辑,可以点击阅读

面向目标的对话系统(Goal oriented dialogue systems)从 ACL 学会出版的一篇论文集中看,近一两年的 ACL 会议、中 EMNLP 会议中研究面向目标对话系统论文都有大幅增加。这就是又一个开放性问题:如何设计具备常识,可在真实世界语境中与人类进行较长且面向目标交谈机器对话系统。目前思路包括带状态追踪任务驱动式系统,以及使用强化学习调优。

拓展阅读:应用强化学习于 NLP 中https://www.csie.ntu.edu.tw/~yvchen/doc/KAIST19_Tutorial.pdf

低资源语言这可以算是最紧迫的问题。目前全世界约7000种语言,但只有20余种可称为“富”的。在其中找到灵感并取得进步相对于其他方向可能更加容易。专家们认为可行路径包括:

为低资源语言收集数据及训练小规模模型方法

有效跨任务迁移方法以支持这些小型特征丰富环境中的工作流程提升

拓展阅读详细说明文章参见 http://www.cs.cmu.edu/~ytsvetko/jsalt-part1.pdf

自然语言理解没错,这就是那个最开放的问题,它与 NLP 领域中的许多具体挑战息息相关。想要解决这个高层次认知难题,我们或许需要借鉴来自强化学习、大样本适应、小样本/零样本学习等领域思想,并期待更多创新出现。

当前研究重点涵盖共指消歧(Coreference resolution)、多义词解析(Polysemy)、文本/文档总结(Text/Document Summarization),以及论证与推理讽刺幽默表述,以及环境中的更精确、高效表示方式的大量文本内容处理。

Yoshua Bengio 曾言「要敢想,不仅仅只读 NLP 论文,要广泛涉猎机器学习深度学习甚至强化学科,以此开阔眼界,为未来巨大的挑战做好准备。」希望各位研究者们能够打开心扉,将前人的经验融入自己的探索之旅,使得我们的每一步努力都朝着更伟大的目的而前进去。

via deeps.site/blog/2019/09/09/nlp-problems/, 雷锋网 AI 科技评论编译

标签: 智能化学会动态