趋势分析之自然语言处理

我们目前已发布了12期分析内容,具体如下:

自然语言处理(NaturalLanguage Processing)是一门融语言学、计算机科学、数学于一体的科学,是指用计算机对自然语言的形、音、义等信息进行处理,即对字、词、句、篇章的输入、输出、识别、分析、理解、生成等的操作和加工。实现人机间的信息交流,是人工智能界、计算机科学和语言学界所共同关注的重要问题。

自然语言处理的具体表现形式包括机器翻译、文本摘要、文本分类、文本校对、信息抽取、语音合成、语音识别等。可以说,自然语言处理就是要计算机理解自然语言,自然语言处理机制涉及两个流程,包括自然语言理解和自然语言生成。

下面我们将用Trend analysis分析自然语言处理领域的研究热点。

下图是当前该领域的热点技术趋势分析,通过Trend analysis分析挖掘可以发现当前该领域的热点研究话题Top10有:

  • natural language processing

  • artificial intelligence

  • information extraction

  • machine learning

  • machine translation

  • information retrieval

  • computational linguistics

  • knowledge base

  • computer science

  • text mining

趋势分析之自然语言处理
趋势分析之自然语言处理

根据Trendanalysis的分析我们可以发现,信息抽取、信息检索是自然语言处理领域比较热门的话题。其中,20世纪90年代起信息抽取的研究热度开始逐渐上升,在此后的十年期间一直处于稳定增长的状态,尽管近几年热度有所降低但综合来看,其话题热度仍然位于自然语言处理领域TOP3之列。

信息抽取主要是指从文本中抽取出特定的事实信息,这些被抽取出来的信息通常以结构化的形式直接存入数据库,可以供用户查询及进一步分析使用,为之后构建知识库、智能问答等提供数据支撑。

哥伦比亚大学计算机系教授MichaelCollins是自然语言处理领域的专家,担任谷歌NYC研究科学家,曾在MIT担任副教授。

趋势分析之自然语言处理
趋势分析之自然语言处理

MichaelCollins的研究兴趣是自然语言处理和机器翻译,曾经多次在国际顶级会议上发表文章,例如在EMNLP2010,CoNLL 2008,UAL2055等会议上都获得最佳论文奖,同时还是ACL的研究员,获NSF生涯奖。

他在统计句法分析(statisticalparsing)和统计机器学习方面做出了重要贡献,开发了著名的句法分析器CollinsParser。

随着自然语言处理研究的不断深入和发展,应用领域越来越广。文本方面的应用主要有基于自然语言理解的智能搜索引擎和智能检索、智能机器翻译等,语音方面的主要有机器同声传译、智能远程教学与答疑、语音控制等。