之所以重视程度提高一个层级跟林灰搞出的动静有着不可分割的联系。
在林灰的研究成果出现之后。
目前国内外常用的自动文本摘要技术根据摘要产生的不同方法可以分为两种:
抽取式文本摘要和生成式文本摘要。
抽取式文本摘要的方法实现简单,只是从文档中抽取已有的句子形成摘要。
生成式文本摘要则是要利用自然语言理解技术来执行文本的语法和语义分析和融合信息并在此基础上生成新的摘要句子。
由于林灰刚搞出生成式摘要算法没多久。
所以现在生成式摘要算法除了在南风app上应用了之外其应用范围还不算太广泛。
反倒是抽取式方法由于一些历史方面的沿革而在应用方面较为广泛。
但这并不能据此否定生成式文本摘要的价值。
学术层次从来都不是多数压倒少数的。
真理往往掌握在少数人手中。
抽取式文本摘要归根结底只能看作一个组合优化问题。
这在生成式文本摘要面前终究是落了下乘。
尽管处理同一个问题文本摘要的两种方法强行分为上下乘似乎有些不妥。
可人类在文本摘要的目的是什么呢?
甚至于人类在自然语言处理这方面的研究的目的是什么呢?
终归不过是为了更好的理解自然语言进而能够更加高效地处理自然语言。
以这个角度来衡量的话,生成式摘要算法在理解自然语言方面的能力无疑要比抽取式摘要算法高到不知道哪去了。
因此称生成式文本摘要算法为上乘而抽取式文本摘要算法为下乘也不偏颇。
想来这些海外的研究团队应该也是看到了林灰搞出来的生成式摘要算法在让机器对自然语言的理解能力更上一层楼之后。
才会对生成摘要这方面研究的重视程度进一步提升。
不得不说,方向对了。
事实上前世由于人工智能领域崛起基于人工智能的生成式文本摘要得到质的飞跃之后生成式文本摘要更是一举成为生成摘要的主要研究方向。
不过仅仅是一些科研机构在文本摘要算法方面加大投入还不足以让林灰这么重视。
林灰已经在生成式摘要算法这方面构筑了相当完备的技术壁垒。
想要弯道超车是不可能的,这些科研团队所能采取的方式无非是继续按照林灰先前公布的技术路线造轮子。
认识十年的老书友给我推荐的追书app,!真特么好用,开车、睡前都靠这个朗读听书打发时间,这里可以下载】
林灰比较警惕地是:
因为这些科研机构将关注的重心放在文本摘要这个细分领域之后。
海外很多原本一直处在冷宫的自然语言处理方面的部分细分领域的研究最近也被重拾起来。
甚至于连带着机器学习其余领域的一些原本冷门的研究方向也有回暖的迹象。
这对林灰可不是一个好消息。
这很可能打断林灰此前的一些部署。
纵然林灰在除却文本摘要之外的其余领域也有着技术方面的优势。
七年甚至七年以上的信息优势想要一朝逾越是不可能的。
但现在这种情况也意味着林灰想要藉此一劳永逸也是不现实的。
对手虽然进步的很慢,但也是一直在进步的。
林灰如果固步自封的话,迟早会被超越的。
龟兔赛跑的故事家喻户晓,这里面的道理自然不需多言。
盲目的自负和藐视对手是要付出惨痛的代价的。