“好小子,人工智能让不让普通人失业不好说,这样下去,AI研究人员差不多都快失业了。”
李彦弘的观察没错,孟繁岐此次野心甚大。
其实在做残差网络的时候,孟繁岐就可以这样做的。
他完全可以利用残差网络的先进性,直接刷爆各种图像类的下游任务,从分类、分割、检测再到超分之类的,榜单统统洗它们一遍。
不过那个时候,设备和人手不够,图像领域的总体来说已经被深度网络统治,孟繁岐便没有这么做,只是发表了三大主流任务的奠基做法,给大家留了很多饭吃。
但目前的语言语音领域,还处于比较鱼龙混杂的阶段,各路方法争奇斗艳。
加上既然已经加入谷歌,这么好的资源怎么可以不加以利用呢?
若有着这么好的条件,仍旧是只在一个方向上发布T方法,未免显得太过稀松平常了一些,哪里对得起正在观看直播的上亿人?
孟繁岐势要把这几个主流的任务方向都给奠定一个算法的基调,这才肯罢休。
“接下来,情感分析,是文本处理领域的一项重要任务,它可以帮助人类分析一个句子或段落中的情绪和情感。T方法可以很好地应用于情感分析任务中,因为它能够通过在文本中学习有关情感的模式和特征来对未见过的文本内容进行情绪上的分类。”
又是一串图表,来对比当今世界上最佳的办法,T方法再次遥遥领先。
此时观看直播的研究人员基本上已经麻木了。
尤其是原本在做自然语言和语音方向的。
孟繁岐这么一发布,不知道多少人做到一半的东西就可以直接丢进垃圾桶了。
性能指标差了一大截,方法的创意性上也远远不如。
“文本摘要!T方法同样可以用于文本摘要任务,其中模型的输入是一篇文本,输出则是该文本的主要内容主旨。这对于需要快速了解文章内容的人来说非常用,例如新闻编辑人员或者其他读者。不过目前对文本的长度还有所限制。”
几千上万字的文章,一两分钟为你总结,这是T方法得天独厚的能力。传统网络完全无法跨如此长的距离对整体的内容进行分析和理解。
“文本分类!文本分类是将给定文本归类到不同的类别或标签中的过程,例如文本内容是否涉及体育、娱乐、科技等特定领域,是否包含某些关键的内容。这对T方法来说,更是不在话下,它可以轻松捕获文本中的关键词,将对于的文本归于相关的类别当中。”这种方法对爬虫和数据收集非常友好,可以用以将大量的杂乱文本分门别类。
“命名实体识别!在长文本当中,识别出分别代表人名、地名、组织名称、时间、日期等实体信息,抓取这些特定的属性也是一种常见的需求。”
孟繁岐每提及一项任务,背后都会有对应的对比图表出现,数据和实验结果详实,令人惊叹。
这些都是谷歌在类似任务上的大量积累导致的,在这些方向上经年累月的投入,环境和流程非常成熟,使得孟繁岐在T方法构建出来之后,可以迅速地加入这些流程当中去迭代实验。
辅以各路同事的帮助,加上上千张最新款的泰坦Z,实验速度大大加快。