检测任务需要用选框非常准确地框出目标物体在图片的何处,而分割更为精确,连精细的轮廓也要标注清楚。
出于计算量的考虑,骨干网络在处理图片的时候,通常并不会一直在极高的分辨率下进行。
一般来说,是分四个阶段,每过一个阶段,分辨率就会再小四倍(长宽都变成原本的一半)。
分辨率为256 x 256的图片输入之后,在不同阶段的特征图分辨率很可能会是[64, 32, 16, 8]。
这样成倍减少的特征图叠在一起,形成一个锥型,被称为特征金字塔。
分辨率变小的一大问题就是会丧失非常准确的位置信息,分辨率越小的特征图抽象程度越高,也就越难去表达原本图像中物体的位置。
由于这些不同尺寸的特征通常对融合后的输出特征作出了不平等的贡献,为了解决这一问题,孟繁岐计划实现一个简单而高效的加权双向特征金字塔网络(BiFPN)。
它引入可学习的权重来学习不同输入特征的重要性,同时反复应用自顶向下和自底向上的多尺度特征进行融合。
如此以来,就不需要大量增加图像的原始分辨率和算法模型的规模和参数量,用较少的额外计算量争取到了更加多的性能。
这章没有结束,请点击下一页继续阅读!
此外,孟繁岐还对一些其他的方面进行了一系列测试调整。
争取到了一个六七人的小队协助,大约两周多不到三周的时间,孟繁岐就已经整理好了这些以分类,检测和分割为主题的综合应用手段。
并写成了一篇更像是实验报告的论文,《医疗图像算法实用技巧:以分类、检测与分割任务为例》
这篇论文是孟繁岐有史以来写得最长也最短的一篇论文。
最长是指论文的页数,多达四五十页,远超之前每篇十多页出头的惯例。
最短则是指其中略显多余的套话废话部分很少,几乎是没有。
孟繁岐直接尽可能将这些东西进行了精简,取而代之的是更多的实验测试结果和表格。
这篇论文在公共平台的公布,正式地引发了媒体对两边进度的高度关注。
虽然大家都知道孟繁岐的厉害,也见识了好几次他产出技术的速度,但谁也没有想到这一次竟然是一个三合一的合订本。
重剑无锋,大巧不工,没有特别多完全创新的新东西,反而是将之前已经公布的三个技术在相应的医疗图像领域内仔细打磨了一番。
就像乔峰一套太祖长拳锤爆各路高手一样,让众人均大彻大悟,原来这几种技术还可以这么用??
孟繁岐论文的结果,别说是对比原本的传统方法了,就是相比那些拿来主义,使用了孟繁岐技术的人,都有着相当可观的进步和提升空间。
这就有些惊人了。
你有能力,做出新的算法比我强,我能理解,我也认了。
这怎么大家都用一个算法也能差这么多呢?人与人之间的差距也太大了吧??
斯坦福会谈之后,霍尔姆斯没有什么能做的,只能尽量加强宣传工作,一副自己已经胜券在握的样子。
短短两周,就已经登上了财富和福布斯两家的封面。
“孟先生,我们知晓,您整合了自己此前的图像智能工作,并在极短的时间内针对医疗领域做了很强的优化,这实在太令人惊叹了。”孟繁岐对面,一位来自华尔街日报的记者开局先客套夸赞了两句。
上次在生成式智能事件当中,华尔街日报的报道最为中肯,因而孟繁岐对其印象很好,此次接受了华尔街日报的专访。
“三个月的时间,已经过了四分之一,不知道孟先生后续还有没有其他的计划?对最后取胜又有没有信心呢?”
“我回来之后查询了一下,霍尔姆斯的公司已经成立十年了,却一直没有检测过多少病例。如果她没有什么重大举措的话,我想胜负已经非常明显了。”
“除非是她要跟我比杂志封面,要论上杂志封面那我确实彻底输了。”