科创

AI发展会被“卡脖子”?华先胜:中国应用创新前列,基础模型偏弱

来源 | 搜狐科技

5月17日,2021搜狐科技5G&AI峰会在北京隆重召开。阿里巴巴集团副总裁、达摩院城市大脑实验室主任华先胜作为嘉宾,发表了题为《人工智能技术规模化应用的探索与实践》的主题演讲。在他看来,AI平台化是AI未来发展趋势,未来将“无行业,不AI”。

演讲后,他接受了搜狐科技的专访,针对国内人工智能的优势和薄弱点、技术在真实世界的通用性、智慧城市的切入点和难点以及图片搜索于电商的意义等多个问题进行了一一解答。

在他看来,中国在人工智能领域的发展既存在优势,也有薄弱点。“在中国,尤其是在应用技术创新应用方面,做得既深入又广泛。这跟社会对新技术的接纳态度很有关系,不论是政府还是大众,都很愿意尝试用新的技术解决行业的问题和推动行业的变革。另外,中国的人才也比较丰富,各个层级的人才都有,各个方面的人才都有,这也是非常好的优势。”

不过,华先胜表示,国内在通用的原创技术上可能会稍弱一些,“比如说一些基础模型,大模型的能力,但也有不少人在为此努力。”

衡量人工智能价值,可以从其“通用性”来判断。这里的通用性并非是指AI跨行业的通用性,而是指AI从实验室环境迁移到现实世界的能力。“通用性是我们做技术研发时一开始就会考虑的问题。”

华先胜解释称,在人工智能落地的过程中,每个阶段都有不同的关注重点。首先是算法的准确率,然后逐渐过渡到计算效率和普适性提升。“我们会在真实的大数据场景下不断地对算法进行打磨和迭代,但如果只是做基础科研的话,就不见得会关心这个问题。因为把技术迁移到真实环境下,难度会变得更深,更复杂,更有挑战。”

华先胜所专注的智慧城市领域,就是人工智能最重要的落地场景之一,也是一个众多公司都在参与竞争的火热赛道。“同行们有从端(传感器)切入的;也有从应用层切入的,如结合各部办局等的需求做AI平台,当然,也有从技术研发平台角度切入的。”

尽管业内做法不一,但华先胜表示,凭一家之力,很难从底层到应用层全部做到尽善尽美。更好的方式是,每一部分都有更专长的人做。“这也同时会带来一个问题,就是行业内需要一份标准和规范,能够让不同的团队、不同的公司、不同的服务的提供方形成合力。不至于在每个城市里,一部分是这家公司做的,另外一个部分那家公司做的,最后各自为政。”

除了上述谈到的国内人工智能的优势和薄弱点、技术通用性等问题外,普通大众可能对“买买买”更为熟悉。值得一提的是,“搜同款神器”——手机淘宝中 “拍立淘”,其背后的技术就是由华先胜首创和实现的。

当谈及图片搜索对于电商生态的意义时,华先胜表示:“通过图片来搜索是电商搜索绝佳的应有场景,这是一个刚性的需求,解决的是文本搜索和浏览无法解决的问题。”这也是图片搜索永远在电商搜索中占据一席之地的原因。

嘉宾简介:

华先胜,现任阿里巴巴集团副总裁、高级研究员、达摩院城市大脑实验室主任。

华先胜是国际电气与电子工程师协会会士(IEEE Fellow),美国计算机协会杰出科学家(ACM Distinguished Scientist);2008年获MIT技术评论“全球35个35岁以下杰出青年创新者”称号(TR35)。

华先胜1996年和2001年毕业于北京大学数学学院,分别获学士和博士学位;之后分别工作于微软亚洲研究院,微软美国必应搜索引擎,以及微软美国研究院,从事多媒体、计算机视觉和机器学习方面的研发工作。2015年4月加入阿里巴巴,任搜索事业部资深总监/研究员;2016年加入阿里云iDST,负责云上视觉智能计算的技术研发。他的研发兴趣在大规模视觉人工智能领域,包括视觉分析、识别、搜索和挖掘等。华先胜在国际主流会议和期刊上发表论文200余篇,拥有专利90余项。曾担任多个学术期刊的副主编以及ACM Multimedia等顶级学术会议的程序委员会主席,并获得多个国际会议及期刊的最佳论文奖。华先胜曾担任ACM Multimedia 2020年大会主席。

以下为专访实录精编:

搜狐科技:感谢阿里集团副总裁、达摩院城市大脑实验室主任华先胜参加搜狐科技的专访。华老师您好,首先请您跟大家介绍一下达摩院和您的研究方向?

华先胜:达摩院是阿里巴巴的基础科研和基础创新研发的核心机构。目前实验室有5个方向,包括机器智能、数据计算、机器人、金融科技和X实验室。

我自己所在的实验室是人工智能方向,是人工智能从基础的技术研发,到形成产品,再到到产品落地应用场景的一条龙的团队建制。

搜狐科技:就像您介绍的,达摩院是研究技术科学的颠覆性技术研究的机构,实验室的环境和真实世界还是有一定的不同的,想问问您,为了让技术在现实世界中取得更好的效果,目前是否有哪些难点和技术解决方案呢?

华先胜:通用性是我们做技术研发一开始就会考虑的问题,这个通用性不是指行业通用性,而是指在真实世界的复杂场景下有没有通用性,除了通用性之外,计算的效益有多高,也是我们会考虑的问题。

当然最初的时候,算法的准确率上是技术研究人员们更关注的方向,但是我们逐步会把它的效率和普适性提升放在更重要的位置。其实,一开始我们就关注这个最终的目标。

我们会在真实的大数据场景下做不断的打磨和迭代,如果是做基础科研的话不见得会关心这个问题。

在应用场景下能够取得突破,其实相对于在封闭基础上做科研,是一件更难的事情。难度上也会变得更深,变得更复杂,更有挑战,我们花费了很大的精力,让技术在规模上、在真实场景中应用中去实验,在实践中检验,在实践中去磨炼。

搜狐科技:您目前的研究方向是城市大脑,智慧城市领域越来越多受到业内的关注,很多的同行们都在跟进这个方向,在您的观察里面,大家的切入点都有哪些不同?

华先胜:切入点都没有什么太大问题,可以从传感器端上切入,AI放在端上做也是可以的;可以从应用层切入,能够基于其他的团队提供的AI平台,去做行业跟智慧城市结合的各个领域,比如说各部办局、交通等等具体部门的业务所需要的能力;当然,从技术研发平台这个角度切入也是可以的。

实际上也是智慧城市也是需要大家一起来繁荣的。很难说谁的切入点一定是对,一定是错。

一般来说,一家公司很难从底层到上面最后的应用层全部都做了。更多的是每一部分都有更专长的人做,专业的人做专业的事情,这个才是最好的。

当然这里面也带来一个问题,就是怎样能够形成一个规范,能够不同的团队、不同的公司、不同的服务的提供方能够形成合力,这个标准和规范是急需解决的一个问题,这样才能真正形成合力,不至于说每个城市里面,这个是他做的,这个地方另外一家做的,最后各自为政,这就不太好了。

搜狐科技:那现在的情况是否就像您刚刚提到的呢?

华先胜:应该会慢慢变化,我们也在推动规范和标准的建立。

搜狐科技:您先后有国外和国内两段研究的经历,想问您一下,国内相对于国外来说,在人工智能上的优势和发力点有什么不一样吗?

华先胜:在中国,尤其应用技术创新应用方面,做得既深入又广泛,这跟社会对新技术的接纳态度很有关系。不论是政府还是大众,都很愿意尝试用新的技术解决行业的问题和推动行业的变革,中国是一个非常好的环境。另外,中国的人才也比较丰富,各个层级的人才都有,各个方面的人才都有。所以,在解决行业的问题上的这些创新,中国是非常占有优势的,也是在世界走在前沿的。

至于也有人认为,中国原创的技术要稍弱一点,其实中国也有不少原创的东西,但相对来说,通用的原创技术可能会稍微少一点,比如说一些基础模型,大模型的能力,可能会稍微比应用技术的研发相比稍微弱一点,现在也看到很多人做这方面的事情。

搜狐科技:您介绍了很多技术相关的内容,但普通大众对“买买买”更感兴趣,手机淘宝里面的“拍立淘”背后的技术就是由您开创的,请您简单介绍一下,图片搜索对于电商生态有什么重要性?

华先胜:图像搜索并不是阿里巴巴原创,上世纪90年代就有很多人做这方面的研究,那时候叫做图像检索,有很多人因为这向技术而获得了博士学位的。

但是那个时候的技术跟今天还是有很大差别的,深度学习技术和索引技术起来了以后,才使得这项技术真正应用起来。

之前很多人,包括我在阿里巴巴,也做这样的工作,是通用的场景,但通用的场景目前来看不是一个特别刚性的需求。

但是电商的场景不一样,通过图片来搜索是电商搜索绝佳的应用场景,也是刚性的需求,解决的是文本的搜索和浏览无法解决的问题。因为很多场景只有通过这种方式才能搜索:你看中了这个商品,但是你没办法准确知道商品名字,这时候你只能通过照片来进行搜索。

当然,搜索照片还可以带来很多其他的搜索同款、相似款,比如神似,两者很像,但其实并不是一个商品,这些通过文字都无法实现。

图片搜索目前在电商搜索中里面占了一定的量,主流还是在文字和浏览,但是它切实解决了一个过去解决不了的问题,所以用户量也不少。