科技网

当前位置: 首页 >通讯

顺为资本孟醒不要跟巨头比牙齿AI创业我看

通讯
来源: 作者: 2019-04-05 21:52:32

孟醒:顺为基金副总裁和入驻企业家,曾作为开创人和CEO创办两家人工智能领域的明星创业公司,并在美国最大博彩文娱公司CAESARS ENTERTAINMENT任职互动文娱业务亚太区负责人。

顺为资本:由雷军(微博)及许达来先生联合创建,管理3支合计17.5亿美元的美元基金和一支10亿元人民币的人民币基金。重点关注互联、移动互联、高科技行业和互联与传统行业结合所带来的变革。

1

主持人:请先作自我介绍,并分享您的创业经历。

孟醒:我叫孟醒,目前在顺为资本负责泛人工智能和大数据上下游相干的投资。在这之前我做过两家人工智能的创业公司,一家在硅谷,一家在国内。在美国的这家公司是我在2012年还在读MBA期间做的,叫Orbeus,后来被亚马逊收购,目前接收了亚马逊AWS里绝大多数跟视觉图象相干的服务。

第二家创业公司在北京,名字叫知图科技,是用图象辨认和深度学习技术在广告行业进行深挖的一家技术公司。主要是做将图象相干的技术应用到媒体上,来挖掘图象信息的广告位。这家公司在去年的时候卖给了一家在美国上市的中国互联公司公司。

在创业之前,我曾在香港的摩根大通投行部负责TMT行业。当时,这个行业里还没有像今天这么多的并购和投资案,绝大多数都是中国公司到美国上市做IPO。我做了很多这方面的案子,也有幸参与了几家中国公司到NYSE敲钟的情形。

另外一段经历是我在美国最大博彩文娱公司CAESARSENTERTAINMENT任职互动文娱业务亚太区负责人。这部份包括游戏方面的投资,游戏方面的合作开发和世界上最大的德州扑克的竞赛品牌WSOP在亚洲落地的运营,这两块业务跟创业没有直接关系,但从资本的角度和管理的角度给了我很多启发。

目前在顺为资本,我的角色跟投资团队没有任何区别。2016年主要以投资为主,2017年我希望能够多花一些精力到我们顺为资本的被投项目中。毕竟作为一个创业者,我经历过被投公司所面临的所有问题,有一些经验可以和大家分享。同时,也有一些困惑可以和大家一起探讨,基于这样的思路,我在揣摩怎么样能够组织一些更有意义的投后,或帮助被投企业运作的一些活动。

2

主持人:第二个问题,您是如何理解人工智能行业的?

孟醒:人工智能是一个包罗万象的行业,我从人工智能创业或投资两个角度来进行分享。

最近一年以来,资本市场转冷的现象比较明显,唯一没有受到影响的是人工智能以及其延伸领域。但这个领域的投资方向每一个公司很不一样。我经历了大概4类公司的阶段,但这四个并不是严格前后次序,会有同时存在关系或前后关系。

第一类是做感知层算法的公司,目前大家耳熟能详的或估值较高的创业公司,绝大多数在做感知层的算法。2012年出来1波比较优秀的公司,固然2012年也是一个在人工智能算法领域标志性的时间点(Alexnet在Imagenet上的突出成功使得Deep Learning成为主流)。感知层就是让机器具有人的五官的基础感知能力,从视觉到听觉的理解能力,这部分公司可以理解为做人工智能的基础设施工作。

第二类是算法向芯片层面延伸的创业公司。国内从2014年开始广泛普及这类公司,绝大多数是在算法优化的过程中又深入了一步,覆盖到上游芯片层面,不管从用模组设计,到用FPGA搭建自己的SoC,硬件层面矩阵运算的优化,乃至是指令集层面的优化,这些都有触及。他们觉得仅仅在算法层面的优化不能弥补使用通用芯片所带来的效率的损失。

第三类是通过人工智能改良垂直行业效率的2B公司。这类大批公司是从2015年以后诞生的,这时候人工智能的基础设施已经有一定的范围。这些范围可能由创业公司来提供,也可能来自学术领域的突破,也可能是由大公司的基础设施来提供,到一定范围以后会在垂直应用领域找到结合点,比如在医疗、农业、金融这些领域,研究这些方向上用人工智能算法怎样能够提高效率,尤其是2B的效力。

最后一类公司是做2C的人机交互方向的。这类公司是在2014年以后出来的,比如人机交互的智能机器人,聊天机器人等这些方式。

很多时候,大家认为人工智能解决的是算法的问题,其实本质上人工智解决的是经济问题。经济问题可以理解为从整个算法端和数据端开始,数据的搜集,涉及到人工怎样去做标定,用什么方式找到数据,或怎么用优秀产品来搜集数据,人工的激励机制是怎么样的,怎样使数据获得成本最低。到算法端,需要选择性价比最高的算法,怎样利用有限的计算能力和传输能力,所有这些问题其实都指向了我们能不能把经济本钱优化,把人工智能做好的核心是把经济问题解决好。

在人工智能上的努力都是为了分别对应2B(优化效力)和2C(优化体验)这两个方向,能够在效力上改良经济本钱。

所以,做人工智能方向的核心并不是要做出一个东西来逼近人的智能。

如果我们目的仅仅是要创造逼近人智能的产品,其实上帝已经给予我们这样的能力了。我们其实是可以造人的,本钱其实也不算很高。人是多么复杂的精密仪器,每寸皮肤上都有压力传感器、温度传感器、湿度传感器,都有神经。我们具有视觉,可以自由做3DSLAM,物体检测,人脸辨认,行动辨认。我们有听觉,有语音辨认,有自动降噪,有远场语音增强,有自然语意理解。所有我们为人工智能所做的努力,都在人身上具有了。其实可以完全用生物的方式而不用信息电子的方式而把它实现。

反过来说,造人本身是有本钱的,因为人本身不能大规模复制。同时还有伦理的本钱,使我们不能把这类生物科学的方式作为我们去改良效力的最好方式,所以我们才有了用科研的方式或在信息电子层面去研究人工智能。

可以总结一下,我对人工智能的看法,其实是我们要去通过解决一件件改良经济本钱的小事,使得在提供效力和提供体验上把经济本钱赚回来,这是我们核心要做人工智能的目标。

主持人:第三个问题,从投资人和创业者角度,如何去判断一个公司的亮点会有哪些不同?

孟醒:我作为一个人工智能创业者,同时也作为投资人工智能方向的投资人,我觉得这个视野的转变和观点的转变很明显。我举两个例子。

第一个例子,是“技术的深度”和“技术深度能够打动他人的程度”二者的比较。

一般创业团队做一段时间后有了阶段性成果,就去进行商务谈判融资,拿着之前在学术领域所发表的paper、融资的PPT,还有自己的demo。

他想充分证明自己的技术能够领先,无论是从文章被援用的次数,还是demo能看到的实际样式,还是通过刷榜来跟Google等一线公司比较的结果,都希望能表现自己的技术能力。

这是包括我自己在内创业时的一个标志性的心态,造成的结果就是:就是很多创业者拿demo过来,我作为一个投资人去看的时候,发现很多人拿demo以后都不再多解释了,认为投资人看完后,理所应当就应当重视自己,表情上就是一副拿了已金牌的脸。

这个时候其实很为难,绝大多数投资人对demo的熟习程度远远不如创业者自己的熟习程度,不解释是投资人很难理解。

另外,你从投资人的角度来讲,一种就是他完全没有听过你提到的刷榜和期刊,一种是都听过,但是有很多创业者都对他讲过,所以他们分不清榜的难度,你比到底强多少,这个很难分辨。

造成的结果就是投资人很难被你的demo所打动,但是创业者感动了自己。其实双方都应该有往对方的方向去拉近,但现在还是离得很远。

第二个例子就是对产品思考的完全程度,尤其是算法。利害的人出来做人工智能创业的时候会比较怕深入讨论产品,原因是本来改变世界的事儿,一旦把这个事情具体到产品方向来讲,这个事听起来就变小了。

从投资人角度来说,听创始人只讲算法和与算法相干的成绩是很可怕的,由于算法本身是不能拿来当饭吃的。投资人不一定追求你把产品和产业的思考都讲对,但是要有逻辑,有深度,表达了对深化产品的态度。看推理进程,根据进程倒推创业者的思维模式。

4

主持人:第四个问题,如何看待人工智能领域的明星创业团队?人工智能领域的理想团队应该是什么模样的?现在缺甚么?

顺为资本孟醒:不要跟巨头比牙齿,AI创业我看好这三个领域

孟醒:我先说结论:这个行业里面非常缺人,缺的是AI的产品经理,就是既懂技术边界,又懂得需求边界的人,这二者结合起来,能把这两块融会贯通的人非常少。

行业里面不缺一般意义上的明星,特别牛X的算法达人,牛X的背景的BAT,很多从斯坦福,甚至于Google、Facebook出来的人,这些会愈来愈多。但是,方向性和定义产品这件事是特别难的。

研发明星其实有的时候会成为创业公司的本钱和负担,我举一个例子:

看到最近Facebook的人工智能研究院FAIR的Director,他昨天发了一篇文章:《我们为何能招到最好的人?》其中一个最核心论点:Facebook除给研发明星一个很有意思的工作去做以外,可以允许员工去在学术领域继续英勇渐进,去想办法发更多的paper。同时,在Facebook这个平台上做东西可以进行大量延展,不为任何垂直领域去定制,而是为了10亿以上人群研发技术,扩大本身影响力。

越是明星的背景,越是对扩大影响力和通用性这件事情有着强烈的寻求。但在创业公司里,如果你的团队花费时间去想怎样写一篇能够在学术界有影响力的paper,那就很麻烦了。由于在学术领域寻求突破跟在创业里面把一个产品做好是非常不一样的事情。对学术的执着在科研领域是黄金品质,在创业却是本钱。

第二,一个理想的团队应当包括一个非常核心的,能够同时晓得技术边界,又懂得运用场景的产品经理,可以是一个人也可以是两个人。但是两个人必须能很好地融会,一个会用虔诚的心态在垂直领域深挖技术,一个非常晓得行业同时非常聪明,愿意去理解一定算法边界的行业人士,这两个组合也可以算一个产品经理。由这两个人去构成组合渐渐去往下散布的团队,如果对应的行业又非常对口,我觉得是非常理想的团队。

主持人:第五个问题,您认为人工智能在未来可预感的5年内,最主要的运用体现在哪些领域?

孟醒:5年内如果能看到的爆发可能在两年以后看的更清晰。今天比较明确的情势有这么几个:

第一,5年之内AR会赢得技术上比较大的突破,从产品化的程度和普及程度来说,将有平台革命性的迭代。围绕AR所做的一系列AI功能会是一个非常有意义突破点,这里面包括图象辨认,包括物体检测,包括跟踪,包括SLAM三维重建等等一系列的技术。

第二,绝大多数的AI创业公司背景是偏技术的,这样的公司最合适在以下几个行业突破:

第一个是纯互联行业。但问题是这些都由巨头掌控着,造成创业公司很难突围,也就很难引领这些新的AI方向或是创新性的AI方向能够带到不同互联的方向。

其次,我比较看好的几个垂直领域:农业、医疗和金融。

先说农业,农业的渠道其实没有特别强的人在把控,也就是说使用新的服务或使用新的决策是相对比较市场化的。

医疗行业,好处是一些细分的医疗领域里用人工智能去做一些明显能提高现有医疗行动的运用的时候所需要的训练数据没有想象中的做其他应用领域那末大。这一下子减低了很大障碍,同时医疗决策越来越市场化,同时客户非常分散,由于医院,医疗机构,医生都很多。

金融领域,创业公司已经出来一批,美国的Wealthfront,国内有一系列的智能投资顾问,或说用大数据或用人工智能算法的方式授信等等。

从个人情感动身和产业结构动身,我其实更多在看农业方向,固然还有一些像现在炒得非常热的智能驾驶等这些方向。

主持人:第六个问题,人工智能领域2B和2C方向如何选择?为何?

顺为资本孟醒:不要跟巨头比牙齿,AI创业我看好这三个领域

孟醒:我对着这个PPT来说。大多数的人工智能方向,要末是改良体验,要么是改良效力;要末是一个2B,要末是一个2C的方向。刚才讲的绝大多数情况都是垂直领域,是2B的。

上个月我在美国待了很长时间,也造访了美国一线的VC和投行,尤其是之前专注人工智能领域的投行。我发现在美国一些VC已没有两三年前专门设立的人工智能部门。也就是说这个领域其实已消失了,或说正在消失。

顺为资本孟醒:不要跟巨头比牙齿,AI创业我看好这三个领域

消失是由于在绝大多数领域里,人工智能已像互联一样散落在每一个垂直行业,成为行业本身的一部分。所以你公司的核心价值,看的不是它的算法,而是看人工智能作为一个核心壁垒,能为这个产业链增值多少。

有许多行业出现变革的机率非常大,而且他们每一个行业的机动性都不太一样。比如说医疗行业、电力行业、电力巡线这些行业,因为政策或采购方式的变化导致行业的变革,而变革是由于行业养不起这样低附加值的劳动力。

而做一个2C的事情终究要解决的是人的体验。但终究的目标是要获取足够多的流量,利用这些流量做增值服务。

人工智能直接去做2C相对来说会非常难。由于在2C里面,对应的行业变革是平台的迭代,例如从PC到移动端就是一个平台迭代。假设我们没有从PC到移动端这个前提,直接从移动端切入到AI,把AI作为一个主流的流量入口,这是比较困难的。

固然,AI的发展不单单在于平台切换。我们现在智能家庭或物联本身是一个分布式或离散式的平台,迭代可能会把这个平台本身去中心化,这也可能会给AI一个入口或流量的机会。

从个人角度来看,在现在创业者找到一个合适的行业,充分了解这个行业的需求,能够看准这个行业在某个时间点产生变革,变革是什么,然后提供2B的服务,可能会比等待一个平台迭代的周期去突击2C的机会要更快或更容易。

7

主持人:第七个问题,您自己创业的时候是怎样选择方向的?

孟醒:第一家公司我们是把人脸辨认、物理检测和场景辨认打包,通过取得API向第三方公司输出技术。这类模式可以理解为我们的商业模式是建立在他人商业模式的基础上,也可以理解为2B,我觉得更形象的应该是2D的商业模式。选择这个模式是由于第一次创业,没有考虑到这个模式的天花板在哪,当时觉得这个模式有价值,马上找人去把这个产品开发出来,第一次就是以这样的方式来做产品。

这个模式很快就遇到瓶颈。我们发现这个模式只能拿到没有资金或付不了钱的小客户的生意。略微大一点的客户对安全性有要求,因此我们不能用通用模式去做。而如果做定制,这件事情的周期又比较长。我可能需要再做一个demo去把一个客户谈下来,这跟传统的软件销售有点类似。

第二家公司的核心模式是在互联上通过图像辨认的方式去发掘数据来变现广告费。这时候我们已不再给其他公司提供图象辨认服务和技术,而是想在互联上所有存在图片的位置上去理解图片本身。就是不光知道图片里面有谁、有没有脸、有没有车、有什么背景,或这些相对的位置在哪,而且还要知道他们对应的一些形态,通过这些我们想在图片里植入一些信息比如广告,我们斟酌用什么样的方式、什么样的背景或什么样的形态去植入,不会影响用户他们阅读图片本身的体验,同时使用户被这个广告影响到。

所以我个人经历也是一个迭代的进程。第一,如果我们以后再去做人工智能方向创业的时候,一定不能赌他人的业务是不是能够跑起来。如果你做技术输出这件事,很大程度上是在赌你客户的业务能不能跑起来,跑起来或许你能够分到一杯羹。所以我觉得应当在更大程度上把商业模式掌握在自己手里,自己去做垂直领域的运用。同时,我觉得在国内不像在海外有那末好的退出环境,如果你长时间没有改良效率或取得收入,长时间经营很难支持下去。所以提供技术服务整体来说不如做自己的运用那末性感。

8

主持人:第八个问题,中国人工智能的核心科技研究发展与国际领先水准比较如何?

孟醒:先澄清一个概念,中国的研究发展其实可以从两个角度来理解:一个是说中国人本身在人工智能核心领域的研究发展,第二个是说国内的中国人在这个方向的研究发展。

如果把中国人作为一个整体来说,从视觉领域去看,基本上已占据了视觉领域相当大的份额。2015年在CVPR(计算机视觉3大会议里面的一个最大的会),我当时随意挑了一些论文,大概有篇,作者里面没有中国人的paper也就不到4篇。这个会基本上是这个领域最顶级的会议,这里面所发表的学术论文90%都是由中国人参与,乃至都是中国人主导的项目。

同时在这些会场里看到的也都是中国人。近几年有这样一个趋势:之前绝大多数是海外华人(固然海外华人成长也是最近几年起来的),渐渐这几年你会看到国内愈来愈多的研究专家跟世界同步接轨,也参与到这些研究里来,在顶级期刊上发表文章。由于在国内的院校像清华、浙江大学的一些老研究员和教授培养了一批在这个行业里面非常顶尖的学生,这些学生在海外一线院校都做出了很不错的事迹。

反过来讲,纯粹在国内而没有海外经历的研究人员,在顶尖或在非常前沿的算法上可能还是和国外专家有差别。我说的这些差别都是非常短时间的,由于这个事情在改变。但是我们创业的时候,通常会把算法团队放在海外,哪怕贵一点,也会优先从海外招人。固然国内也存在着很利害的人,但是我们招聘的本钱可能要高很多,而且这些人会被更大更成熟的企业更早地招走。

主持人:第九个问题,现在大公司都在发力人工智能,创业公司还有机会吗?人工智能创业公司应当如何斟酌退出?

孟醒:先回答退出的问题,国内的人工智能创业公司退出是一个非常大的问题。因为我们到现在为止还没有建立起一个像海外那样,为了得到优秀的技术团队而去收购一家公司的环境。这基本意味着我们的创业公司要末做出现金流,要么被海外公司投资或者收购。

在创业公司退出很严峻、同时大公司也在发力的两重考验下,我觉得如果创业公司坚决朝着2B这个方向去尝试,找到1两个比较适合的垂直行业深扎到里面,前景还是非常广阔的。垂直行业里面的需求多种多样,乃至有很多看起来非常简单的东西,经过算法的改造以后会有很大的提升空间。

很多公司上来就做终极挑战,去做开放式人机交互,做聊天机器人,或去做陪伴机器人。其实适合的运用场景可以很简单,比如微软前天发布了一个运用,跟某家快餐连锁做drivethrough人机交互的自动化。

Drivethrough就是你开车经过麦当劳类似的快餐店时候不用下车,摇下车窗在一个麦克风前面点餐,然后再在另一个窗口前面取餐,全程都是开车的,节省时间。原来这项工作需要两个人做,一个负责记录点餐,一个负责在窗口备餐和收费。现在微软这套系统把点餐这块完全替换了,难度相对并不是那么大因为输入场景很固定。这是一个标准的极大的存量市场,都没有用户教育本钱,技术难度和履行难度都比较公道。

我觉得这类单个的想法不一定能支持起一个特别大的公司,但是由于类似这样的点非常多,例如围绕快餐行业进行交互学习,因此从核心需求点这个角度切入,我觉得能够支持起若干家比较大的公司。这就像之前我们做O2O的模样。

互联大公司也都在发力,而且在流量上占有领导地位,但是它很难做到在每个垂直领域做的非常深,由于这本身不是他的核心业务。同样,在人工智能领域,大的公司我觉得会在建设语音、语意等基础的识别上发力,之后可能会去开源,而且将来开源的算法会达到相当好的程度。

特别大的公司不可能针对每一个垂直领域都开发出特别适应的方式和产品。

主持人:第十个问题:以下几个领域,您选择其中一个或两个具体分析一下吧。领域如下:聊天机器人+智能助手;人工智能在农业、医疗、工业的运用;3D场景重建;自动驾驶领域。

孟醒:那就聊聊最近非常火的聊天机器人这个领域。我们团队基本上体验过所有市面上的产品,中文的、英文的,大公司开发的如Google的和Facebook的各种机器人、到国内我们做的各种机器人,人工的、半人工的,和完全机器去做的。

之前我说过,我觉得懂得AI的产品经理非常重要,由于他需要知道技术的边界在哪,才能定义这个产品。

我觉得如果你的定位是开发一个人工机器人助理,目前来看,绝大多数公司产品都在解决头部问题。由于头部问题有量,有量才能培养人的习惯,也能培养机器的习惯。所以现在都在解决量的需求,例如打车、订咖啡,还有一些相干的比较容易去解决或者频率非常高的需求。

我认为在头部需求中用聊天对话这类方式去解决不是最优的切入点。原因是所有这些头部需求早就已经有非常适合的垂直应用来解决了。

举个例子,打车这件事情,如果我的出发点终点比较固定,比如永久是从公司到家,你用哪一个App打开去做,可能没有太大区分。或许区分就在于对话节省一点时间,但是你略微去控制一下定位就可以解决,比如我今天是从东门出来,而不是从西门出来,滴滴可能是把那个针扎到东门而不是西门。

为何滴滴的App做成了这个样子,而不是你直接打开以后就可以有一个语音对话窗口,这是它本身产品思考决定的。所以我觉得头部需求既然量很大,就有值得去为它做优化的地方,而不应该是统一,所以它的UI更合适分别优化。

反过来讲,其实长尾需求反而是合适做AI的。什么是长尾需求,就是我非常少提到的东西,比如我突然想改一个戒指,我想知道在哪有可以改小一号的工匠。

解决长尾需求本钱是非常高的,特别用机器的方式解决。但是只有当你向机器人提出这样长尾的需求,他同时帮你解决的时候,你才能够取得足够大的价值。甚至于,我觉得真正成功的机器人服务是不应该用祈使句作为主要交互方式的。

这点跟搜索是一样的,搜索做的就是把长尾需求集合。这里的搜索肯定不是大众点评搜索出来餐馆或者机票,而是我们想搜出来某一个我们不知道的公司或某一个人,我想看看它的背景,其实这些是非常低频的事情,但是攒的足够多就会造成一定的需求。

我觉得我们可以开发出像搜索引擎一样提任何需求或长尾的问题都可以解决的机器人,这个技术难度过于大。人很难成为所有领域的专家,但是成为一个领域的专家相对是比较容易的。对应的,我们应当把助理升级为一个专家,把他聚焦在一个垂直领域的专家。从语意上来说,我觉得他的输入和输出对应的范围是相对比较垂直的、固定的。

我在美国看过一家比较有意思的公司,公司不太知名,叫STATMUSE。这家公司主要做的是NBA体育数据库,他把全部NBA体育数据全都爬下来了。你可以向他提任何相干的数据问题,比如我想知道“在姚明的职业生涯中,第一次跟奥尼尔交锋时得到多少篮板”。这是一个长语句,而且它本身是一个非常开放的问题,你把他这句话扔到Google里面很少能够回答上来,由于很少有人去提这样的问题,这样的样本其实不多。

公司在这个领域做的很好,它对应的人群是两种:第一个,是赌球的人,他们对数据的需求极为旺盛,尤其是做FANTASY体育的时候,完全是靠数据来判断输赢的方向,而且他们拍头脑就能想出我需要什么样的数据,但是很难用一个既定的UI或用户交互界面来得到他们想要的那些通过复杂的挑选方式取得的数据,用自然语意就可以得到,这就是一个专家所带来的价值。

第二个方向,就是他们为体育解说做及时的反馈。例如我做解说的时候,看到一个球员投了一个球,我想说他已经连续3场比赛在第三节投的第一个球很准,这个数据怎样来,很难让一个人在现场搜索这个数据。而机器人能在我想到以后马上就搜,搜完以后能马上告诉我,这个是一个很有价值的方向,所以他跟ESPN签了一个很长的和约。

我觉得这两件事加一块,这个市场就足够大了。赌球那个市场很大,而且代表的是一个有规律的、足够垂直、足够深的市场。我觉得在这个垂直领域的公司其实比一个通用的公司更有价值。

总结一下,解决垂直的长尾需求是王道!

痛经怎么调理根治
痛经最简单的止痛方法
痛经最有效的缓解方法

相关推荐