威斯尼几网站-威尼斯app下载-登录

威斯尼几网站 专栏360刘鹏正文

刘鹏清华演讲:互联网变现与计算广告

  数据交易是很有意思的一个问题,国内最近有两个数据交易所,一个是贵阳交易所、一个是长江交易所,我也关注了他们做的事情,我觉得很好,让大家认识到数据的价值,并且想办法用商业化的方式来运作数据,因为如果你不以商业化的方式来运作,这个数据很难用起来。可是我又看到他们在交易机制上的设计,或者他们对交易数据的理解,跟我认为的大家的状态有一点距离。数据交易应该是什么样的?它关键的问题和障碍都在哪?不是说现在广告市场对数据的认识就完善了,其实有很多问题还没有解决,这些问题是什么?我把总结成三个定律,也是我的看法。我跟一些业界的人交流过。

  第一定律,数据只能交易,不能共享。因为数据变成钱太容易了,你能够设想,现在有人在忽悠,百度拿数据拿出来大家共享一下,你还不如说让李彦宏把他帐户里面的钱打给你一部分。但是数据共享在有些层面是发生了,发生的情况有两种:一种是子企业和母企业之间,比如说搜狗跟Tencent是有数据共享,但是因为人家都是子企业和母企业,接近控股的状态。另外,政府的数据可以共享,政府的数据没有直接盈利、变现的需求,他的数据希翼拿出来给大家用。可是我仍然觉得如果政府的数据简单拿出来共享也不见得是好的模式,还是要用商业化的手段做成转移支付的办法。总之我的第一个观点:数据是不能共享的,只有交易,交换也很难,一定是做价的交换,做价的交换本质上就是交易。

  第二定律,数据交易该怎么做?我看过贵阳和长江做的交易,他们的交易有一个最大的问题,在广告数据交易里面碰到过这个问题,并且部分的解决了。数据交易必须要实现部分的交易才会有真正的市场,我知道全国每一个人的男女,打成一个包拿出去卖,可能有人买,但是买的人会非常少。我就在华东五省投广告,我买其他省的男女买了对我都是成本。在广告里的数据交易比这还进了一步,不仅仅是部分交易,而且是按效果交易。你在Xchange上买了一个广告位,我赢得了这次广告位我才交钱,我不赢得这次广告位我不交钱。这也是把定价权向需求方转移的过程。我认为在将来任何一个行业,如果能做到定价权向需求方转移,这个行业就有机会做大。按照部分数据交易、并且按照效果交易,这是大家在广告市场里摸索数据交易得到的共识。上海电信我打过一些交道,他卖了一年数据,我觉得他也卖不下去,他的意思是我这个数据很值钱,我打一个包给你,我只能用上一部分,其他的对我都没有用。也许今年我这个系统还在开发,今年数据我根本没有用,也交了一部分钱,这个事情表面上看起来上海电信占了便宜,但是他是吃了大亏,因为他没有真正把数据用起来,更谈不上将来用竞价的方式获得更高的收益。

  第三定律,怎么给数据定价?这个问题广告商也没有解决好,有解决的方案,但是解决的不好。有一个数据交易平台叫BLU KIY,4亿美金卖给了oracle,它的数据量很大,但是它不怎么挣钱。后来仔细讨论,今年我深入的研究了这个事,我觉得数据的交易跟流量交易不一样,它反而有点像,比如说你知道一个人是男是女,这个信息你是可以卖给很多人的,你卖给一两个人、十个人,你会发现他不一样,你卖给十个人以后这个数据就贬值了。这块地,有的瓷砖下面有金子,有的瓷砖下面没有金子。有个人有一个藏宝图,这个藏宝图对他来说就是数据。但是大家每个人都知道这个藏宝图,会发生一个事情,大家都知道这块地上有金子,大家先来抢这块地,大家先把这个地价抬高。十个DSP都知道,我都出一个高价去买流量,数据就向流量价值发生了转移,这是一个理论。我个人的设想,将来数据交易应该是一种限量的,流量本身是限量的,一个流量就是一个人投,不可能三个广告叠在一起投。但是数据可以卖给很多人,卖的越多越不值钱。能不能把这个量限下来,这个人是母亲,一定时间段只让产生三次或者五次交易,这样的话有可能解决问题,并且这有一个巨大的好处,这样有可能让数据交易也变成一种竞价方式。这个母亲的信息我只给三个人用,我给哪三个人用,你们自己来竞价,最后排的比较高的三个人我给你们用。一旦数据交易能够变成竞价的方式,并且是在这么细的力度上竞价,前提是大家能够部分交易,整体交易竞价也没有意义。整体交易本身需求就很少,部分交易的基础上如果能做竞价,这个市场才能真正把它的市场打开。

  数据定价和交易本身是特别有意思的问题,而且有可能激发一个巨大的市场,而且这些问题工业界都没有解决,将来大家如果从事大数据,这是很有意思的一个点。

  大数据的隐私问题,我发现没有人明白这个事,交易所还好,他卖的协会数据并不见得很多,隐私问题运营商提一个词:脱敏。脱敏就是大家这儿对应的第一条:PII,有些信息是你绝对不能用的,因为有一些信息你卖给他以后,他可以直接接触到客户,比如说电话,我直接打给你了,家庭住址、身份证号、姓名,这种信息在大家的原则里面很早就有A29的原则,不能使用。很多做数据的人理解的脱敏就是把PII去掉,我今天要告诉大家的是,PII去掉解决不了问题。有时候你看到一张表,你看到你们单位的工资表,假设会计把前面的电话、姓名都抹掉了,就剩下下面的几栏,但是有他的岁数、部门、家庭住址,在企业这个范围内,你对你熟的人,你看这几栏,一看就知道是谁,这种信息单拿一栏都没有办法定位一个人,但是一组放在一块,对熟人来说,他可以很清楚的定位一个用户,这种行为叫半定位。

  隐私的顾虑在于熟人之间的隐私,不在于陌生人之间,大家最在乎的并不是有人把数据库黑了,把那个东西八毛钱一条往外卖,这件事不是大家今天最大的顾虑,最大的顾虑是对你有一些背景调查的人,在一些环境里能够把你的信息定位出来,从而了解你更多的隐私信息,这些事情是大家真正的顾虑。脱敏是不能解决这些问题的,而且这个问题是根本无法避免的。对互联网的用户来说,他的行为比前面会计那张表还要麻烦,他的行为是极为稀疏的,曾经有一个例子,前两年微博上传的一个例子,清华的一个同学是王珞丹的粉丝,他看王珞丹的微博,仔细一条一条分析,他就分析出王珞丹住哪,几栋楼,几号。有一个最生动的例子,Netflix推荐大赛,这个大赛很有名,因为它的奖金很高,它出了一个事,有人对这个比赛感兴趣,在数据库里看,特别凑巧看到一条记录,他发现这条记录是他的一个同事的,因为那个太清楚了,这个人看过什么影片,同时给了多少分,你都有这种经历,你跟你们熟悉的人会经常讨论什么影片好看,评价如何。大家这个屋子和清华大学很难找到两个人看影片的记录是一样的。对于你熟悉的人,你一条一条记录扫出来,你一定可以把你的朋友对应出来,要不计代价的找到某一个人的隐私的数据,对这种场景,成本不是顾虑。当然这个案例他也是正好碰到了,他把那个数据拿给他的朋友看了。这个同事还有一些影片是没有跟他沟通过的,那些片子全部是同性恋影片。至少这个同事不希翼自己看同性恋影片这个事被其他人知道,这是他的隐私范围内的,所以他很恼火,他就把Netflix告上了法庭,结论是没有办法解决,大家要把它上升到比较模糊的态度去解决,这件事情并不是一定不能解决,也有数学家研究比较前沿的问题,怎么从数学的角度解决这个问题。在互联网的稀疏的数据下面,在熟人的前提条件下,隐私在行为数据里很容易被破解。他真正的风险在哪?比如说电信把他原始的数据,上海电信就是卖裸数据卖过一年。它的风险在于,假设有一个人不计代价的一条一条看,假如我跟上海某个副市长有仇,我把他的数据一定是能够找出来,找出来这个副市长有没有贪腐行为,不见得发现不了。

  总之,告诉大家要有这个认识,隐私真正的顾虑是熟人之间的,不是陌生人之间的。关心你的人,这种关心有可能是负面的,有可能是正面的。这种人对你的影响最大,由于他可以不计成本,并且由于互联网的行为数据本身是极为稀疏的,基本上没有任何两个人一样,所以他的风险是很大的。而这种风险在今天来看是被低估了,因为没有出现哪个副市长因为这事被抓起来,将来他一旦出事,一定是有大事的。总之我的一个判断,隐私现在来看是大数据头上的一个达摩克里斯之剑。

  大概告诉大家一个观点,你要想了解数据的变现和数据的交易,了解计算广告是一个必不可少的环节,甚至说是最重要的环节。因为所有的数据使用的历史和产品发展的历史在广告行业走过一条完整的弯路。你没有必要再走一遍,后面这半段涉及到数据本身,从我的经验来看,数据的变现和交易都是有市场基础的,并且有它的价值所在,但是数据交易本身有很多问题,有的是在广告市场里已经得到了验证和解决的,有的是大家在广告市场发现问题但没有解决的,还有一些是隐私问题。

  今天借这个机会,我希翼以计算广告作为一个引子,从这一点希翼大家了解行为数据的使用、加工的过程,将来这一定也是大家大数据市场非常重要的一块。看大家还有什么问题。

  精彩问答

  提问:从您刚才说的整个过程来看,您是不是认为现在的广告模式已经到了比较成熟和适合商业化的阶段?您个人对将来新的广告模式可能的突破点在什么地方?

  刘鹏:我那个产品图我有一半没有讲,现在的广告产品比较成熟,这句话可以认为是正确的。因为它从98年到现在,计算广告已经发展了快二十年的时间。现在大家认为对数据已经使用过了,隐私问题大家有很多顾虑。大家忽视了一个问题,大家用数据的理论是大家希翼了解这个人历史上看过什么,对什么感兴趣,但是对用户现在的场景和情景的把握,在过去的广告产品里是不够的,这就涉及到大家讲的原生的概念和新的广告模式,这在移动上越来越重要。这个我今天没有时间讲,确实,原生是今后一个广告市场从产品发展的重要模式。把数据和场景结合起来使用。就现在利用数据的广告模式,从广告交易到数据交易本身,我觉得是比较稳定、比较成熟的。

  提问:我有一些朋友也做过广告实时竞价的事情,听他们的意思,做这个事情如何能够确认数据的真实性是一个很大的问题,是使用方在定价,但是他们很多人都无法监督广告发放者你到底给我发了多少,到底发给谁了。这个事情有没有进一步解决的可能性?因为您刚才说,数据能不能只卖给一部分人,如果这样做的话,就像影片一样人为的提高了这个价格,您最开始的逻辑,因为数据再卖一份的边际成本是零,如果我是有流量的人,我免费去卖,这样才能把我的流量价值抬起来,更符合您一开始说的逻辑的方式。

  刘鹏:对于有流量的人来说可能就是这么想的,数据只要提高流动性,提高流量价值就可以。但是很多数据提供方并不是流量拥有方,这个市场有意思就在于,有广告需求方、广告供给方、数据提供方,这些人的利益出发点都是不一样的,都是博弈的,对于数据提供方来说,不是大家前面说的概念,因为大家前面说的概念有一个基础,我这个商品本身是能够规模化个性化传播信息的。数据本身已经不再是能继续传播信息的能力。所以我觉得数据提供方,数据跟流量的性质是不一样的,流量我可以搭别的东西,数据并不能再搭别的东西卖。前面实时竞价的问题,这跟需求方定价不仅不矛盾,而且恰恰是一致的,首先,展示量的问题是可以监测的,数展示量,数男女这种有确定标准的,人头属性流量,这都非常容易监测,而且也有第三方监测企业。其他的标签,我说这个人是一个体育爱好者,这种标签有一个特点,你不知道什么算体育爱好者,我去年打过一次羽毛球算不算,对于这种模糊的标签恰恰是要用需求方定价的方式来解决,你不用管我这个东西对还是错,你觉得他对你值多少钱,你觉得我这个东西质量差、掺水,你出低一点的价格,那个人质量好一点,我出高一点的价格。因为标准上是没有答案的,不存在哪些人都是体育爱好者,不如说每个人根据自己的需求来,根据你认为他的价值来定价。数据也是一样,供给方定价比流量还不靠谱。有的数据对有些人很值钱,对有些人不太值钱,如果都是供给方定价,这个市场很难发展起来。

  提问:你刚才提到原生广告和情境广告,现在从一个实际的用户来看,天猫的、京东的或者在手机上推送的广告,包括网盟的广告个性化具体的表现都不是令人满意的。从你来说,做个性化的分析瓶颈在目前这个阶段来看表现在哪几个方面?上下文场景数据、情绪数据、情感数据,怎么采集、怎么分析?对模型的训练和效果的提升哪个方面去发力提升效果比较明显一点?

  刘鹏:个性化广告和原生广告是两个纬度的意思。原生,首先希翼这个广告跟内容长的差不多,搜索里的广告最典型,搜索里的广告和内容长的差不多,很多人分不出来广告和内容。你在微博和FACEBOOK里看的广告也有这种特点。还有一种是情境广告,用户当前在干什么,如果这一点做到原生,大家叫做意图原生,搜索表现好在表现和搜索都是原生。过去所有的广告媒体是不参与的,媒体只是把代码放一个京东的代码,他就不管了,月底结账。淘宝的自然源处理能力去分析页面里的上下文,从而得知用户意图,这件事情靠谱不靠谱呢?基本上他能分析的东西很浅,深入的东西必须要媒体的参与。媒体怎么样重新参与到广告交易的过程中,提供有价值的上下文信息,如果这件事情能做好,真正符合你的预期的、在你任务里的广告就会发生。这是产品和运营体系上的问题,不见得完全是一个技术问题。搜索为什么能做到呢?因为搜索的用户意图就是他要搜索的东西。其他的网站里面用户意图也很明确,你通过自然语言处理是分析不出来的。我的看法是让媒体重新参与到广告的投放、决策过程中。但是目前有很多产品和运营商的障碍,不是一两天能发生。淘宝处理能力再强,也不可能投出符合你情境的广告,必须跟媒体想办法从数据和运营层面上有一些接口。

  提问:我对数据交易比较感兴趣,您今天提的竞价是很新颖的一个观点。您能提供一些更细节的考虑分享一下吗?

  刘鹏:考虑蛮简单的,我的出发点数据交易从BLUKIY的角度来看,是没有体现它的价值的。数据很大,但是它不挣钱。但是流量的价值往上走,竞价更激烈,所以我进一步考虑,数据的交易跟流量交易不同的特点,因为它可以不限量供应,流量天生就是限量供应。这里面存在机会。这些说法基本上是我个人的说法,不见得很成熟。可是我认为,竞价这个点是所有人都在往这个方向努力。现在这个时代任何一个行业要想有爆发式成长机会,一定要变成需求方定价和竞价的模式,供给方定价模式不可能爆发式成长。这是很开放的问题,你也可以提你的想法,没有什么标准答案。

  竞价有很多问题,但是现在数据市场没有真正被激发出来,因为纯做数据变现挣不着什么钱。大家真正的热情没有被激发出来。总是要想一个办法把有数据的人的热情激发出来,让他真正挣钱,他才能够市场发展的快。至于你说的有很多问题,或者将来这个模式比较复杂,我倒不觉得这是障碍。商业产品的市场就是复杂,而且越来越复杂,用户产品发展的规律是越来越简单,给懒人用,商业产品的规律就是越来越复杂,因为他的目标很清楚,就是优化利润。只要利润提升1%,我的系统多复杂一倍都没有关系。

  提问:我是来自华阳民众的,我也是这个行业里面从业者之一。大家现在也在跟BAT谈数据的设想,我感兴趣的是360这一块对数据变现和数据开放的思路是什么样的?

  刘鹏:大家企业跟BAT是有点像,或者更保守,基本上是没有数据变现的需求。这个事情首先也变不了钱,你现在这种方式其实挣不了钱。首先BAT也不可能拿这个变现,他变现了也挣不了多少钱。企业的态度,不会说这是有一条产品线来做这个事情。

  提问:阿里都是电商的数据,都是效果的数据,他自己本身的流量池也非常大,阿里妈妈的整合,整合流量的变现,包括对品牌广告主的开放。

  刘鹏:他开放有一个前提,他必须是这些广告主的落地在淘内。

  提问:至少数据变现的价值增值,数据竞价的问题,如果流量被竞价,数据的价值也就被竞价了,至少他自己本身淘内和体系内的流量的价值也会变大。在这里面加成的效果,他变现的体量也不会小,至少他现在一家一家的品牌广告主在谈,越来越多的广告主在天猫开体验点,或者有自己阵地的品牌商越来越多了,这个流量消化在自己体系内,对他是价值不菲的。

  刘鹏:原来阿里几任负责DSP的人也都比较熟,因为各个部门的利益是有博弈的,未必数据部门的利益一定跟企业战略是一致的,我在里面看到很多的博弈。首先阿里现在用数据的方式还谈不到数据变现,更多还是用数据去提升他内部的投放。因为你在阿里投,阿里知道每一个cookie男女,你并没有图,跟你在百度选关键字是一个道理,你必须在他封闭的体系内消化掉,你不能把你男女的cookie带出来。这跟数据交易和变现是两回事,还是传统的封闭体系的话题。

  提问:现在一有一个尝试,拿出电信的数据做变现的尝试。这个就不仅仅是在阿里体系内。这个事实拟稿怎么看?

  刘鹏:我首先要提醒他们隐私,因为他们都不懂。他们老跟大家说脱敏,脱敏是石器时代的观念,不是互联网时代大家对隐私的认识。出了大事是他们电信领导都兜不住的事。电信数据所有互联网企业都没有他强,第二,跨屏的数据,电信运营商对行为数据的掌控力在弱化。百度改CBS了,电信就拿不到百度的数据了,淘宝也要改CBS了,都改了之后,电信就拿不到了。但是这是迟早的事情。BAT在高价值业务上HP改CBS的事情是迟早的事情,所以我不是特别看好他们在行为数据方面长期的价值,但是地理位置和跨屏是他们天然的优势。

  提问:刚才您说到一个例子,有一个黄金埋在这儿十个人知道,它的价值变弱了,同样的数据对每个行业的人价值不一样。这个数据对这家企业产生先到先得的效益,对于不同的行业会产生不同的效益。所以我认为数据开放可能会不同行业的拉锯会产生各个行业的应用。

  刘鹏:您说的是哪类的数据?如果是行业数据在广告行业也没有太多的东西可以参考,可以单独的摸索和探讨。

  正因为数据对不同的使用方的作用和效果是不一样的,最终我坚信一定要走向需求方定价,供给方定价永远都解决不了这个问题。

  提问:现在在各大应用市场上有专业的广告传播平台,他既可以给广告主发布,也可以一键转发,用多种传播的渠道平台一键托管的方式,这样的话对广告主也有预算,传播费用在平台上是透明的。对于用户来说,广告主可以把用户阅读自己定价,方便用户来传播,用户看到这个广告,觉得他值得传播,他就产品。

  刘鹏:这种叫激励类的广告,积分墙之类的。这种广告传播的效果要打折扣,虽然它的传播量很大。比如说积分墙,你玩游戏,让你下一个,得多少分,但是你下了以后马上就得删了,这是一个很大的广告市场,但是它的价格比较低,积分墙是正常广告价格的五分之一以下,同样的一个安装,因为它的后期效果很大。一些大的手机厂商,苹果对这个打击很利害,主要它影响榜单的排名。这类广告总体上是在走下坡路。因为它有点违反本质的规律,你是用激励的方法在传播。

  提问:APP上广告主投放广告,激励用户帮助他们传播。

  刘鹏:我正常买一个CPM的价格是10块钱,投这种广告他们只能给两块钱。

  提问:我对广告的监测和追踪很感兴趣,大的广告企业和网盟企业都有自己的监测中心,第三方独立的监测和追踪系统在这个行业里面发展的趋势怎么样?

  刘鹏:监测和跟踪,看监测什么东西,广告是展示、点击、转化。点击不需要监测,转化是需要检索的,主要是移动应用下载,移动应用下载要溯源,他比较复杂,转化的监测也是由第三方企业提供。国际上都是按照一次点击多少钱。FLAS、MAT等等几个企业在做这个。展示是在人家的网站,你不知道,你要委托一个第三方来做检测。展示付费你才需要检测,如果你按点击收费就不需要间。CPM付费大部分是品牌广告,品牌广告才有监测的需求,大多数效果广告没有曝光监测的需求。这个市场你可以计算一下,假设品牌广告的预算一百亿,会有1%的钱交给监测厂商,这个市场就是一亿,总体的市场不大。转化监测也不是很大,监测本身不是一个特别大的市场。

  提问:比如说You Tube一上来放广告,然后给你一个按纽就可以关了,但是国内的广告他就一直放,一直放五分钟,这两种方式哪种是对的?

  刘鹏:我当然认为You Tube的方式是对的,如果他放五秒你就关了,你对他产生的效果不大,他放五分钟对你的效果仍然不大,你可能去干别的了。国内的市场是劣币驱逐良币的市场。他由于对广告主,我承诺了多少量给你,我不得不去完成,为了充这个量,插进来一些低质量的量。广告主会进一步调低他的单价,我再参更多低质量的,变成了恶性循环。我卖一个苹果你给我一百块钱,我跟你说它什么都能干,你就买了,我得了一百块钱。但是卖完了以后的售后服务不是我负责了。我个人倾向于You tube的方式,国外一般都是这种方式。

  提问:注意到您说的数据交易,您提到了两个交易所,一个是贵阳,一个是长江,现在数据交易不挣钱,而且量也比较少,现在这种交易所有盈利的能力吗?对于交易所未来的发展方向应该是什么样的?

  刘鹏:交易所的盈利能力,关于行为数据的交易,如果按照这种交易方式,就是不work,按照贵阳的方法。如果是统计数据或者其他数据,那跟卖报告是一样的。统计各个县的什么情况。至于怎么发展,特别是行为数据的交易,不管是标签还是更细的数据,一定要结合在具体的数据应用上做交易才有可能快速的发展。这个广告市场做的很好,因为数据交易都附着在广告上,他没有独立的数据交易,Xchange,你买的数据是广告直接带过来的,而且所有的过程都是顺的,一定要附着在具体的应用上去设计交易模式。纯粹的数据交易很难解决部分交易的问题,很难解决按效果交易的问题。更谈不上竞价的方法。

  提问:第一,个性化推荐和计算广告的区别点在哪里?第二,关系型数据库,来做这种广告投放平台,根据它的计算模式应该采用什么样的分布式计算系统?第三,这个计算平台,针对计算广告学这个特定的业务和状态,怎么样来设计一个能够支撑他这种有限的条件的模式下,他的整个过程追踪和快速计算、实时处理的平台架构,应该在哪些点上考虑的比较多一些?

  刘鹏:第一,推荐和广告的区别,广告的核心引擎跟推荐是差不多的,广告最大的区别是多了一个预算和量的保证。推荐是很多很多的利益博弈,推荐是一个游戏,广告真的是市场,市场就涉及到机制,这是推荐里面没有的。如果仅仅是排序、检索算法,两者是非常相似的,但是宏观的设计和保证下的优化是有非常大的差别。

  第二,我说的主要是线上不适合用关系型数据库,线下还是可以用的。你有一个sever,sever在做决策的时候不适合做计算,你算的空间很小。如果再有关系型数据库,基本上你的成本很高,而且效率一定不是最高的。关系型数据库就是准,一致性高,一致性高对广告来说无所谓,我有一千次展示,有一次算错了没有关系。

  第三,这儿也说不清楚,你要有兴趣可以看看我书里讲的东西,基本上对框架有先容,这个在业界来说相对成熟一点。

  整理:谢婷婷

  校对:祁德力

  注:本稿件摘自数据观入驻自媒体—数据派,转载请注明来源中国大数据产业观察网www.cbdio.com,微信搜索“数据观”获取更多大数据资讯。

分享:
延伸阅读
    速读区块链
    贵州

    贵州大数据产业政策

    贵州大数据产业动态

    贵州大数据企业

    更多
    大数据概念_大数据分析_大数据应用_大数据百科专题
    企业
    更多

    威斯尼几网站|威尼斯app下载

    XML 地图 | Sitemap 地图