机器知道你会点广告:写给普通人的CTR预估科普
我们在刷微信和微博的时候,有时候会惊叹广告非常精准——就是我想要的!”,有时候又会感觉广告极其不靠谱——我怎么可能点呢?”,所有的这些背后,广告的工程师们已经做了他们最大的努力——
即便在我们看来并不精准,但在所有定向给你的广告中,他们已经挑出机器认为你最可能点的广告,而这背后依赖的就是CTR预估技术。
CTR预估是竞价广告核心的逻辑之一,很多人认为CTR预估非常高深,根本搞不清其中的逻辑,的确,CTR预估作为一个纯技术的模块,要做一个简单的科普并不容易。
致力于用简洁语言描述复杂问题的卫夕今天尝试用人话来解释CTR预估的来龙去脉,放心,本文不会涉及到任何高深难懂的公式和技术逻辑,看得懂中文的同学都能明白其中的逻辑。
一、CTR在竞价广告系统中起神马作用?
CTR(Click-Through-Rate)为点击率,它是互联网广告中最基本的概念,我们先来看看点击率对于一个竞价广告系统而言意味着神马?
我们先来做一道简单的题目——阿迪和耐克作为广告主来竞价,阿迪出2块钱一个点击,耐克出1块钱一个点击,假如微信广告平台有100次曝光,它应该给谁?阿迪还是耐克?有人说,当然是给阿迪啊,它出的价钱高。
这个答案是不对的,如果阿迪的点击率为1%,耐克的点击率为5%,那么给阿迪能产生1个点击,每个点击1块钱,微信能赚2块;给耐克则产生5个点击,每个点击1块,微信能赚5块,广告平台不傻,当然要给耐克!
好,从这个简单的案例中,我们可以看出几点:
广告平台关心自己的流量价值——即自己的流量曝光卖的贵还是便宜,一般用ECPM(earning cost per mille)这个指标来衡量,即每1000次曝光带来收入。广告主一般按点击进行扣费,即广告主通常关心结果,出价原则就看一个点击需要花多少钱。广告平台需要把点击出价转化成ECPM进行扣费和排序。CTR架起了从点击到曝光的一座桥梁,为排序提供基础。总结起来就是一个简单的公式——ECPM=1000*CTR*点击出价,在上面这个案例中阿迪的ECPM=1000*10%*2=20,而耐克的ECPM=1000*5%*1=50,显然耐克的ECPM大于阿迪的,因此耐克会在这次竞价中胜出。
从这个案例中我们可以看到CTR是为广告排序用的,而排序本身就是竞价广告的核心,因此CTR预估也是竞价广告的核心技术之一。
不仅广告系统需要CTR预估来排序,推荐系统也需要CTR预估来排序,因此CTR预估应用其实比我们想象的要更加广泛:
YouTube、亚马逊、今日头条等等涉及到个性化推荐的系统都会应用到CTR预估,即他们要把你最可能点的内容推荐给你。
而广告系统的CTR预估在具体的数值上比推荐系统要求更高,比如推荐系统可能只需要知道A的CTR比B大就可以排序了,而广告由于不是直接用CTR进行排序,还加上了出价,因此广告系统不仅要知道A的CTR比B大,而且还需要知道A的CTR比B的CTR大多少。
二、为什么要进行CTR预估?
到这里大家已经明白CTR的重要性了,即CTR是广告排序的前提,它连接了点击和曝光,这时候大家又会有一个新的问题:那CTR为什么要预估呢?多少投放一点不就知道了它的CTR了吗?
多少投放一点不就知道了它的CTR了吗?”这句话大体上没错,但事情远没有这么简单,我举一个例子你就知道了。
假如广告平台有四个广告主来投广告,这个广告平台总共有4000个用户,这四个广告主分别为卖布娃娃的、卖游戏机的、卖西装的和卖高跟鞋的,出价都是1块钱一个点击。
这时候我们不知道CTR的情况下,我们应该怎么办,于是我们试投了一下,每个广告投了100个曝光,最后发现他们的CTR都是25%,出价一样、CTR一样。
按照我们上面的公式,ECPM就一样,而我们按ECPM来排序,因此我们就没办法排序——每个人ECPM都相同,因此最终就只能在广告平台随机出这四个广告了。
ECPM=1000*CTR*点击出价
但我们回去看一看实际情况,这个25%的点击率是如何发生的我们就能明白总体CTR是不靠谱的,真相是平台总共有4000个用户,而他们均匀分成了四组:
分别是1000为成熟男人;1000成熟女人、1000少女、1000少男,这四个人群只点击他们喜欢的东西,如成熟男人只点击西装,他们对自己喜欢的东西的点击率为100%,对自己不喜欢的点击率为0%,当我们随机投放的时候,每个人的点击率都是25%。
好,现在你看到了,直接拿试投这个点击率去预估导致的结果就是用群体数据代表了个体差异,即当一位成熟男人来请求广告的时候,我们会认为投给他一个布娃娃和投给他一套西装没有任何区别。
因为在试投阶段布娃娃和西装的整体点击率都是25%,尽管实际上他们的点击率有天壤之别,一个是100%、另一个是0%。
因此,当我们通过特征差异能正确地个性化预估CRT的时候,我们才能正确地排序,当一位成熟男人来请求广告的时候,西装这个广告主就会在竞价中胜出,因为我们知道它的CTR100%高于布娃娃、高跟鞋、游戏机的0%。
所以从这个案例中我们就能明白,不能直接笼统地看试投的点击率,而应该有针对性地针对个体单独预估,试投这个阶段依然存在,但我们会通过某个模型用交叉特征地看每一个个体的点击率,从而下一个拥有该特征的人群来访问的时候,我们就能相对更加准确地预估了。
同时,我们也从上面的案例中发现,正确预估提升了CTR,从原来的25%提升到了100%,同样广告平台的收入也会提升,这就是CTR预估的意义。
三、CTR预估是如何进行的?
通过这个案例我们看到,至少有三个特征决定了一个广告的点击率——广告主行业、用户的年龄、用户的性别,事实上,在实际的广告系统中,有无数的因素决定了广告的点击率,我们把这些因素主要分成3类——
第一是广告主侧,比如广告创意、广告的表现形式、广告主行业等,一个劳斯莱斯的广告和一个可口可乐的广告点击率肯定有天壤之别。第二是用户侧,如人群属性,以上的案例是年龄和性别,事实上,决定创意的因素人群属性极其多——年龄、性别、地域、手机型号、WiFi环境、兴趣……..第三是广告平台侧,比如不同的广告位、投放时间、流量分配机制、频次控制策略等。这些决定因素在CTR预估中被称之为特征,而CTR预估的第一步就是特征工程”,即把这些特征找到并数据化。
特征工程是一件复杂的工程,光判断不同特征能否对CTR产生影响就是一个浩大的工程,特征工程的攻城狮们第一步得列出来不同的特征可能对CTR产生影响,这有时候靠直觉,有时候靠经验,
确定了特征之后就需要对这些特征进行处理——即把特征数据化,比如把所有的特征变成0和1的二值化,把连续的特征离散化,把特征的值平滑化、把多个特征向量化…….
以上这一段看不懂?看不懂没关系,你只需要明白,所有的这些特征都会被攻城狮们编码变成一串可计算的数组就行,特征工程是一项重要的基础工作,像今日头条、百度这样的广告平台都有一个庞大的团队来做特征工程的工作。
好,特征工程完成之后就开始建立模型了,很多同学看到模型”二字就开始皱眉头了,没关系,你可以这样理解模型:模型就是一个黑盒子,在盒子的一方我们输入一大堆参数,盒子的另一端就会输入一个CTR的值。
比如我们输入这样的参数:一个高跟鞋广告主、投放给北京地区、年龄20-30岁、对财经感兴趣的女性用户,在周末投放在微信的朋友圈第三位…….请给出一个CTR的值。模型就会根据不同特征的值计算出一个值。
至于它是如何计算的,非技术同学理解起来难度会非常大,我们可以简单理解为CTR是无数特征的一个函数,CTR=f(x1,x2,x3,x4,x5……),而模型就是选择神马样的函数来进预测。
我举个大家最容易理解的线性函数:CTR=ax1+bx2+cX3+dx4+ex5……(这只是一个假设,实际上模型要比这个复杂N多倍)。
每一个函数都有相应的参数( 比如刚刚案例中的a、 b、c、d),而这些参数是如何确定的呢,就需要历史数据进行训练,就是把已经知道的一些数据去喂这个模型,模型根据这些数据不断地调整参数,喂的越多调教的就越准确,最终预测的效果也就越好。
在所有的这些特征中,有些特征影响因子会大一些,有一些会小一些,比如搜索广告中,搜索关键词和广告关键词匹配程度就是一个影响因子极大的因子、历史CTR也是一个影响因子极大的因子,其他因子会有不同程度上的影响。
工程师们每天的工作就是尝试新特征、尝试新模型、训练不同的模型参数,以便让CTR预估更加准确,谷歌、Facebook、阿里、百度这些公司的工程师已经在这些领域发表了很多篇顶级论文。
四、如何评估CTR预估的效果?
好,接下来的一个问题,如何评估CTR预估的效果?工程师们会有特定的指标去衡量效果,对于非技术同学,有人会直观地说,那当然是看CTR有没有变高啊:
正确预估CTR不就是为了把真正高CTR的广告挑出并展示出来么,错误地预估——把高的CTR低估或把低的CTR高估都会让高的CTR不会排在最前面,从而会降低CTR。
这个说法在推荐系统中是成立的,但在广告系统里是不准确的,因为广告的排序不仅仅是CTR排序,它还综合了出价进行排序,即ECPM进行排序,有时候CTR预估准确,反而(实际)CTR会降,我们看一个实际的例子:
这一大堆数字大家可能看不懂,我们只需要明白以下几个逻辑就能看懂了:
广告通过预估ECPM的大小来判断谁胜出,而预估ECPM等于预估CTR*出价,在这个案例中,图一CTR预测正确,阿迪的预测CTR30高于耐克的20因而胜出。广告实际ECPM是胜出者的ECPM,因为广告平台把所有的曝光都给了胜出者,它等于胜出者的实际CTR*出价。图二里把耐克的CTR从2%错误地预估到了4%,导致其预测ECPM高而胜出,而实际上投放出来的CTR为2%。这个情况中,预测正确反而CTR低,预测错误反而CTR高,但是没关系图一预估正确的情况下实际的ECPM30高于图二预测错误ECPM20。所以从这个案例中我们可以看到,从结果指标来看,ECPM是衡量CTR预估最为重要的指标,当然,在实际的实践过程中,CTR预测正确通常ECPM、CTR、收入这些指标通常都会涨。
另外一个很简单的方法就是把预估CTR和真实CRT直接进行对比,由于预估CTR针对每一次广告展示都会预估,比如这一次预估CTR为2%,但单次广告真实CTR只有两个结果,点或不点,即100%、0%,所以看单次结果是没有意义的,我们应该从一个群体来看——
将每一次广告曝光按照预测的CTR从小到大排序,然后按某个单位(比如每10000个曝光)分别统计平均预估CTR和实际CTR,就能知道预测CTR的准确程度了。
以上就是关于竞价广告中CTR预估入门级科普了,广告是一个复杂的系统,里边有无数精妙、有意思的逻辑。
卫夕,微信公众号:卫夕聊广告(ID:weixiads),人人都是产品经理专栏作家。一名兴趣广泛的广告产品经理,致力于用简单语言深度剖析互联网相关的逻辑。
题图来自 Pexels,基于 CC0 协议
继Dior和Chanel之后,LV也到抖音打广告了
圣诞前夕,不少人都在刷抖音时收到了来自Louis Vuitton的祝福。?
12月18日和19日两天,LV一口气在抖音投放了静态、视频开屏页和信息流三种广告,都以圣诞节为主题,点进广告则能导向购买页面。许多用户都不敢相信LV竟然真的到抖音打起了广告,纷纷评论确定是官方吗”、LV还用做广告吗”,也有不少人表示广告拍得太好了”。?
两天下来,LV在抖音投放的广告实现了意想不到的好效果。有消息人士透露,这次投放的视频开屏广告CTR(点击通过率)超过了10%,信息流广告的数据也优于业内平均水平。
在LV之前,还有几个奢侈品牌也曾在抖音进行营销,每家的营销方式都不太一样。?
Dior是最早在抖音开通官方账号的奢侈品牌之一,发布的视频有Angelababy等品牌大使拍摄的宣传片、Dior艺术家系列大片和刚刚举办的东京大秀视频。除此之外施华洛世奇、Bally、Michael Kors、维多利亚的秘密等品牌也都开通了抖音官方蓝V账号。?
Chanel和万宝龙则没有开通官方账号,而是选择在在抖音官方账号@美好映像志上分别发布Chanel J 12腕表和万宝龙Summit 2的宣传视频,通过比较迂回的方式触及用户。由于这两个品牌都是通过抖音官方平台发布视频,能得到抖音更加精准的定位推送,所以它们获得的平均浏览量、点赞数和评论量也高于在官方账号发布视频的品牌。
而像LV这样投放静态、动态和信息流广告的奢侈品牌尚属少数。当然了,不少人可能有疑问:作为一线奢侈品牌的LV,和内容一直被认为有些Low的抖音真的相配吗??
虽然看起来有些突兀,但如果看看抖音的用户数据,也就不会对品牌们的选择感到奇怪。11月时,抖音官方透露其日活用户已突破2亿,月活用户已经超过4亿。抖音的主力用户则在24岁至30岁之间,该年龄段用户占比目前已经超过40%。?
对于奢侈品牌来说,广大的年轻用户正是它们想要贴近的消费群体,毕竟全球的奢侈品消费者都变得越来越年轻。根据贝恩咨询的《2017年全球奢侈品行业研究报告》, 2025年千禧一代与Z世代会占全球个人奢侈品消费额的45%。而中国的奢侈品消费者要更加年轻,波士顿咨询公司(下称BCG)的报告显示中国奢侈品消费群体的68%年龄在18岁至30岁之间。?
除此之外,中国奢侈品消费群体的主要购买路径是线上研究、线下购买(ROPO),BCG的报告显示通过ROPO路径进行的奢侈品消费已占总消费的58%之多。?
这也就意味着,消费者购物欲望的来源变得更加多样。数字时代的消费者很可能因为在微信公众号上看到某个网红发的照片、或者在抖音看到一段视频而产生购买欲望。?
目前几个奢侈品牌在抖音发布的视频或投放的一些广告并不是针对某个商品,而是在讲述品牌的故事,为的就是让消费这品牌产生认同感并了解品牌。即便用户最终并没有购买品牌商品,但对奢侈品牌来说,和潜在消费者建立关系比促成一次购买的意义要更加重大。
如果说此前Dior、Chanel、万宝龙等品牌在抖音进行营销时,还会有一些人认为在抖音做营销和品牌形象极不相符,那么现在就连LV也出手了,还取得了不错的效果,也算得上给其他奢侈品牌吃下一颗定心丸。看来,以后在抖音打广告的奢侈品牌还会越来越多。
想读到更多不一样的时尚新闻,可以试试关注微信公众号穿T恤的女魔头(ID:teedevil2018)”: