5分钟,带你了解程序化广告的运作流程
如今,广告行业呈现出向移动互联网靠拢的趋势,先是广告学中的千人千面”的概念提出,再到如今的程序化广告进程,精准度成为了如今广告行业衡量投放效果的一大指标。
本文将从程序化广告说起,通过介绍程序化广告,一览如今广告行业发展的总体趋势。
一、什么是程序化广告?程序化广告(Programmatic Advertising)是指广告主通过数字平台,从受众匹配的角度由程序自动化完成展示类广告的采买和投放,并实时反馈投放分析的一种广告投放方式,实现了整个数字广告的自动化。
举个例子:
A,一名互联网公司的男程序员,30岁。当他打开今日头条时,他发现广告页中显示的是一个跟脱发、增发”的广告。
B,一名职场女性,24岁。同样在打开今日头条时,她发现给她推荐的则是一款刚刚出新品的SK-II神仙水”广告。
所谓的精准投放”,便是针对用户的基本信息进行相关的广告推送。正如上面例子一样,一名30岁的男程序员在高压的工作下很有可能会面临脱发的风险,因此他便是是脱发广告主的首选投放对象。而相比之下,24岁的职场女性更加在意自己的外貌打扮,SK-II神仙水的广告主或许认为推荐护肤品给她是一个不错的选择。
从定义中,我们可以分解出几个具体的词进行讨论:
1. 数字平台通过DSP和AD Exchange撮合广告。
DSP又称需求方平台, 该平台汇集了各种广告交易平台、广告网络、供应方平台,甚至媒体的库存。有了这一平台,就不需要再出现另一个繁琐的购买步骤——购买请求。
而AD Exchange则是一个开放的、能够将媒体主和广告商联系在一起的在线广告市场(类似于股票交易所)。
DSP与AD Exchange的关系,如同买菜的人(DSP)在菜市场(AD Exchange)里寻找摆摊的菜贩子一样。
2. 受众角度购买的是受众,而不是广告位,广告的策略是从受众匹配的角度出发。
千人千面”的精准投放要求需要广告主以用户为中心,定位目标人群。广告位对于精准投放来说只是一个次要条件,广告主所关心的是自己的广告是否能投给对”的人。
3. 程序自动化程序自动化,根据媒体主提供的信息,依据广告策略和算法自动完成出价,返回都是毫秒级别。
就像你突然点开一个APP弹出的广告一样,在你打开的那一瞬间,程序化广告的运作已经完成了。这中间包括了许多工序:用户将信息传给供应方平台(SSP),供应方平台再将信息迅速发给需求方平台(DSP),需求方平台做出竞价选择,最后通过竞价结果将广告返回给用户。这些过程一共不超过1s。
为了让大家更好地理解,以下便是程序化广告运作的一个基本流程图:
二、程序化广告的优势精准是程序化广告投放的一个大优势。
在先前传统的互联网广告中,广告主购买的是广告位,而现在程序化广告购买的是人”,是被贴上了各种定向标签的目标人群。这些标签可能是用户的设备型号、使用时间、兴趣爱好等不同的组合。
精准度的提升意味着更接近广告的目标人群,向这些目标人群投放广告,避免了广告主将资金花费在非目标用户上,从而造成不必要的成本浪费。
三、品牌方如何投放程序化广告?品牌方在程序化广告投放中最关注的话题有:
品牌广告考核指标有哪些?如何保障品牌安全?如何实现透明程序化?品牌广告第三方技术服务供应商都有哪些?RTB+PDB与传统投放相比有什么优势? 1. 品牌广告考核指标品牌广告的KPI评估主要围绕广告效果、成本收益和投放保障三大方面。
(1)广告效果:衡量用户活跃度和对广告的接受度。从广告效果的层次来说,传播效果可以用广告曝光维度衡量;心理效果一般很难直接评估,但是可以通过用户的行为效果进行衡量;行为效果可以从落地页/网站/APP访问以及用户互动角度进行考核。
(2)成本收益:衡量广告投放整体消耗、各渠道等维度的性价比。
(3)投放保障:一般是衡量广告投放的真实性和安全性,用于保障广告效果以及成本收益。
2. 品牌安全由于品牌广告宣传的是品牌的美誉度,因此对投放环境的要求非常高。比如品牌广告不允许出现在色情网站、敏感时事新闻等媒体上,否则用户可能会对此品牌产生负面印象,严重时还会影响品牌形象。
3. 透明程序化这是目前品牌广告主最关心的一点,透明度跟需求方对供应商的信任度紧密联系着。
例如:宝洁全球宣布给数字营销费用加以限制条件——采用MRC广告可见性标准。这要求着平台必须支持第三方验证,并向透明的代理合同”迈进,加之合作伙伴必须获得TAG(Trustworthy Accountability Group)认可。
由此可见,透明程序化将成为品牌程序化广告购买的大趋势。进行程序化广告投放时,应在不同环节采取相应的透明措施。
4. 第三方技术服务供应商常见的广告服务和数据管理的供应商表格如下。其中,秒针、AdMaster、Adobe属于专业监测服务公司;艾瑞、DCCI、尼尔森属于第三方调研公司。
(图片来自执牛耳传媒)
5. RTB+PDB与传统投放相比有什么优势?品牌广告主一般有排期购买优质流量和控制预算的需求,RTB和PDB各有优点和缺点:
RTB可以随时挑量,但是买的是库存流量,价格、质量以及能买到的展示量级都无法确保;PDB可以采购优先流量,确保排期,但是有限的订单流量可能无法满足投放KPI。因此,很多时候需要RTB和PDB结合投放,保持优势的前提下,还可以互补不足。
综上所述,程序化广告的出现打破了以往传统广告的限制,真正实现了广告千人千面”的精准投放。
那么,如何继续地深入程序化广告生态,优化广告投放方案呢?
下一篇文章我将会给出答案。
本文由 @8823 原创发布于人人都是产品经理。未经许可,禁止转载
计算广告中常用的几种方法
1.CTR预估CTR预估是计算广告中最核心的算法之一,那么CTR预估是指什么呢?简单来说,CTR预估是对每次广告的点击情况做出预测,预测用户是点击还是不点击。具体定义可以参考 CTR. CTR预估和很多因素相关,比如历史点击率、广告位置、时间、用户等。CTR预估模型就是综合考虑各种因素、特征,在大量历史数据上训练得到的模型。CTR预估的训练样本一般从历史log、离线特征库获得。样本标签相对容易,用户点击标记为1,没有点击标记为0. 特征则会考虑很多,例如用户的人口学特征、广告自身特征、广告展示特征等。这些特征中会用到很多类别特征,例如用户所属职业、广告展示的IP地址等。一般对于类别特征会采样One-Hot编码,例如职业有三种:学生、白领、工人,那么会会用一个长度为3的向量分别表示他们:[1, 0, 0]、[0, 1, 0]、[0, 0, 1]. 可以这样会使得特征维度扩展很大,同时特征会非常稀疏。目前很多公司的广告特征库都是上亿级别的。
2.DNN深度神经网络(DNN)近年来在图像、语音、自然语言等领域大放异彩,特别是在图像分类、语音识别、机器翻译方面DNN已经超过人,精度已经达到商业应用程度。不过,DNN在CTR预估这种场景的应用却仍在摸索中。图像、语言、自然语言领域的数据一般是连续的,局部之间存在某些结构。比如,图像的局部与其周围存在着紧密的联系;语音和文字的前后存在强相关性。但是CTR预估的数据如前面介绍,是非常离散的,特征前后之间的关系很多是我们排列的结果,并非本身是相互联系的。
3.EmbedingNeural Network是典型的连续值模型,而CTR预估的输入更多时候是离散特征,因此一个自然的想法就是如何将将离散特征转换为连续特征。如果你对词向量模型熟悉的话,可以发现之间的共通点。在自然语言处理(NLP)中,为了将自然语言交给机器学习中的算法来处理,通常需要首先将语言数学化,词向量就是用来将语言中的词进行数学化的一种方式。
一种最简单的词向量方式是one-hot,但这么做不能很好的刻画词之间的关系(例如相似性),另外数据规模会非常大,带来维度灾难。因此Embeding的方法被提出,基本思路是将词都映射成一个固定长度的向量(向量大小远小于one-hot编码向量大些),向量中元素不再是只有一位是1,而是每一位都有值。将所有词向量放在一起就是一个词向量空间,这样就可以表达词之间的关系,同时达到降维的效果。
既然Embeding可以将离散的词表达成连续值的词向量,那么对于CTR中的类别特征也可以使用Embeding得到连续值向量,再和其他连续值特征构成NN的输入。下图就是这种思路的表达。
因此问题的关键就是采用何种Embeding技术将离线特征转换到离线空间。
3.1 FM Embeding
Factorization Machine是近年来在推荐、CTR预估中常用的一种算法,该算法在LR的基础上考虑交叉项,如下面公式所示:
FM在后半部分的交叉项中为每个特征都分配一个特征向量V,这其实可以看作是一种Embeding的方法。Dr.Zhang在文献[1]中提出一种利用FM得到特征的embeding向量并将其组合成dense real层作为DNN的输入的模型,FNN。FNN模型的具体设计如下:
Dr.Zhang在模型中做了一个假设,就是每个category field只有一个值为1,也就是每个field是个one-hot表达向量。field是指特征的种类,例如将特征occupation one-hot之后是三维向量,但这个向量都属于一个field,就是occupation。这样虽然离散化后的特征有几亿,但是category field一般是几十到几百。 模型得到每个特征的Embeding向量后,将特征归纳到其属于field,得到向量z,z的大小就是1+#fields * #embeding 。z是一个固定长度的向量之后再在上面加入多个隐藏层最终得到FNN模型。
Dr.Zhang在FNN模型的基础上又提出了下面的新模型PNN. PNN和FNN的主要不同在于除了得到z向量,还增加了一个p向量,即Product向量。Product向量由每个category field的feature vector做inner product 或则 outer product 得到,作者认为这样做有助于特征交叉。另外PNN中Embeding层不再由FM生成,可以在整个网络中训练得到。
3.2 NN Embeding
Google团队最近提出Wide and Deep Model。在他们的模型中,Wide Models其实就是LR模型,输入原始的特征和一些交叉组合特征;Deep Models通过Embeding层将稀疏的特征转换为稠密的特征,再使用DNN。最后将两个模型Join得到整个大模型,他们认为模型具有memorization and generalization特性。 Wide and Deep Model中原始特征既可以是category,也可以是continue,这样更符合一般的场景。另外Embeding层是将每个category特征分别映射到embeding size的向量,如他们在TensorFlow代码中所示:
deep_columns = [
tf.contrib.layers.embedding_column(workclass, dimension=8),
tf.contrib.layers.embedding_column(education, dimension=8),
tf.contrib.layers.embedding_column(gender, dimension=8),
tf.contrib.layers.embedding_column(relationship, dimension=8),
tf.contrib.layers.embedding_column(native_country, dimension=8),
tf.contrib.layers.embedding_column(occupation, dimension=8),
age, education_num, capital_gain, capital_loss, hours_per_week]
4.结合图像目前很多在线广告都是图片形式的,文献[4]提出将图像也做为特征的输入。这样原始特征就分为两类,图像部分使用CNN,非图像部分使用NN处理。 其实这篇文章并没有太多新颖的方法,只能说多了一种特征。对于非图像特征,作者直接使用全连接神经网络,并没有使用Embeding。
5.CNNCNN用于提取局部特征,在图像、NLP都取得不错的效果,如果在CTR预估中使用却是个难题。我认为最大的困难时如何构建对一个样本构建如图像那样的矩阵,能够具有局部联系和结构。如果不能构造这样的矩阵,使用CNN是没有什么意思的。 文献[5]是发表在CIKM2015的一篇短文,文章提出对使用CNN来进行CTR预估进行了尝试。 一条广告展示(single ad impression)包括:element = (user; query; ad, impression time, site category, device type, etc) 用户是否点击一个广告与用户的历史ad impression有关。这样,一个样本将会是(s, label) ,s由多条l组成(数目不定)
作者提出CCPM模型处理这样的数据。每个样本有n个element,对每个element使用embeding 得到定长为d的向量ei∈Rdei∈Rd,再构造成一个矩阵s∈Rd?ns∈Rd?n,得到s矩阵之后就可以套用CNN,后面的其实没有太多创新点。
6.RNN考虑搜索场景下的CTR预估,如果考虑历史信息,如可以将一个用户的历史ad impression构成一个时间序列。RNN非常适合时间序列的场景,如语言建模等。这篇 发表在AAAI2014将RNN模型引入CTR预估。作者首先在数据集上验证了用户的点击行为与之前的ad impression历史有关联:
如果用户在之前的impression很快离开广告页面,那么将会在接下来一段时间内不会点击类似的广告。如果用户最近有过与广告相关的查询,那么接下来点击相关广告的可能性会大幅提升。
前面的两种行为还可能随着间隔时间的增加而不是那么相关。当前关联不止这些,而且人工难以刻画,需要模型来自动提取。RNN模型对此类问题非常适用,作者的主要工作是将数据集构造成适合RNN的输入(即对用户的历史ad impression根据时间排序),对模型本身并没有改进。
参考文献
1.Deep Learning over Multi-field Categorical Data – A Case Study on User Response Prediction
2.Product-based Neural Networks for User Response Prediction
3.Wide & Deep Learning for Recommender Systems
4.Deep CTR Prediction in Display Advertising
5.A Convolutional Click Prediction Model
最后,给大家推荐一个我平时在用的机器学习交流社区——八斗问答”(微信小程序搜索)。围绕深度学习、机器学习等主题展开,有很多高校教授、博士生、工程师入驻,免费在线解答疑惑。