计算广告|2.认识商业体系

计算广告逻辑与挑战:六大算法问题

商业化体系大闭环

广告点击以后,就从媒体网站到了广告主的网站上。
商业化体系大闭环

计算广告的核心挑战

计算广告的核心问题,是为一系列用户与环境的组合,找到最合适的广告投放策略以优化整体广告活动的利润。

优化问题描述:

maxa1,...,Ti=1Tr(ai,ui,ci)q(ai,ui,ci)s.t.i=1Td(ai,ui,ci,k)Dk,k\begin{aligned} \max \limits_{a_{1},...,T}\sum_{i=1}^{T}{r(a_{i},u_{i},c_{i}) - q(a_{i},u_{i},c_{i})} \\ s.t.\sum_{i=1}^{T}d(a_{i},u_{i},c_{i},k) \leqslant D_{k},\forall k \end{aligned}

  • 决策对象:一组广告展示,a:广告,u:用户,c:上下文,r:收入(eCPM),q:成本
  • 这个公式是一个普适性的公式,适合于广告主、媒体、ADX等等~
  • 优化的是一组广告的投放,后面预算的约束。

广告业务的转化漏斗和目标

展示页–点击–>落地页–转化–>转化页

  • 从媒体网站到广告主网站
  • 广告排序的唯一指标:u代表点击率,v代表转化率

eCPM=r(a,u,c)=u(a,u,c)v(a,u)eCPM=r(a,u,c)=u(a,u,c)*v(a,u)

如果标识一个用户?

  • PC Web/Mobile Web环境 – Cookie:存续行差,跨域时需要映射。
  • iOS应用 – IDFA:存续性好于cookie,但iOS10有更严格的政策。
  • Android应用 – Android ID:存续性好于IDFA;IMEI:在中国有部分使用。
  • 无以上ID场景 – FingerPrint(IP+User Agent):存在http头中,可作缺省标识。

商业化体系六大算法问题

  • A1.特征提取:受众定向
  • A2.微观优化:eCPM估计
  • A3.宏观优化:机制设计
  • A4.受限优化:在线分配
  • A5.强化学习:探索与利用
  • A6.重定向:个性化推荐

用户决策的转化漏斗模型

  • 【选择】曝光(exposure)1.1主要取决于广告位的天然属性。
  • 【选择】关注(attention)2.1不要干扰或者打断用户的任务;2.2明确揭示推荐的原因;2.3符合用户兴趣或者需求。
  • 【解释】理解(comprehension)3.1广告在用户能理解的兴趣范围;3.2与关注程度相匹配的理解门槛。
  • 【解释】信息接收(message acceptance)4.1广告商/广告认可度;4.2广告位认可度
  • 【态度】保持(retention)5.1艺术性带来的记忆效果
  • 【态度】购买(purchase)6.1在用户的价格敏感接收范围内

在线广告主要结算方式详解

结算方式 点击率估计/点击价值估计 优缺点 使用场景
CPT 需求方 1.可以充分发挥橱窗效应。
2.无法利用受众定向技术
高曝光的品牌广告
CPM 需求方 1.可以利用受众定向选择目标人群。
2.合约售卖下,受众划分不能过细。
1.有受众选择需求的品牌广告
2.实时竞价广告交易
CPC 供给方/需求方 1.可以非常精细地划分受众人群。
2.比较合理的供给方和需求方分工.
竞价广告网络
CPS 供给方 1.需求方无任何风险。
2.供给方运营难度加大.
1.效果类广告联盟
2.效果类DSP

CPA/CPS的问题与合理场景

存在的问题

  • 由供给方同时负责优化点击和转化率,并非普适的合理模式
  • 存在劫持、代销等多种相应的灰色手段
  • 用于优化的数据对于单个广告主来说严重不足

适用的场景

  • 转化过程一致且规范的广告市场
  • 例:淘宝客(转化流程为淘宝统一提供)、APP下载(转化流程在Apple Store或Google Play)
  • 在大多数场景下,CPC可能更合理

商业化产品体系概览:六大产品问题

商业产品设计运营原则

  • 商业产品,即面向产品客户而非一般用户的产品,其中最典型的代表就是广告产品。
  • 相对于产品功能,要特别关注产品中的策略部分。
  • 要特别关注数据,让运营和产品优化形成闭环。所有产品特征和策略的成功与否,要严格根据数据的反馈来判断。
  • 优化的是确定的商业目标,而非使用便捷性。

商业化体系六大产品问题

  • P1.供需接口
  • P2.竞价机制
  • P3.数据运营
  • P4.标签体系
  • P5.程序化交易
  • P6.原生广告

需求方层级组织

  • 广告主–>广告计划–>广告组–>广告创意.
  • 广告活动(Campaign)概念上对应于广告主的一次投放合同,其中包括了预算、时间范围等基本信息。
  • 广告组(Ad Group)对于于一个具体的广告投放策略,主要是设定受众定向条件和出价。
  • 广告创意(Creative)则是最终展示出来的素材,可能在同一个组策略下有不同尺寸的创意存在。

商业化产品系统框架:六大系统技术

个性化系统一般框架: 主要组成模块

  • 【受众定向平台】分布式计算平台:灵活的海量数据挖掘平台,机器学习算法的分布式架构
  • 【高并发投送系统】在线投放引擎:十毫秒级别的实时决策,百亿次/天的投放系统
  • 【流式计算平台】流计算平台:日志的准实时挖掘和反馈
  • 【数据高速公路】数据高速公路:内部及外部TB级数据实时收集

Web-scale技术问题比较

搜索搜索广告显示广告个性化推荐
主要准则相关性利润用户兴趣
其他目标垂直领域决定质量、安全性多样性、新鲜度
索引规模十亿级百万/千万级千万级百万级 亿级
个性化较少的个性化需求亿级规模用户上的个性化
检索信号较明确较分散
DownStream优化不适用适用

广告系统有什么特点?

  • 高并发、低延迟的要求 – 同时关注QPS和Latency
  • 数据处理的规模很大 – (用户、环境、信息)三元组上的数据建模
  • 数据处理的速度优于精度
  • 主流程的一致性要求不高

广告系统有什么设计原则?

  • 建立弱一致性系统的设计思维方式。 – 例:Near-line page fetcher
  • 大量数据尽量环形单向流动。-- 避免集中读写形成的单点性能瓶颈
  • 在线时不要发生与关系行数据库的交互 – 增删改查的传统需求实际上不存在
  • 充分利用开源社区的成熟技术

开源软件的优势与顾虑

  • 优势 - 1.大量细分使用场景都有开源方案. 2.大型互联网公司的开源产品经过充分测试.
  • 顾虑 - 1.需要仔细甄别好的和不太好的开源项目. 2.在遇到深层次bug时无能为力.
  • 核心业务逻辑不应该是选择开源.

商业化产品六大系统技术

  • S1.流量接入:代码和SDK
  • S2.投放引擎:高并发服务
  • S3.侯选查询:实施索引
  • S4.特征存储:No-sql数据库
  • S5.离线学习:分布式计算
  • S6.在线学习:流式计算

本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!