认识商业化体系

计算广告逻辑与挑战:六大算法问题

商业化体系大闭环

广告点击以后,就从媒体网站到了广告主的网站上。

计算广告的核心挑战

  • 计算广告的核心问题,是为一系列用户与环境的组合,找到最合适的广告投放策略以优化整体广告活动的利润。
  • 优化问题描述:
    $$\max \limits_{a_{1},…,T}\sum_{i=1}^{T}{r(a_{i},u_{i},c_{i}) - q(a_{i},u_{i},c_{i})} \ s.t.\sum_{i=1}^{T}d(a_{i},u_{i},c_{i},k) \leqslant D_{k},\forall k$$
    • 决策对象:一组广告展示,a:广告,u:用户,c:上下文,r:收入(eCPM),q:成本
    • 这个公式是一个普适性的公式,适合于广告主、媒体、ADX等等~
    • 优化的是一组广告的投放,后面预算的约束。

广告业务的转化漏斗和目标

  • 展示页–点击–>落地页–转化–>转化页

    • 从媒体网站到广告主网站
    • 广告排序的唯一指标:u代表点击率,v代表转化率
      $$eCPM=r(a,u,c)=u(a,u,c)*v(a,u)$$
  • 如果标识一个用户?

    • PC Web/Mobile Web环境 – Cookie:存续行差,跨域时需要映射。
    • iOS应用 – IDFA:存续性好于cookie,但iOS10有更严格的政策。
    • Android应用 – Android ID:存续性好于IDFA;IMEI:在中国有部分使用。
    • 无以上ID场景 – FingerPrint(IP+User Agent):存在http头中,可作缺省标识。
  • 商业化体系六大算法问题

    • A1.特征提取:受众定向
    • A2.微观优化:eCPM估计
    • A3.宏观优化:机制设计
    • A4.受限优化:在线分配
    • A5.强化学习:探索与利用
    • A6.重定向:个性化推荐
  • 用户决策的转化漏斗模型

    • 【选择】曝光(exposure)1.1主要取决于广告位的天然属性。
    • 【选择】关注(attention)2.1不要干扰或者打断用户的任务;2.2明确揭示推荐的原因;2.3符合用户兴趣或者需求。
    • 【解释】理解(comprehension)3.1广告在用户能理解的兴趣范围;3.2与关注程度相匹配的理解门槛。
    • 【解释】信息接收(message acceptance)4.1广告商/广告认可度;4.2广告位认可度
    • 【态度】保持(retention)5.1艺术性带来的记忆效果
    • 【态度】购买(purchase)6.1在用户的价格敏感接收范围内

在线广告主要结算方式详解

结算方式 点击率估计/点击价值估计 优缺点 使用场景
CPT 需求方 1.可以充分发挥橱窗效应。
2.无法利用受众定向技术
高曝光的品牌广告
CPM 需求方 1.可以利用受众定向选择目标人群。
2.合约售卖下,受众划分不能过细。
1.有受众选择需求的品牌广告
2.实时竞价广告交易
CPC 供给方/需求方 1.可以非常精细地划分受众人群。
2.比较合理的供给方和需求方分工.
竞价广告网络
CPS 供给方 1.需求方无任何风险。
2.供给方运营难度加大.
1.效果类广告联盟
2.效果类DSP

CPA/CPS的问题与合理场景

  • 存在的问题
    • 由供给方同时负责优化点击和转化率,并非普适的合理模式
    • 存在劫持、代销等多种相应的灰色手段
    • 用于优化的数据对于单个广告主来说严重不足
  • 适用的场景
    • 转化过程一致且规范的广告市场
    • 例:淘宝客(转化流程为淘宝统一提供)、APP下载(转化流程在Apple Store或Google Play)
    • 在大多数场景下,CPC可能更合理

商业化产品体系概览:六大产品问题

  • 商业产品设计运营原则

    • 商业产品,即面向产品客户而非一般用户的产品,其中最典型的代表就是广告产品。
    • 相对于产品功能,要特别关注产品中的策略部分。
    • 要特别关注数据,让运营和产品优化形成闭环。所有产品特征和策略的成功与否,要严格根据数据的反馈来判断。
    • 优化的是确定的商业目标,而非使用便捷性。
  • 商业化体系六大产品问题

    • P1.供需接口
    • P2.竞价机制
    • P3.数据运营
    • P4.标签体系
    • P5.程序化交易
    • P6.原生广告
  • 需求方层级组织

    • 广告主–>广告计划–>广告组–>广告创意.
    • 广告活动(Campaign)概念上对应于广告主的一次投放合同,其中包括了预算、时间范围等基本信息。
    • 广告组(Ad Group)对于于一个具体的广告投放策略,主要是设定受众定向条件和出价。
    • 广告创意(Creative)则是最终展示出来的素材,可能在同一个组策略下有不同尺寸的创意存在。

商业化产品系统框架:六大系统技术

  • 个性化系统一般框架: 主要组成模块

    • 【受众定向平台】分布式计算平台:灵活的海量数据挖掘平台,机器学习算法的分布式架构
    • 【高并发投送系统】在线投放引擎:十毫秒级别的实时决策,百亿次/天的投放系统
    • 【流式计算平台】流计算平台:日志的准实时挖掘和反馈
    • 【数据高速公路】数据高速公路:内部及外部TB级数据实时收集
  • Web-scale技术问题比较

    搜索搜索广告显示广告个性化推荐
    主要准则相关性利润用户兴趣
    其他目标垂直领域决定质量、安全性多样性、新鲜度
    索引规模十亿级百万/千万级千万级百万级 亿级
    个性化较少的个性化需求亿级规模用户上的个性化
    检索信号较明确较分散
    DownStream优化不适用适用
  • 广告系统有什么特点?

    • 高并发、低延迟的要求 – 同时关注QPS和Latency
    • 数据处理的规模很大 – (用户、环境、信息)三元组上的数据建模
    • 数据处理的速度优于精度
    • 主流程的一致性要求不高
  • 广告系统有什么设计原则?
    • 建立弱一致性系统的设计思维方式。 – 例:Near-line page fetcher
    • 大量数据尽量环形单向流动。– 避免集中读写形成的单点性能瓶颈
    • 在线时不要发生与关系行数据库的交互 – 增删改查的传统需求实际上不存在
    • 充分利用开源社区的成熟技术
  • 开源软件的优势与顾虑
    • 优势 - 1.大量细分使用场景都有开源方案. 2.大型互联网公司的开源产品经过充分测试.
    • 顾虑 - 1.需要仔细甄别好的和不太好的开源项目. 2.在遇到深层次bug时无能为力.
    • 核心业务逻辑不应该是选择开源.
  • 商业化产品六大系统技术
    • S1.流量接入:代码和SDK
    • S2.投放引擎:高并发服务
    • S3.侯选查询:实施索引
    • S4.特征存储:No-sql数据库
    • S5.离线学习:分布式计算
    • S6.在线学习:流式计算