• 检索阶段优化实验尝试推全
  • 开始放 RTB 实验
  • 启动新的优化实验(1%)
  • 双十一风险梳理(补充GPR链路相关风险)
  • [ ]


  • 周一
    • 值班:排查问题,review mr
  • 周二
    • 值班:review mr;
    • GPR:
      • Mixer请求采样率明天放到10%
      • 落日志由 nicol 开发
    • 性能优化:
      • tflow monitor 开发中
      • swap 优化,已合并
  • 周三:
    • 性能优化:
      • ReleaseMessage 有坑,实际上是拷贝出去了…得用Unsafe的版本,swap 优化明天上,这个release的操作再想想咋搞
      • tflow monitor 今天合并进去
    • 值班:Review MR
    • 推全优化实验
    • 其他实验放量到5%
    • gpr 放量到 10%
      • 实现跳过adtable查询的逻辑
  • 周四:
    • 周会:
    • 统计优化效果
    • 开启小流量实验
    • gpr
      • 采样放量到20%
      • 支持跳过 adtable fetch state(明天版本单机验证一下后上线)
  • 周五:
    • 组会

  1. Mixer 时延优化,视频号本地时延累计优化11.1ms,31.3ms 20.2ms(+2ms),降低35%: a. Mixer 支持调优 Arena 参数,已推全,视频号优化 1ms b. 数据准备阶段耗时优化实验,已推全,视频号平均耗时优化 2.8ms,优化来源:Retrieval请求避免拷贝、Datahub 回包并行解压 & 反序列化、Adx Retrieval Request 并行构造 c. 检索阶段耗时优化,非联盟已推全,优化 2.7ms(受CPU上涨影响,需要暂停实验后重新评估),优化来源:GenDpaTargetingState 异步化,mixer topn list 异步构造 d. 精排阶段耗时优化: 断流字段填充逻辑下线 0.1% 实验验证中;Ranking 请求级别字段异步构造 & GenericSwap 优化开发完成待启动实验

  2. Mixer 成本优化 a. SetUserRealtimeBehaviorLastOccurrenceTimeV2 推动下线,20%实验中(视频号预计降低2% CPU) b. ReportMonitorOp 切换 tflow 监控sdk,初步看有2%左右CPU优化,待启动实验

  3. GPR a. Mixer 视频号提高采样率至 50% b. GPR 仿真环境支持跳过adtable远端表查询,CPU预期降低50%(16%8%)、xstore访问次数从10w降低到300左右,支持仿真采样率提高放量