周报 - 2025-W41

本周目标

  • 优化代码合并
    • 两阶段 RankingRtaMerger
    • FillNoveltyMap
    • 智妍监控
    • AsyncWait
  • 继续找耗时优化点
  • 耗时优化结项梳理

主要工作

202510101029 耗时优化(还差4ms左右)

  • RetrievalRequestBuilder 优化
    • 把请求级别的请求构造计算继续前移(每个广告位只需要构造一次,其他就是CopyFrom)
      • gdt::mixer::SysInfoBuilder::FillNoveltyFeature(0.39%)
      • 实验参数
      • UserContextBuilder
      • 与 TubiFunctor 并行
      • 视频号上没有CPU性能收益,但是union应该有?
    • 可以先加一下耗时监控
  • TubiFunctor 好像也挺耗时的
  • RetrievalProxyTask pack_cost 0.7ms
    • 初步看是原始请求比较大(500k)

思考总结

  1. Mixer 时延优化,视频号本地时延累计优化11.6ms,31.3ms 19.7ms(+2.5ms),降低37%: a. Mixer 支持调优 Arena 参数,已推全,视频号优化 1ms b. 数据准备阶段耗时优化实验,已推全,视频号平均耗时优化 2.8ms,优化来源:Retrieval请求避免拷贝、Datahub 回包并行解压 & 反序列化、Adx Retrieval Request 并行构造 c. 检索阶段耗时优化,非联盟已推全,优化 2.5ms(受CPU上涨影响,需要暂停实验后重新评估),优化来源:GenDpaTargetingState 异步化,mixer topn list 异步构造 d. 精排阶段耗时优化: 断流字段填充逻辑下线 0.1% 实验验证中;Ranking 请求级别字段异步构造 & GenericSwap 优化开发完成待启动实验

  2. Mixer 成本优化 a. SetUserRealtimeBehaviorLastOccurrenceTimeV2 推动下线,20%实验中(视频号预计降低2% CPU) b. ReportMonitorOp 切换 tflow 监控sdk,初步看有2%左右CPU优化,待启动实验

  3. GPR a. Mixer 视频号提高采样率至 50% b. GPR 仿真环境支持跳过adtable远端表查询,CPU预期降低50%(16%8%)、xstore访问次数从10w降低到300左右,支持仿真采样率提高放量

  4. 值班

下周计划

  • 梳理 mixer、preranking、display 剩余耗时优化点
  • mixer 耗时优化项目梳理
  • [ ]

相关周报: 2025-W40 | 2025-W42