周报 - 2025-W41
本周目标
- 优化代码合并
- 两阶段 RankingRtaMerger
- FillNoveltyMap
- 智妍监控
- AsyncWait
- 继续找耗时优化点
- 耗时优化结项梳理
主要工作
- RetrievalRequestBuilder 优化
- 把请求级别的请求构造计算继续前移(每个广告位只需要构造一次,其他就是CopyFrom)
- gdt::mixer::SysInfoBuilder::FillNoveltyFeature(0.39%)
- 实验参数
- UserContextBuilder
- 与 TubiFunctor 并行
- 视频号上没有CPU性能收益,但是union应该有?
- 可以先加一下耗时监控
- 把请求级别的请求构造计算继续前移(每个广告位只需要构造一次,其他就是CopyFrom)
TubiFunctor 好像也挺耗时的- RetrievalProxyTask pack_cost 0.7ms
- 初步看是原始请求比较大(500k)
思考总结
-
Mixer 时延优化,视频号本地时延累计优化11.6ms,31.3ms → 19.7ms(+2.5ms),降低37%: a. Mixer 支持调优 Arena 参数,已推全,视频号优化 1ms b. 数据准备阶段耗时优化实验,已推全,视频号平均耗时优化 2.8ms,优化来源:Retrieval请求避免拷贝、Datahub 回包并行解压 & 反序列化、Adx Retrieval Request 并行构造 c. 检索阶段耗时优化,非联盟已推全,优化 2.5ms(受CPU上涨影响,需要暂停实验后重新评估),优化来源:GenDpaTargetingState 异步化,mixer topn list 异步构造 d. 精排阶段耗时优化: 断流字段填充逻辑下线 0.1% 实验验证中;Ranking 请求级别字段异步构造 & GenericSwap 优化开发完成待启动实验
-
Mixer 成本优化 a. SetUserRealtimeBehaviorLastOccurrenceTimeV2 推动下线,20%实验中(视频号预计降低2% CPU) b. ReportMonitorOp 切换 tflow 监控sdk,初步看有2%左右CPU优化,待启动实验
-
GPR a. Mixer 视频号提高采样率至 50% b. GPR 仿真环境支持跳过adtable远端表查询,CPU预期降低50%(16%→8%)、xstore访问次数从10w降低到300左右,支持仿真采样率提高放量
-
值班
下周计划
- 梳理 mixer、preranking、display 剩余耗时优化点
- mixer 耗时优化项目梳理
- [ ]