- 检索阶段优化实验尝试推全
- 开始放 RTB 实验
- 启动新的优化实验(1%)
- 双十一风险梳理(补充GPR链路相关风险)
- [ ]
值班问题记录
- hdfs 编译问题(UT 单独加环境变量)
- ranking 版本 coredump(配置文件有问题 )
- 周一
- 值班:排查问题,review mr
- 周二
- 值班:review mr;
- GPR:
- Mixer请求采样率明天放到10%
- 落日志由 nicol 开发
- 性能优化:
- tflow monitor 开发中
- swap 优化,已合并
- 周三:
- 性能优化:
- ReleaseMessage 有坑,实际上是拷贝出去了…得用Unsafe的版本,swap 优化明天上,这个release的操作再想想咋搞
- tflow monitor 今天合并进去
- 值班:Review MR
- 推全优化实验
- 其他实验放量到5%
- gpr 放量到 10%
- 实现跳过adtable查询的逻辑
- 性能优化:
- 周四:
- 周会:
- 统计优化效果
- 开启小流量实验
- gpr
- 采样放量到20%
- 支持跳过 adtable fetch state(明天版本单机验证一下后上线)
- 周五:
- 组会
-
Mixer 时延优化,视频号本地时延累计优化11.1ms,31.3ms → 20.2ms(+2ms),降低35%: a. Mixer 支持调优 Arena 参数,已推全,视频号优化 1ms b. 数据准备阶段耗时优化实验,已推全,视频号平均耗时优化 2.8ms,优化来源:Retrieval请求避免拷贝、Datahub 回包并行解压 & 反序列化、Adx Retrieval Request 并行构造 c. 检索阶段耗时优化,非联盟已推全,优化 2.7ms(受CPU上涨影响,需要暂停实验后重新评估),优化来源:GenDpaTargetingState 异步化,mixer topn list 异步构造 d. 精排阶段耗时优化: 断流字段填充逻辑下线 0.1% 实验验证中;Ranking 请求级别字段异步构造 & GenericSwap 优化开发完成待启动实验
-
Mixer 成本优化 a. SetUserRealtimeBehaviorLastOccurrenceTimeV2 推动下线,20%实验中(视频号预计降低2% CPU) b. ReportMonitorOp 切换 tflow 监控sdk,初步看有2%左右CPU优化,待启动实验
-
GPR a. Mixer 视频号提高采样率至 50% b. GPR 仿真环境支持跳过adtable远端表查询,CPU预期降低50%(16%→8%)、xstore访问次数从10w降低到300左右,支持仿真采样率提高放量