而初赛的题目则是「城市突发拥堵应急调度AI算法设计」,这是一个很常见的使用场景。
题目要求在30天历史卡口数据和实时事故流的约束下,同时兼顾拥堵预判精度丶应急调度时延与系统容错率。
王东虽然没打过竞赛,但他可是经受过高三高强度的考试训练,做题他还是很有心得的。
明眼人都看得出来,拥堵预判精度丶应急调度时延与系统容错率,这三个核心指标就是初赛评比的关键。
也就是说设计的算法要围绕这三个指标展开,最后算法测试的指标数据高低,就是能否晋级的关键。
果然,苏瑜然她们就是这样设计的算法。
用了一下午时间,王东才从头到尾细细地研读完苏瑜然她们的初赛答案。
从最后附上的算法测试结果来看,这是一个完成度很高的算法。
不仅筛掉了99%的冗余变量,算子融合与模型量化把推理时延压到了82ms,甚至预判精度冲到了98.7%,容错率稳在0.17%。
对于通过初赛来说,完全是绰绰有余了,甚至可以说是降维打击。
然而在拥有【数学逻辑】和【图灵测试】的王东眼里,却还是有可以优化的地方。
这套算法设计的核心架构在于全局加权时空交叉注意力和双路冗余推理分支,就是这两个模块才将整套算法的精度和容错率拉到如此高的水平。
然而设计者却忽略了关键一点。
全局加权确实能够提高整体的精度,但突发事故是典型的长尾分布。
使用全局权重会把极端事件的特徵稀释,即便后面为了弥补这部分精度,又加了三层正则化。
但边缘场景的拟合度却反而被拉低了,过拟合和风险全藏在了测试集没覆盖的极端工况里。
而双路冗余,为了满足容错率选择了全程双路并行,但应急场景里94%的常规工况,单路推理的容错率完全可以达标,全程双路只会平白增加时延。
虽然都是一些微不足道的小点,但修改之后可能会让算法整体更上一个层次。
尽管即便不加以修改,这份算法也足可以通过初赛,王东还是在文档里留言了自己的思路。