OliVe: Accelerating Large Language Models via Hardware-friendly Outlier-Victim Pair Quantization
Guo, Cong ; Tang, Jiaming ; Hu, Weiming ; Leng, Jingwen ; Zhang, Chen ; Yang, Fan ; Liu, Yunxin ; Guo, Minyi ; Zhu, Yuhao
Proceedings of the 50th Annual International Symposium on Computer Architecture, 2023, p.1-15
New York, NY, USA: ACM
Sem texto completo
- Buscando por
- emscope:(USP_VIDEOS),scope:("PRIMO"),scope:(USP_FISICO),scope:(USP_EREVISTAS),scope:(USP),scope:(USP_EBOOKS),scope:(USP_PRODUCAO),primo_central_multiple_fe
- Mostrar o que foi encontrado até o momento