量子化
りょうしか
Quantization
AIモデルのパラメータ(重み)の数値を、より少ないビット数(例えば32bit浮動小数点から8bit整数など)で表現することで、モデルのサイズを削減し、計算を高速化する技術。
最終更新: 2026/1/24
語源
Quantization(物理量の離散化)。
用例
4bit量子化を行うことで、家庭用GPUでも大規模言語モデルを動かせるようにする。
由来・語源
Quantization(物理量の離散化)。
使用例
4bit量子化を行うことで、家庭用GPUでも大規模言語モデルを動かせるようにする。
関連用語
- 同義語:
- 関連: モデル圧縮, 蒸留, 推論, GPU