Pedia

量子化

りょうしか

Quantization

AIモデルのパラメータ(重み)の数値を、より少ないビット数(例えば32bit浮動小数点から8bit整数など)で表現することで、モデルのサイズを削減し、計算を高速化する技術。

最終更新: 2026/1/24

語源

Quantization(物理量の離散化)。

用例

4bit量子化を行うことで、家庭用GPUでも大規模言語モデルを動かせるようにする。

由来・語源

Quantization(物理量の離散化)。

使用例

4bit量子化を行うことで、家庭用GPUでも大規模言語モデルを動かせるようにする。

関連用語

  • 同義語:
  • 関連: モデル圧縮, 蒸留, 推論, GPU
TOP / 検索 Amazonで探す