gm.nn#

Gemma models.

Symbols#


gm.nn.config	Symbols needed to build new `TransformerConfig`.


gm.nn.AnchoredPolicy	Wrapper around a model to compute policy and anchor outputs.
gm.nn.AnchoredPolicyOutput	Output of the `gm.nn.AnchoredPolicy`.
gm.nn.Attention	Attention module.
gm.nn.AttentionType
gm.nn.Block	Transformer block.
gm.nn.Einsum	Einsum is a convenience module for parameterized tensor multiplication.
gm.nn.Embedder	Embedder module.
gm.nn.FeedForward	Feed forward module.
gm.nn.Gemma2_27B	Gemma2 transformer architecture.
gm.nn.Gemma2_2B	Gemma2 transformer architecture.
gm.nn.Gemma2_9B	Gemma2 transformer architecture.
gm.nn.Gemma3_12B	Gemma3 transformer architecture.
gm.nn.Gemma3_1B	Gemma3 transformer architecture.
gm.nn.Gemma3_270M	Gemma3 transformer architecture.
gm.nn.Gemma3_27B	Gemma3 transformer architecture.
gm.nn.Gemma3_4B	Gemma3 transformer architecture.
gm.nn.Gemma3n_E2B	Gemma3n E2B transformer architecture.
gm.nn.Gemma3n_E4B	Gemma3n E4B transformer architecture.
gm.nn.Gemma4_26B_A4B	Gemma 4 26B_A4B MoE model.
gm.nn.Gemma4_31B	Gemma 4 31B model.
gm.nn.Gemma4_E2B	Gemma 4 E2B model.
gm.nn.Gemma4_E4B	Gemma 4 E4B model.
gm.nn.IntWrapper	Wrapper around a Gemma model to enable int4 inference.
gm.nn.LoRA	Wrapper around a Gemma model to enable LoRA.
gm.nn.Output	Output of the Gemma model.
gm.nn.QuantizationAwareWrapper	Wrapper around a Gemma model to enable quantization aware training.
gm.nn.RMSNorm	RMSNorm layer.
gm.nn.SigLiPFromPatches	SigLIP vision encoder forward pass from PatchifiedMedia.
gm.nn.Transformer	Base transformer class.
gm.nn.TransformerLike	Protocol for a transformer model to be used with a Sampler.


gm.nn.Cache