Modele AI. Llama (Meta)
Open source / self‑host / multimodal

Llama (Meta)

Llama 3/4, open‑weight, MoE, multimodal w 4

Llama 3 (04.2024), Llama 3.1 (07.2024, w tym 405B) i Llama 4 Scout/Maverick (05.04.2025): rodzina open‑weight na „Community License” (nie OSI): klauzula >700M MAU, AUP, ograniczenia dot. użycia outputów do poprawy innych LLM. Llama 4: MoE, natywnie multimodalna (tekst+obraz). Meta odmówiła podpisania unijnego GPAI Code of Practice – istotne dla compliance w UE.

Zweryfikowano: 2026-02-21

Decyzja zakupowa (kiedy wybrać / kiedy uważać)

Wybierz, jeśli…

  • Chcesz open‑weight i kontrolę (self‑host) + szeroki ekosystem narzędzi.
  • Masz duży wolumen i chcesz optymalizować koszt inferencji (kwantyzacje, vLLM, itp.).
  • Budujesz rozwiązania on‑prem / edge i masz kompetencje do utrzymania modeli.

Unikaj, jeśli…

  • Nie akceptujesz ograniczeń licencji Community License / AUP – sprawdź szczegóły przed wdrożeniem.
  • Chcesz „najprostsze możliwe” wdrożenie bez MLOps – API SaaS będzie szybsze.

Koszt w praktyce (scenariusze)

Pilotaż

Hostowany u providera jest najszybszy; self‑host wymaga przygotowania.

  • mały zespół
  • testy jakości
Skala

Self‑host często wygrywa kosztowo przy stałym wolumenie, ale dochodzi utrzymanie.

  • GPU, monitoring, guardrails
To są widełki/scenariusze (nie faktura). Dokładny koszt zależy od długości kontekstu, liczby użytkowników, limitów i polityk retencji.

Wdrożenie / dane / enterprise

Kanały wdrożenia

  • Self‑host (vLLM/llama.cpp/Ollama)
  • Providerzy hostingu (np. Bedrock / Together / Groq – zależnie od oferty)
  • Integracje w aplikacjach własnych

Polityka danych

Trening na danych
Self‑host: po Twojej stronie.
Retencja
Self‑host: po Twojej stronie; hostowany: zależnie od providera.
Data residency
Zależnie od miejsca hostingu.
Kluczowe są warunki licencji (Community License) i AUP.

Enterprise readiness

Admin
Self‑host: po Twojej stronie; hostowany: zależnie od providera.
SSO/SCIM
Zależnie od platformy, na której wdrażasz.
Audit
Zależnie od platformy.
DPA
Zależnie od providera/umowy.
Certyfikacje
Zależnie od providera/umowy.
Najlepszy, gdy masz MLOps i chcesz kontrolować koszt w skali.

Najlepsze zastosowania

  • firmy chcące hostować model on‑prem/cloud/edge (prywatność, koszty długoterminowe)
  • fine‑tuning i aplikacje z niskimi opóźnieniami; multimodalność przy self‑host (Llama 4).
  • wdrożenia, gdzie compliance licencji i AUP są akceptowalne (wymóg atrybucji „Built with Llama”).

Mocne strony

  • Ogromny ekosystem (HF, Llama.cpp, vLLM, Ollama, kwantyzacje); dostawca deklaruje konkurencyjność na benchmarkach.
  • Llama 4: MoE (Scout 17B/16E, Maverick 17B/128E), duży kontekst, fusion; dostęp przez wiele platform (Groq, Together, Bedrock).
  • Pełna kontrola nad wagami – audyty, modyfikacje; konkurencyjne ceny u hostujących providerów.

Słabe strony / ryzyka

  • Community License nie jest open‑source w sensie OSI; compliance licencji i AUP po stronie wdrożenia.
  • Meta krytykowana za „open source” claim; odmowa GPAI Code – ryzyko interpretacyjne dla integratorów w UE.

Aktualne modele (przykłady)

  • Llama 4 Scout/Maverick (05.04.2025) – MoE, multimodal (tekst+obraz); Llama 3.1 (8B/70B/405B).
  • Llama 3 – dense, skale 8B/70B; GQA wg kart modeli; on‑prem/cloud/edge.

Alternatywy (jeśli ten model nie pasuje)