LARGE LEANGUAGE MODELS
W naszych tekstach wspominamy o różnego rodzaju narzędziach AI, ale również rozmaitych LLMach. Nazbierało się ich tyle, że podjęliśmy decyzję o zaprezentowaniu ich w osobnej tabeli.
AI 1.5 Pro
Zaawansowana platforma AI od Google, wykorzystująca multimodalne modele z rodziny Gemini do przetwarzania tekstu, obrazu, dźwięku i wideo. Oferuje jeden z największych na rynku okien kontekstowych, umożliwiając analizę obszernych dokumentów i długich sekwencji danych.
Amazon Nova 2
Amazon Nova to rodzina nowoczesnych modeli fundamentowych oferująca zaawansowane możliwości przetwarzania tekstu, obrazów, wideo i dźwięku. Modele te są zoptymalizowane pod kątem wydajności, niskich kosztów oraz budowania inteligentnych agentów w ekosystemie AWS.
BlackBox AI
Uniwersalna platforma agentów AI integrująca wiodące modele, takie jak Claude, Gemini i Codex, w jednym interfejsie programistycznym. Oferuje zaawansowane funkcje generowania kodu, autonomicznych agentów oraz integrację z popularnymi środowiskami IDE i CLI.
Claude 3.5 Sonnet
Claude to rodzina zaawansowanych modeli językowych od Anthropic, zaprojektowana z myślą o bezpieczeństwie i naturalnej interakcji. Platforma umożliwia analizę dokumentów, pisanie kodu oraz bezpośrednią interakcję z przeglądarką internetową dzięki nowemu rozszerzeniu Claude for Chrome.
Comet
Comet to inteligentna przeglądarka i osobisty asystent AI, który automatyzuje zadania, przeszukuje sieć oraz pomaga w organizacji pracy i poczty e-mail. Narzędzie pozwala na delegowanie codziennych obowiązków, takich jak planowanie nauki, zakupy czy tworzenie prostych stron internetowych.
DeepSeek V3.2
Chińska platforma sztucznej inteligencji rozwijająca zaawansowane modele językowe oparte na architekturze Mixture-of-Experts (MoE). Oferuje wysokiej klasy modele ogólnego przeznaczenia oraz specjalistyczne narzędzia do programowania i analizy matematycznej, charakteryzujące się wyjątkową wydajnością kosztową.
Doubao 1.5 Pro
Zaawansowana rodzina modeli oparta na architekturze MoE (Mixture of Experts), zoptymalizowana pod kątem równowagi między wydajnością a kosztami wnioskowania. Oferuje natywne wsparcie dla multimodalności, w tym zaawansowane przetwarzanie obrazu oraz mowy w systemie end-to-end.
Fireworks AI Cloud / RFT
Fireworks AI to platforma chmurowa oferująca wydajną infrastrukturę do wnioskowania i dostrajania modeli open-source. Umożliwia firmom budowanie własnych rozwiązań AI z wykorzystaniem autorskich danych, zapewniając wysoką szybkość i niskie koszty.
Flux
Platforma umożliwiająca tworzenie i wdrażanie własnych agentów AI bezpośrednio w aplikacji iMessage. Pozwala użytkownikom na budowanie spersonalizowanych narzędzi, takich jak asystenci podróży, planery budżetu czy agenty pogodowe, zintegrowanych z ekosystemem Apple.
Gemini 2.0 Flash
Gemini to rodzina zaawansowanych modeli multimodalnych od Google, które potrafią analizować tekst, obrazy, dźwięk oraz wideo. Wersja Flash została zaprojektowana z myślą o szybkości i niskich opóźnieniach, oferując jednocześnie potężne możliwości przetwarzania długiego kontekstu.
Google Gemini 3 Pro
Najbardziej zaawansowana rodzina modeli AI od Google, oferująca przełomowe możliwości rozumowania, planowania i tworzenia. Platforma wspiera natywną multimodalność oraz zaawansowane funkcje agentowe, pozwalając na realizację złożonych, wieloetapowych projektów.
Grok 4.1 Fast
Grok 4.1 Fast to zaawansowany model AI od xAI z gigantycznym oknem kontekstowym wynoszącym 2 miliony tokenów. Model wspiera Agent Tools API, umożliwiając automatyzację złożonych procesów, takich jak analiza dokumentacji i rezerwacje usług.
Hunyuan T1
Tencent Hunyuan to zaawansowany model językowy opracowany przez firmę Tencent, charakteryzujący się szeroką wiedzą dziedzinową i wysoką zdolnością rozumienia języka naturalnego. Platforma wspiera wielojęzyczne tłumaczenia, generowanie treści oraz interaktywne dialogi, oferując modele zoptymalizowane pod kątem wydajności i precyzji.
i10x
i10X to wszechstronna platforma AI typu all-in-one, która zapewnia dostęp do wielu modeli językowych, takich jak ChatGPT, Claude i Gemini, oraz ponad 500 specjalistycznych narzędzi. Umożliwia generowanie treści, obrazów i wideo, analizę dokumentów PDF oraz automatyzację procesów biznesowych w ramach jednego interfejsu.
Llama 4 Scout
Llama 4 to rodzina natywnie multimodalnych modeli AI od Meta, oparta na architekturze Mixture-of-Experts (MoE). Modele Scout i Maverick oferują bezprecedensowe okno kontekstowe do 10 milionów tokenów oraz wysoką wydajność przy zachowaniu otwartości wag.
Lookup 1.0
Zaawansowane narzędzie do analizy wideo oparte na wizji komputerowej z pamięcią, umożliwiające zadawanie pytań w języku naturalnym. Platforma automatycznie wyszukuje odpowiednie fragmenty nagrań, co znajduje zastosowanie w logistyce i weryfikacji usług.
MCT PDF
MCT PDF File Converter to wszechstronne narzędzie umożliwiające konwersję plików PDF do ponad 20 formatów, takich jak Word, Excel czy obrazy. Program wspiera przetwarzanie wsadowe, pozwala na edycję dokumentów i jest kompatybilny z systemami Windows oraz Mac.
Microsoft Copilot 3D
Copilot 3D to eksperymentalne narzędzie AI od Microsoft Labs, które umożliwia użytkownikom przekształcanie pojedynczych obrazów 2D w gotowe do użycia modele 3D w formacie GLB. Narzędzie jest zaprojektowane z myślą o dostępności, nie wymagając od użytkowników wcześniejszego doświadczenia w projektowaniu trójwymiarowym.
MiniMax M2.1
MiniMax M2.1 to zaawansowany model językowy zoptymalizowany pod kątem programowania wielojęzycznego oraz rozwiązywania złożonych zadań biurowych. Charakteryzuje się wysoką wydajnością w tworzeniu aplikacji mobilnych i webowych oraz oferuje zwięzłe odpowiedzi przy niskim zużyciu tokenów.
Mistral Mistral Large 2 / OCR
Francuska platforma LLM oferująca wydajne modele o otwartych wagach oraz rozwiązania komercyjne. Specjalizuje się w zadaniach wielojęzycznych, kodowaniu i zaawansowanym rozumowaniu, zapewniając wysoką efektywność kosztową.
Nova Nova 2 Sonic
Amazon Nova to rodzina nowoczesnych modeli fundamentowych oferująca wysoką inteligencję oraz wiodący na rynku stosunek wydajności do ceny. Modele te obsługują wiele modalności, w tym tekst, obraz, wideo i mowę, zapewniając przy tym zaawansowane możliwości rozumowania i integracji z narzędziami.
o3 pro
OpenAI o3 to rodzina modeli typu reasoning, zaprojektowana do zaawansowanego wnioskowania i rozwiązywania złożonych problemów z zakresu matematyki, nauki i kodowania. Wersja pro oferuje największą moc obliczeniową w tej serii, pozwalając na głębokie procesy myślowe przed udzieleniem odpowiedzi.
OpenAI GPT Image 1.5
Zaawansowana platforma umożliwiająca generowanie i edycję obrazów na podstawie promptów tekstowych przy użyciu modeli z rodziny GPT Image oraz DALL·E. Obsługuje zaawansowane funkcje, takie jak renderowanie tekstu, wieloetapowa edycja obrazów oraz integracja z narzędziami konwersacyjnymi.
Operator to agent AI od OpenAI, który potrafi samodzielnie korzystać z przeglądarki internetowej do wykonywania złożonych zadań za użytkownika. Wykorzystuje model Computer-Using Agent (CUA), łącząc możliwości wizyjne GPT-4o z zaawansowanym rozumowaniem do interakcji z interfejsami graficznymi.
