LARGE LEANGUAGE MODELS
W naszych tekstach wspominamy o różnego rodzaju narzędziach AI, ale również rozmaitych LLMach. Nazbierało się ich tyle, że podjęliśmy decyzję o zaprezentowaniu ich w osobnej tabeli.
AI 1.5 Pro
Zaawansowana platforma AI od Google, wykorzystująca multimodalne modele z rodziny Gemini do przetwarzania tekstu, obrazu, dźwięku i wideo. Oferuje jeden z największych na rynku okien kontekstowych, umożliwiając analizę obszernych dokumentów i długich sekwencji danych.
Amazon Nova 2
Amazon Nova to rodzina nowoczesnych modeli fundamentowych oferująca zaawansowane możliwości przetwarzania tekstu, obrazów, wideo i dźwięku. Modele te są zoptymalizowane pod kątem wydajności, niskich kosztów oraz budowania inteligentnych agentów w ekosystemie AWS.
Doubao 1.5 Pro
Zaawansowana rodzina modeli oparta na architekturze MoE (Mixture of Experts), zoptymalizowana pod kątem równowagi między wydajnością a kosztami wnioskowania. Oferuje natywne wsparcie dla multimodalności, w tym zaawansowane przetwarzanie obrazu oraz mowy w systemie end-to-end.
Fireworks AI Cloud / RFT
Fireworks AI to platforma chmurowa oferująca wydajną infrastrukturę do wnioskowania i dostrajania modeli open-source. Umożliwia firmom budowanie własnych rozwiązań AI z wykorzystaniem autorskich danych, zapewniając wysoką szybkość i niskie koszty.
Gemini 2.0 Flash
Gemini to rodzina zaawansowanych modeli multimodalnych od Google, które potrafią analizować tekst, obrazy, dźwięk oraz wideo. Wersja Flash została zaprojektowana z myślą o szybkości i niskich opóźnieniach, oferując jednocześnie potężne możliwości przetwarzania długiego kontekstu.
Google Gemini 3 Pro
Najbardziej zaawansowana rodzina modeli AI od Google, oferująca przełomowe możliwości rozumowania, planowania i tworzenia. Platforma wspiera natywną multimodalność oraz zaawansowane funkcje agentowe, pozwalając na realizację złożonych, wieloetapowych projektów.
Grok 4.1 Fast
Grok 4.1 Fast to zaawansowany model AI od xAI z gigantycznym oknem kontekstowym wynoszącym 2 miliony tokenów. Model wspiera Agent Tools API, umożliwiając automatyzację złożonych procesów, takich jak analiza dokumentacji i rezerwacje usług.
Lemonfox AI
Lemonfox.ai to platforma API specjalizująca się w usługach Speech-to-Text oraz Text-to-Speech, wykorzystująca model Whisper large-v3 dla zapewnienia wysokiej dokładności. Oferuje transkrypcję w ponad 100 językach, rozpoznawanie mówców oraz bezpieczne przetwarzanie danych z opcją hostingu w UE.
Mureka O2
Mureka to innowacyjna platforma AI specjalizująca się w generowaniu muzyki, ścieżek dźwiękowych oraz mowy. Umożliwia użytkownikom tworzenie unikalnych kompozycji audio i eksperymentowanie z dźwiękiem przy użyciu zaawansowanych algorytmów generatywnych.
Nova Nova 2 Sonic
Amazon Nova to rodzina nowoczesnych modeli fundamentowych oferująca wysoką inteligencję oraz wiodący na rynku stosunek wydajności do ceny. Modele te obsługują wiele modalności, w tym tekst, obraz, wideo i mowę, zapewniając przy tym zaawansowane możliwości rozumowania i integracji z narzędziami.
o3 pro
OpenAI o3 to rodzina modeli typu reasoning, zaprojektowana do zaawansowanego wnioskowania i rozwiązywania złożonych problemów z zakresu matematyki, nauki i kodowania. Wersja pro oferuje największą moc obliczeniową w tej serii, pozwalając na głębokie procesy myślowe przed udzieleniem odpowiedzi.
OpenAI GPT Image 1.5
Zaawansowana platforma umożliwiająca generowanie i edycję obrazów na podstawie promptów tekstowych przy użyciu modeli z rodziny GPT Image oraz DALL·E. Obsługuje zaawansowane funkcje, takie jak renderowanie tekstu, wieloetapowa edycja obrazów oraz integracja z narzędziami konwersacyjnymi.
Poe Apps
Poe to platforma agregująca ponad 100 modeli AI od różnych dostawców, umożliwiająca interakcję tekstową oraz tworzenie własnych aplikacji wizualnych. Pozwala na korzystanie z modeli tekstowych, graficznych, wideo i audio w ramach jednego spójnego interfejsu i systemu punktowego.
SchedX
SchedX to zaawansowany agent AI typu Inbound SDR, który prowadzi rozmowy głosowe z użytkownikami strony internetowej w czasie rzeczywistym. Platforma automatycznie kwalifikuje leady, odpowiada na pytania dotyczące produktu oraz umawia spotkania bezpośrednio w kalendarzach handlowców.
Spark 4.0 Ultra
Zaawansowany chiński model językowy (LLM) opracowany przez firmę iFlytek, wspierający multimodalność oraz zaawansowane zadania logiczne i programistyczne. Platforma oferuje szerokie możliwości integracji poprzez API i jest jedną z głównych alternatyw dla modeli serii GPT w regionie azjatyckim.
Vapi
Vapi to platforma programistyczna do budowania, testowania i wdrażania zaawansowanych asystentów głosowych AI w czasie rzeczywistym. Pozwala deweloperom na integrację modeli LLM z technologiami rozpoznawania i syntezy mowy za pomocą jednego API o niskich opóźnieniach.
