LARGE LEANGUAGE MODELS

W naszych tekstach wspominamy o różnego rodzaju narzędziach AI, ale również rozmaitych LLMach. Nazbierało się ich tyle, że podjęliśmy decyzję o zaprezentowaniu ich w osobnej tabeli.

16 modeli LLM
Aktywne filtry: Możliwość: Audio × Wyczyść wszystko
Wyniki 1-16 z 16
Freemium
A

Zaawansowana platforma AI od Google, wykorzystująca multimodalne modele z rodziny Gemini do przetwarzania tekstu, obrazu, dźwięku i wideo. Oferuje jeden z największych na rynku okien kontekstowych, umożliwiając analizę obszernych dokumentów i długich sekwencji danych.

Google 1.0M kontekst Tekst Obrazy
Freemium

Amazon Nova to rodzina nowoczesnych modeli fundamentowych oferująca zaawansowane możliwości przetwarzania tekstu, obrazów, wideo i dźwięku. Modele te są zoptymalizowane pod kątem wydajności, niskich kosztów oraz budowania inteligentnych agentów w ekosystemie AWS.

Amazon 300K kontekst Tekst Obrazy
Freemium
D

Zaawansowana rodzina modeli oparta na architekturze MoE (Mixture of Experts), zoptymalizowana pod kątem równowagi między wydajnością a kosztami wnioskowania. Oferuje natywne wsparcie dla multimodalności, w tym zaawansowane przetwarzanie obrazu oraz mowy w systemie end-to-end.

ByteDance 128K kontekst Tekst Obrazy

Fireworks AI to platforma chmurowa oferująca wydajną infrastrukturę do wnioskowania i dostrajania modeli open-source. Umożliwia firmom budowanie własnych rozwiązań AI z wykorzystaniem autorskich danych, zapewniając wysoką szybkość i niskie koszty.

Fireworks AI 128K kontekst Tekst Obrazy
Freemium

Gemini to rodzina zaawansowanych modeli multimodalnych od Google, które potrafią analizować tekst, obrazy, dźwięk oraz wideo. Wersja Flash została zaprojektowana z myślą o szybkości i niskich opóźnieniach, oferując jednocześnie potężne możliwości przetwarzania długiego kontekstu.

Google 1.0M kontekst Tekst Obrazy
Freemium

Najbardziej zaawansowana rodzina modeli AI od Google, oferująca przełomowe możliwości rozumowania, planowania i tworzenia. Platforma wspiera natywną multimodalność oraz zaawansowane funkcje agentowe, pozwalając na realizację złożonych, wieloetapowych projektów.

Google 2.0M kontekst Tekst Obrazy
Freemium

Grok 4.1 Fast to zaawansowany model AI od xAI z gigantycznym oknem kontekstowym wynoszącym 2 miliony tokenów. Model wspiera Agent Tools API, umożliwiając automatyzację złożonych procesów, takich jak analiza dokumentacji i rezerwacje usług.

xAI 2.0M kontekst Tekst Obrazy
Freemium

Lemonfox.ai to platforma API specjalizująca się w usługach Speech-to-Text oraz Text-to-Speech, wykorzystująca model Whisper large-v3 dla zapewnienia wysokiej dokładności. Oferuje transkrypcję w ponad 100 językach, rozpoznawanie mówców oraz bezpieczne przetwarzanie danych z opcją hostingu w UE.

xAI Tekst Audio
Freemium
M

Mureka O2

Mureka AI

Mureka to innowacyjna platforma AI specjalizująca się w generowaniu muzyki, ścieżek dźwiękowych oraz mowy. Umożliwia użytkownikom tworzenie unikalnych kompozycji audio i eksperymentowanie z dźwiękiem przy użyciu zaawansowanych algorytmów generatywnych.

Mureka AI Tekst Audio
N

Nova Nova 2 Sonic

Amazon (AWS)

Amazon Nova to rodzina nowoczesnych modeli fundamentowych oferująca wysoką inteligencję oraz wiodący na rynku stosunek wydajności do ceny. Modele te obsługują wiele modalności, w tym tekst, obraz, wideo i mowę, zapewniając przy tym zaawansowane możliwości rozumowania i integracji z narzędziami.

Amazon (AWS) 1.0M kontekst Tekst Obrazy
o3

o3 pro

OpenAI

OpenAI o3 to rodzina modeli typu reasoning, zaprojektowana do zaawansowanego wnioskowania i rozwiązywania złożonych problemów z zakresu matematyki, nauki i kodowania. Wersja pro oferuje największą moc obliczeniową w tej serii, pozwalając na głębokie procesy myślowe przed udzieleniem odpowiedzi.

OpenAI 200K kontekst Tekst Obrazy
Freemium

Zaawansowana platforma umożliwiająca generowanie i edycję obrazów na podstawie promptów tekstowych przy użyciu modeli z rodziny GPT Image oraz DALL·E. Obsługuje zaawansowane funkcje, takie jak renderowanie tekstu, wieloetapowa edycja obrazów oraz integracja z narzędziami konwersacyjnymi.

OpenAI 128K kontekst Tekst Obrazy
Freemium
P

Poe to platforma agregująca ponad 100 modeli AI od różnych dostawców, umożliwiająca interakcję tekstową oraz tworzenie własnych aplikacji wizualnych. Pozwala na korzystanie z modeli tekstowych, graficznych, wideo i audio w ramach jednego spójnego interfejsu i systemu punktowego.

Quora Tekst Obrazy

SchedX to zaawansowany agent AI typu Inbound SDR, który prowadzi rozmowy głosowe z użytkownikami strony internetowej w czasie rzeczywistym. Platforma automatycznie kwalifikuje leady, odpowiada na pytania dotyczące produktu oraz umawia spotkania bezpośrednio w kalendarzach handlowców.

xAI Tekst Audio
Freemium

Zaawansowany chiński model językowy (LLM) opracowany przez firmę iFlytek, wspierający multimodalność oraz zaawansowane zadania logiczne i programistyczne. Platforma oferuje szerokie możliwości integracji poprzez API i jest jedną z głównych alternatyw dla modeli serii GPT w regionie azjatyckim.

iFlytek 128K kontekst Tekst Obrazy
Freemium
Vapi

Vapi

Vapi AI

Vapi to platforma programistyczna do budowania, testowania i wdrażania zaawansowanych asystentów głosowych AI w czasie rzeczywistym. Pozwala deweloperom na integrację modeli LLM z technologiami rozpoznawania i syntezy mowy za pomocą jednego API o niskich opóźnieniach.

Vapi AI Tekst Audio