Tag LLM

Syndrom „zaniku mózgu AI”. Nowe badanie pokazuje, jak śmieciowe dane degradują LLM-y

sztuczna inteligencja, llm

W wyścigu o coraz potężniejsze modele językowe, kluczowe pytanie o jakość danych treningowych powraca z nową siłą. Badanie przeprowadzone na Uniwersytecie Teksańskim w Austin, opublikowane na platformie preprintów arXiv, dostarcza dowodów, że karmienie AI treściami niskiej jakości prowadzi do mierzalnej degradacji ich zdolności. Zasada „garbage in, garbage out” w erze…

Tańszy, 100x szybszy i mądrzejszy. Singapurski model AI deklasuje konkurencję pod każdym względem

sztuczna inteligencja. AI

Singapurski startup Sapient Intelligence rzuca wyzwanie gigantom AI, wprowadzając nową architekturę, która wydajniej radzi sobie ze złożonymi problemami. Model, inspirowany działaniem ludzkiego mózgu, potrzebuje przy tym znacznie mniej danych treningowych i mocy obliczeniowej niż obecne modele językowe. Firma opracowała Hierarchiczny Model Rozumowania (HRM),…

LLM-y w architekturze aplikacji. Czas na nowy model budowania systemów?

software, oprogramowanie

Do niedawna aplikacje oparte na dużych modelach językowych (LLM) były traktowane jako ciekawostka – demonstracja możliwości AI lub nowy interfejs konwersacyjny. Dziś coraz częściej stają się podstawą całych systemów biznesowych. To przesunięcie niesie ze sobą konkretne konsekwencje: zmienia nie tylko sposób, w jaki projektujemy oprogramowanie, ale także to,…

Światowy wyścig AI: ChatGPT vs. DeepSeek. Czy Polska ma szansę włączyć się do tej globalnej rywalizacji?

DeepSeek, Chatgpt

Chiński sukces Chiński DeepSeek to model w pełni open-source (na licencji MIT), który dorównuje GPT4-o1 (mam na myśli model DeepSeek-R1, bo wcześniej jeszcze pojawił się V3). Zaburzył on dotychczasową hegemonię modeli GPT4-o1 (modeli pozwalających na głębokie wnioskowanie, czyli takie, które daje najwięcej wartości w zadaniach matematycznych, programowaniu czy skomplikowanych dedukcjach).…

Trend Micro udostępnia swój model AI jako open source

Sztuczna inteligencja, praca, ai, bańka ai

Trend Micro wykonał znaczący ruch, udostępniając jako open source swój duży model językowy (LLM) dostosowany do cyberbezpieczeństwa, nazwany Trend Cybertron. Ta decyzja, oparta na architekturze Llama 3.1, pozycjonuje Trend Micro, aby potencjalnie zakłócić istniejącą dynamikę rynku cyberbezpieczeństwa, jednocześnie podnosząc ważne pytania dotyczące praktycznych…

Meta AI wkracza do Europy – największa ekspansja od dekady

Meta

Meta AI, inteligentny wirtualny asystent opracowany przez firmę Marka Zuckerberga, już od przyszłego tygodnia zacznie być dostępny w 41 krajach europejskich. To największa ekspansja tej technologii od momentu jej debiutu w Stanach Zjednoczonych – jeszcze w 2013 roku. Po latach testów, iteracji i niełatwych negocjacji z europejskimi regulatorami, Meta w końcu uznała,…

Unia Europejska ogłasza OpenEuroLLM, czyli europejską odpowiedź na globalny wyścig AI

Unia Europejska, AI

Unia Europejska podejmuje kolejny krok w kierunku cyfrowej suwerenności dzięki nowej inicjatywie OpenEuroLLM. Projekt ten ma na celu rozwój open source’owych modeli językowych obejmujących wszystkie języki europejskie, co stanowi strategiczny krok w budowaniu niezależnej infrastruktury sztucznej inteligencji na Starym Kontynencie. OpenEuroLLM – Co to jest i dlaczego jest ważne?…

Sztuczna inteligencja w służbach wywiadowczych – cyfrowe kopie polityków pomagają CIA

central intelligence agency, CIA, sztuczna inteligencja

Sztuczna inteligencja (AI) weszła do użytku w Centralnej Agencji Wywiadowczej (CIA). W agencji jest wykorzystywana do tworzenia wirtualnych modeli czołowych światowych polityków, co ma pomóc analitykom lepiej zrozumieć ich potencjalne reakcje na globalne wydarzenia. Technologia oparta na dużych modelach językowych (LLM), takich jak ChatGPT, pozwala przetwarzać ogromne ilości…

Phi-4 od Microsoftu – konkurent dla największych modeli AI

Microsoft

Microsoft ogłosił premierę nowego modelu językowego Phi-4, który wyróżnia się zdolnościami w rozumowaniu matematycznym. Model, wyposażony w 14 miliardów parametrów, stanowi znaczący krok naprzód w rodzinie Phi, będąc bezpośrednim następcą Phi-3-mini, który miał jedynie 3,8 miliarda parametrów. Phi-4 został zaprojektowany z myślą o rozwiązywaniu złożonych problemów matematycznych…

Mobilna AI bez serwerów? Jak kompresja zmienia technologię

Naukowcy z Uniwersytetu Princeton i Uniwersytetu Stanforda opracowali technologię, która pozwala na uruchamianie dużych modeli językowych (LLM) na smartfonach i laptopach, eliminując konieczność korzystania z potężnych serwerów. Dzięki nowemu algorytmowi kompresji, nazwanemu CALDERA, użytkownicy mogą korzystać z możliwości zaawansowanej sztucznej inteligencji bez potrzeby dostępu do drogich i energochłonnych infrastruktur. Wydajność bez utraty jakości…

Były dyrektor generalny Google: LLM’y mogą kopiować treść, prawnicy się tym zajmą

Eric Schmidt, google

Eric Schmidt, były dyrektor generalny Google, wygłosił szereg kontrowersyjnych uwag podczas gościnnego wykładu na Uniwersytecie Stanforda. Jego wystąpienie, które szybko zostało usunięte z platform internetowych, poruszyło tematykę potencjału sztucznej inteligencji (AI), szczególnie modeli językowych (LLM), oraz ich wpływu na tworzenie aplikacji i przestrzeganie praw autorskich.…

Salesforce wprowadza przełomowy benchmark LLM dla systemów CRM

Salesforce

Salesforce ogłosił wprowadzenie pierwszego na świecie benchmarku LLM (Large Language Models), który ma pomóc firmom w ocenie licznych modeli językowych do wykorzystania w systemach zarządzania relacjami z klientami (CRM). Nowy benchmark stanowi kompleksowe ramy oceny, które mierzą wydajność LLM w odniesieniu do czterech kluczowych miar: dokładności, kosztów, szybkości oraz zaufania…

Jak wykryć błędy w LLM’ie? OpenAI ma na to sposób

Sztuczna inteligencja. robot, praca, AI

OpenAI wprowadza innowacyjny model językowy, który obiecuje rewolucjonizować sposób, w jaki ludzcy trenerzy AI identyfikują i korygują błędy. Nowy model, nazwany CriticGPT, oparty na technologii GPT-4, ma za zadanie wspierać procesy szkolenia modeli językowych, takich jak popularny ChatGPT, w wykrywaniu nietrafnych odpowiedzi. Modele językowe, takie jak GPT-4,…

Rewolucja AI ma twarz LLM-ów

mózg, sztuczna inteligencja

„Rozpoczęła się następna rewolucja… Przedsiębiorstwa i kraje łączą się z firmą NVIDIA, aby zmienić warte biliony dolarów tradycyjne centra danych w nowoczesne serwerownie, budując nowy typ centrów danych – fabryki sztucznej inteligencji – aby wytwarzać nowy towar – sztuczną inteligencję” – napisał w informacji…

Snowflake pokazał Arctic – nowy model LLM klasy korporacyjnej

Sztuczna inteligencja, AI ACT

Firma Snowflake ogłosiła uruchomienie Snowflake Arctic, zaawansowanego dużego modelu językowego (LLM), który ma na celu zrewolucjonizować podejście do sztucznej inteligencji w przedsiębiorstwach. Arctic, charakteryzujący się unikalną architekturą Mixture-of-Experts (MoE), ma zapewniać inteligencję i wydajność na szeroką skalę, będąc przy tym najbardziej otwartym modelem klasy korporacyjnej dostępnym na rynku. Snowflake…

Jak wdrożyć LLM w firmie? O tym musisz pamiętać

Sztuczna inteligencja, człowiek, nvidia, llm, AI

W erze cyfrowej, generatywna sztuczna inteligencja (AI) przekształca zarówno życie codzienne, jak i operacyjne krajobrazy biznesowe. Dzięki rozwojowi i ekspansji dużych modeli językowych (LLM), firmy i konsumentów otacza fala innowacji, która zmienia zasady gry. LLM, napędzające narzędzia takie jak chatboty i generatywne systemy AI, otwierają przed organizacjami…