Alibaba rewolucjonizuje trening agentów AI: AgentEvolver zwiększa wydajność o ~30% dzięki autogenerowanym zadaniom

Alibaba opracowuje AgentEvolver

Naukowcy z Tongyi Lab należącego do Alibaby opracowali rewolucyjną technologię **AgentEvolver**, która znacząco poprawia wydajność agentów AI w wykorzystaniu narzędzi. Nowe rozwiązanie zwiększa wydajność modeli o około **30%** poprzez wykorzystanie syntetycznych, autogenerowanych zadań. Framework ten umożliwia agentom samodzielne generowanie danych treningowych poprzez eksplorację środowiska aplikacji.

AgentEvolver wykorzystuje wiedzę i zdolności rozumowania dużych modeli językowych (LLM) do autonomicznego uczenia się, co eliminuje wysokie koszty i ręczne nakłady pracy, typowo wymagane do zbierania dedykowanych zestawów danych.

AgentEvolver vs. Tradycyjne Metody

Eksperymenty pokazują, że w porównaniu z tradycyjnymi frameworkami opartymi na uczeniu ze wzmocnieniem (reinforcement learning), AgentEvolver jest bardziej efektywny w eksploracji środowiska, lepiej wykorzystuje dane i szybciej adaptuje się do środowisk aplikacji. Dla przedsiębiorstw jest to znaczące, ponieważ obniża barierę wejścia w trening agentów dla niestandardowych aplikacji, czyniąc potężnych, dostosowanych asystentów AI bardziej dostępnymi dla szerszego grona organizacji.

Wysokie koszty treningu agentów AI

Uczenie ze wzmocnieniem stało się głównym paradygmatem treningu LLM w celu działania jako agenci, którzy mogą wchodzić w interakcje z cyfrowymi środowiskami i uczyć się na podstawie feedbacku. Jednak rozwój agentów z wykorzystaniem RL wiąże się z fundamentalnymi wyzwaniami. Po pierwsze, zebranie niezbędnych zestawów danych treningowych jest często nieopłacalne, wymagając znacznych nakładów pracy ręcznej w celu tworzenia przykładów zadań, szczególnie w nowych lub zastrzeżonych środowiskach oprogramowania, w których nie są dostępne gotowe zestawy danych. Po drugie, techniki RL powszechnie stosowane dla LLM wymagają od modelu przejścia przez ogromną liczbę prób i błędów, aby efektywnie się uczyć. Proces ten jest kosztowny obliczeniowo i nieefektywny. W rezultacie trening wydajnych agentów LLM poprzez RL pozostaje pracochłonny i kosztowny, co ogranicza ich wdrażanie w niestandardowych ustawieniach korporacyjnych.

Jak działa AgentEvolver?

Główną ideą AgentEvolver jest zapewnienie modelom większej autonomii w procesie uczenia się. Naukowcy opisują go jako „samodzielnie rozwijający się system agentów”, zaprojektowany w celu „osiągnięcia autonomicznej i efektywnej ewolucji możliwości poprzez interakcję ze środowiskiem”. Wykorzystuje moc rozumowania LLM.

Więcej w tym silosie tematycznym:

Ekspert Technologia RWA/AI

Kryptowaluty AI 2026

Projekty RWA

Sektor DePIN

Ten artykuł został pierwotnie opublikowany na WordPress i jest wyświetlany w nowym systemie Tokeny.pl. Treść została zachowana w oryginalnej formie.