Sztuczna inteligencja już wcześniej komunikowała się po polsku, ale niekoniecznie znała polski kontekst kulturowy. W tym drugim lepszy ma być model językowy Bielik. Udostępnił go właśnie zespół działający w ramach Fundacji SpeakLeash oraz Akademickiego Centrum Komputerowego Cyfronet AGH.
Bielik-11B-v2 to efekt ponad rocznej pracy zespołu składającego się z pracowników polskich firm, naukowców i studentów. Model posiada 11 miliardów parametrów, co plasuje go w kategorii dużych modeli językowych (LLM).
Bielik jest obecnie dostępny do testowania w domenie publicznej i jest stale udoskonalany. Autorzy udostępnili nie tylko pełne wersje opracowanych modeli, ale także szereg wersji w popularnych formatach, umożliwiających uruchomienie modelu na własnym komputerze.
Prace nad polskim modelem językowym
– Najtrudniejsze zadanie polegało na pozyskaniu danych w języku polskim. Musimy operować wyłącznie na danych źródłowych, co do których mamy pewność, jakie jest ich pochodzenie – wyjaśnia Sebastian Kondracki ze SpeakLeash, pomysłodawca projektu, cytowany w komunikacie.
By wspomóc projekt, Akademickie Centrum Komputerowe Cyfronet AGH udostępniło moc obliczeniową dwóch najszybszych superkomputerów w Polsce – Heliosa i Atheny.
– Nasza rola polega na wsparciu wiedzą ekspercką, doświadczeniem i przede wszystkim mocą obliczeniową procesu katalogowania, zbierania, przetwarzania danych oraz na wspólnym przeprowadzeniu procesu uczenia modeli językowych – mówi Marek Magryś, zastępca Dyrektora ACK Cyfronet AGH ds. Komputerów Dużej Mocy.
Bielik jest szczególnie dobrze przystosowany do rozumienia polskiej kultury, niuansów literatury oraz skomplikowanych tekstów prawnych czy medycznych w języku polskim.
– Warto wiedzieć, że Bielik będzie bardzo dobrze sprawdzał się w zakresie np. streszczania treści. Już w tym momencie nasz model ma swoją użyteczność w obszarze naukowym oraz biznesowym, może służyć na przykład do usprawnienia komunikacji z użytkownikami podczas obsługi zgłoszeń w Helpdesku – dodaje Szymon Mazurek z ACK Cyfronet AGH.
Korzyści z modeli w różnych językach
Twórcy Bielika podkreślają również znaczenie rozwoju rodzimych modeli językowych dla wzmocnienia pozycji Polski w sektorze AI oraz uniezależnienia się od zewnętrznych dostawców. Jest to szczególnie istotne w kontekście ochrony danych wrażliwych w takich sektorach jak bankowość, administracja, medycyna czy prawo.
– Intensywne działania nad rozwojem AI, modelami językowymi typu Bielik czy innymi narzędziami opartymi o sztuczną inteligencję są w interesie wszystkich dobrze działających gospodarek. Obserwujemy wzmożone prace nad tego typu rozwiązaniami w wielu krajach – mówi Jan Maria Kowalski z Fundacji Speakleash.