Sztuczna Inteligencja od Facebooka nazywa się Lama 2 i jest do ściągnięcia za darmo

6 dni temu prezes i współzałożyciel Facebooka, Mark Zuckerberg ogłosił, że jego firma Meta udostępnia do powszechnego użytku modele językowe LLaMa 2. Można je ściągnąć i ich za darmo używać jako osoba prywatna lub jako firma do użytku komercyjnego. Modele mają różną wielkość i różną jakość. Najlepszy i największy z nich w testach wypadł porównywalnie ze słynnym czatem GPT 3,5 od OpenAI. Poniżej tłumaczę, czemu to zrobili i czy warto ściągać sobie tę „lamę”.

Czy naprawdę każdy sobie może ściągnąć na komputer taki model językowy? Tak, ale w tej chwili raczej nie warto. Dwa główne powody są takie:

1. Sztuczna Inteligencja od Mety w języku polskim może być rozczarowująca, bo materiały w naszym języku stanowiły zaledwie 0,09% wszystkich materiałów podstawy wiedzy Llamy2. Prawie 90% tekstów z korpusu wiedzy napisanych było po angielsku. Tu do poczytania raport zespołu naukowego, który stworzył Llamę 2. Sztuczna inteligencja komunikuje się najlepiej po angielsku. To dotyczy wszystkich modeli: płatnych i bezpłatnych, do ściągnięcia i nie do ściągania. Chyba najlepiej po polsku mówi GPT-4 – płatny i nie do ściągnięcia.

Tu macie stronę, gdzie można przetestować możliwości tego modelu: LLaMA2 Chatbot by a16z-infra. Na szybko sprawdziłem, że wie, kto teraz jest prezydentem Polski, ale przysłowia „Baba z wozu, koniom lżej” nie zna.

2. Te modele da się „odpalić” na zwykłym komputerze, ale tylko te najmniejsze i najgorsze – czyli nie te, które mogą ścigać się z czatem GPT 3,5. Trzeba wypasionego komputera, żeby móc docenić zabawę z Llamą2. Do największej Llamy (70B) trzeba np. karty graficznej, która kosztuje 6 tysięcy $. Niebagatelne będą też rachunki za prąd – taki komputer zżera sporo energii. Z tym, że można mieć nadzieję, że w przyszłości tańszy i mniej wymagający sprzęt będzie potrzebny do postawienia własnego modelu Llamy – w zasadzie co miesiąc pojawia się kolejna praca naukowa pokazująca, jak sprytniej i bardziej efektywnie można te modele budować i uruchamiać.  

Modele można ściągać tu: <—-

Modele Llama 2 są dostępne również do użytku komercyjnego pod warunkiem, że firma ich używająca nie będzie miała więcej niż 700 milionów użytkowników miesięcznie.

Firma Meta prowadzi buduje modele sztucznej inteligencji i finansuje badania sztucznej inteligencji. Pod koniec kwietnia Yann LeCun główny naukowiec Meta ds. sztucznej inteligencji na Twitterze informował, że firma rozwija 7 modeli (wszystkie mają być udostępniane).

Modele Llama2 od Mety nie są jedynymi Dużymi Modelami Językowymi, które można ściągać z sieci i użytkować prywatnie lub komercyjnie. Na GitHubie (repozytorium) jest ich ponad 20. Niektóre dobrze znane to Bloom, Falcon czy MPT. Newsem w tym przypadku jest fakt, że Meta z sukcesem oraz intensywnie pracuje nad rozwojem swoich modeli oraz udostępnia je do użytku komercyjnego.

Czemu Meta to zrobiła? Oficjalnie twierdzą, że dlatego, bo chcą żeby wszyscy mieli równy dostęp do sztucznej inteligencji oraz dlatego, że tylko wtedy, jeśli dużo ludzi będzie pracowało nad tymi modelami, to będą bezpieczniejsze i ogólnie będą lepsze.
Inny możliwy powód? Walka o udział w rynku. W tej chwili mnóstwo firm internetowych wymyśla kolejne usługi oparte o czata GPT od OpenAI. Teraz rynek za darmo dostał konkurencyjne narzędzie, całkiem niezłe podobno. Narzędzie w które Meta zainwestowała nie mniej niż 20 milionów $ (ocena ekspertów – m.in. Jim Fan z Nvidii), ale które, jeśli się upowszechni, to pomoże im rozwinąć produkt a potem zaoferować jego kolejne, poprawione wersje.