Ai2 има нови езикови модели конкурентни на Llama

Ai2, изследователската организация с нестопанска цел за изкуствен интелект, основана от покойния Пол Алън, пусна OLMo 2, второто семейство модели от серията OLMo. Макар че не липсват отворени езикови модели, OLMo 2 отговаря на определението на Инициативата за отворен код за ИИ с отворен код, което означава, че инструментите и данните, използвани за разработването му, са публично достъпни.

Инициативата за отворен код, дългогодишната институция, която има за цел да дефинира и управлява всичко с отворен код, финализира своята дефиниция за ИИ с отворен код през октомври. Но първите модели на OLMo, публикувани през февруари, също отговарят на критерия.

В семейството на OLMo 2 има два модела: един със 7 млрд. параметри (OLMo 7B) и един с 13 млрд. параметри (OLMo 13B). Параметрите приблизително съответстват на уменията на модела за решаване на проблеми, а моделите с повече параметри обикновено се представят по-добре от тези с по-малко параметри.

Подобно на повечето езикови модели, OLMo 2 7B и 13B могат да изпълняват редица текстови задачи, като отговаряне на въпроси, обобщаване на документи и писане на код.

Моделите OLMo 2 и всички техни компоненти могат да бъдат изтеглени от сайта на Ai2. Те са под лиценз Apache 2.0, което означава, че могат да се използват с търговска цел.

Leave a Reply

Your email address will not be published. Required fields are marked *