Выданне Rzeczpospolita друкуе размову з Себасціянам Кандрацкім, сузаснавальнікам праекта SpeakLeash, пра польскую мадэль Bielik АІ.
У нашы дні ChataGPT карыстаюцца ўсе. Навошта нам патрэбна польская моўная мадэль Bielik, запыталіся ў аднаго з яе стваральнікаў.
- Гэта пытанне тэхналагічнага суверэнітэту, і справа не ў тым, каб спыніць выкарыстанне інструментаў буйных тэхналагічных кампаній і пачаць выкарыстоўваць Bielik. Гэта было б на шкоду самім сабе. Усё залежыць ад выпадку выкарыстання. Закрытыя мадэлі, такія як ChatGPT, выдатна падыходзяць для пэўных задач. Калі вы хочаце запусціць просты чат для карпаратыўнага конкурсу, які адказвае на пытанні за прызы, Bielik будзе занадта дарагім. Лепш выкарыстаць ChatGPT і заплаціць 10 долараў. Але калі вы хочаце займацца журналісцкімі расследаваннямі і ўважліва вывучаць тоны дакументаў з суда, ChataGPT будзе каштаваць як золата, у той час як Bielik цалкам бясплатны. Гэта адкрытая мадэль. Вы можаце запускаць яе дзе заўгодна – у любым воблаку, па-за воблакам, на польскіх або еўрапейскіх серверах або на вашым працоўным стале. І гэта маё вызначэнне тэхналагічнага суверэнітэту, – гаворыць Себасціян Кандрацкі.
У дадзены момант Bielik АІ выкарыстоўваюць дзве асноўныя групы. Першая – гэта рэгуляваныя кампаніі, або тыя, якія апрацоўваюць канфідэнцыйныя дадзеныя і патрабуюць прыватнасці. Найбольшае распаўсюджванне назіраецца сярод банкаў, таму што яны не могуць адпраўляць усё ў знешняе воблака. Напрыклад, Bank Pekao нядаўна прадэманстраваў, што ён пры дапамозе Bielik АІ ужо аналізуе 1,5 мільёна дакументаў за квартал і 5 мільёнаў транзакцый у дзень. Калі б яны хацелі рабіць гэта ў воблаку, рахункі былі б велізарнымі.
Па той жа прычыне прачынаецца дзяржаўны сектар. Мясцовыя органы ўлады не жадаюць апрацоўваць заяўкі на будаўніцтва або дадзеныя зямельных і іпатэчных рэестраў у воблаку. Тое ж самае тычыцца і вайскоўцаў.
Паводле Себасціяна Кандрацкага, патэнцыял Bielikа велізарны, бо гэта мадэль, бяспечная як інфраструктура, на якой яна будзе выкарыстоўвацца. Дадзеныя нікуды не знікаюць; можна нават адключыць сервер, на якім працуе Bielik, ад Інтэрнэту.
Другая група карыстальнікаў – гэта стартапы, якія хочуць ствараць свае лічбавыя прадукты на Bielik. Гэта магчыма, таму што ён працуе пад ліцэнзіяй Apache 2.0 з адкрытым зыходным кодам і можа выкарыстоўвацца ў камерцыйных мэтах.
Польскую мадэль загрузілі ўжо мільён разоў. Себасціян Кандрацкі кажа, што гэта значнае дасягненне, бо для загрузкі мадэлі патрабуецца графічны працэсар і веды. Гэта не мабільнае прыкладанне.
У будучых планах – новыя мадэлі. Па-першае, Bielik 3.0, які будзе шматмоўным. Па-другое, мадэль Sójka – вельмі невялікая мадэль, якая спецыялізуецца на бяспецы, выяўленні нецэнзурнай лексікі, гвалту, мовы нянавісці і нават крымінальнага кантэнту, напрыклад, пытанняў пра наркотыкі на анлайн-форумах. У планах і сацыяльна важны праект «Грамадзянін Bielik», мадэль, якая таксама разумее выявы.
Rzeczpospolita/ав