<label class="bottom-margin-less">Dodatkowe dane:</label>
<div class="cfContainer">
<div class="cfHead inlinedisplay">
<div class="inputs">link</div>
<div class="inputs"></div>
</div>
</div>

link

Nowa Jedynka - banner artykułówka

Dzięki neuronowym modelom języka internauci mają m.in. dostęp do usług tłumaczenia tekstu na różne języki

Prace nad neuronowymi modelami języka 
Prace nad rozwojem neuronowych modeli języka trwają w wielu ośrodkach informatycznych i firmach na całym świecie. Branża IT już od dłuższego czasu dostrzega w nich duży potencjał. Mają one coraz większe zastosowanie w życiu każdego użytkownika internetu. 
- Neuronowy model języka to algorytm statystyczny, który modeluje (czy też uczy) rozkładu prawdopodobieństwa słów w teście, w danym języku, poprzez rozwiązywanie sztucznie skonstruowanego zadania lingwistycznego - mówi na antenie Programu 1 Polskiego Radia Sławomir Dadas, zastępca kierownika Laboratorium Inteligentnych Systemów Informatycznych w OPI PIB. - Dzięki temu jest w stanie nauczyć się składni oraz relacji semantycznych pomiędzy słowami w danym języku - tłumaczy. 
 
<div class="audio atarticle emb uid-055d812f-f9c5-4272-b94f-f294e427c3cf audio-default-html"><header> Posłuchaj </header>
<div class="positioner"><span data-media="{&quot;id&quot;:2865015,&quot;file&quot;:&quot;//static.prsa.pl/055d812f-f9c5-4272-b94f-f294e427c3cf.mp3&quot;,&quot;provider&quot;:&quot;audio&quot;,&quot;uid&quot;:&quot;055d812f-f9c5-4272-b94f-f294e427c3cf&quot;,&quot;length&quot;:1449,&quot;autostart&quot;:true,&quot;link&quot;:&quot;&quot;,&quot;title&quot;:&quot;2021_11_30%2019_30_02_PR1_Eureka.mp3&quot;,&quot;desc&quot;:&quot;%20Czym%20s%C4%85%20neuronowe%20modele%20j%C4%99zyka%3F%20%28Eureka%2FJedynka%29%20&quot;,&quot;advert&quot;:0,&quot;type&quot;:&quot;muzyka&quot;}" class="play pr-media-play"> 24:09 2021_11_30 19_30_02_PR1_Eureka.mp3 Czym są neuronowe modele języka? (Eureka/Jedynka) <a data-media="{&quot;id&quot;:2865015,&quot;file&quot;:&quot;//static.prsa.pl/055d812f-f9c5-4272-b94f-f294e427c3cf.mp3&quot;,&quot;provider&quot;:&quot;audio&quot;,&quot;uid&quot;:&quot;055d812f-f9c5-4272-b94f-f294e427c3cf&quot;,&quot;length&quot;:1449,&quot;autostart&quot;:false,&quot;link&quot;:&quot;&quot;,&quot;title&quot;:&quot;2021_11_30%2019_30_02_PR1_Eureka.mp3&quot;,&quot;desc&quot;:&quot;%20Czym%20s%C4%85%20neuronowe%20modele%20j%C4%99zyka%3F%20%28Eureka%2FJedynka%29%20&quot;,&quot;advert&quot;:0,&quot;type&quot;:&quot;muzyka&quot;}" class="iPlus add-to-play"> </a></div>
</div>
 
Pół miliona książek w jednym modelu    
Większość modeli opracowanych jest dla języka angielskiego, dlatego naukowcy z Ośrodka Przetwarzania Informacji - Państwowego Instytutu Badawczego (OPI PIB) stale rozwijają i udostępniają polskojęzyczne modele. W tym roku oddali oni do użytku dwa kolejne - Polish RoBERTa v2 oraz GPT-2.
Model Polish RoBERTa wytrenowano na największym w Polsce korpusie tekstów, który obejmuje 130 GB danych. Odpowiada to prawie pół milionowi książek. - Trenowanie modeli neuronowych wiąże się z tym, że należy zgromadzić duży korpus tekstu. Model neuronowy, aby nauczyć się danego języka, potrzebuje bardzo dużego zbioru tekstów w danym języku - wyjaśnia gość Jedynki.
Naukowcy, trenując Polish RoBERTa, skonstruowali korpus składający się z dwóch części. - W pierwszej części zgromadziliśmy wysokiej jakości teksty, np. teksty pochodzące z Wikipedii, zapisów polskiego parlamentu, wypowiedzi z mediów społecznościowych, dłuższe formy pisane - wylicza Sławomir Dadas. - W drugiej części zgromadziliśmy ekstrakty z polskojęzycznych stron internetowych - dodaje. 
<div class="video">
<div class="embed-video"><iframe width="560" height="315" src="https://www.youtube.com/embed/wRnBxhuDZL8" title="YouTube video player" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen=""></iframe></div>
</div>
źródło: OPI - PIB/Youtube 
GPT-2 i generowanie tekstu  <ytd-channel-name id="channel-name" class="style-scope ytd-video-owner-renderer"></ytd-channel-name>
Model GPT-2 przeznaczony jest do zadań związanych głównie z generowaniem tekstu. Ekspert w rozmowie z Dorotą Truszczak wyjaśnia, czym polskie modele różnią się od siebie. 
- Ośrodek Przetwarzania Informacji - Państwowy Instytut Badawczy (OPI PIB) udostępnił trzy modele. Jeden z nich to Polish RoBERTa v2, drugi GPT-2 i trzeci z modeli to jest BART - mówi gość audycji. - Posiadają podobną architekturę, różnią się technikaliami, z których wynika, do czego te modele mogą być stosowane. Polish RoBERTa jest przeznaczony do rozumienia tekstu, BART przeznaczony do zadań "sequence to sequence" czyli takich, gdzie wejściem i wyjściem modelu jest tekst i GPT-2 do zadań związanych z generowaniem tekstu - słyszymy. 
Czytaj też: 
<ul>
<li><a href="https://redaktor2.polskieradio.pl/CMS/ContentManagement/Preview/Article.aspx?id=2810721" target="_blank" class="title">"Pozwala Rosjanom nas dezinformować". Michał Marek o aplikacji Telegram</a></li>
<li><a href="https://redaktor2.polskieradio.pl/CMS/ContentManagement/Preview/Article.aspx?id=2755911" target="_blank" class="title">Annobot - rozmowa z maszyną o ludzkich emocjach</a></li>
</ul>
Poza tym w audycji:
"Dlaczego w niedzielę 13 grudnia 1981 roku w telewizji nie pokazano dobranocki dla dzieci "Pszczółki Mai"? Ponieważ nie udało się znaleźć właściwego rozmiaru munduru dla Gucia" czy "Puk, puk… Kto tam? Interniści! Ale ja jestem zdrów! A my nie przyszliśmy was leczyć, tylko internować!" to tylko dwa z licznych dowcipów powstałych po ogłoszeniu stanu wojennego, które zostały przypomniane w książce "Nikczemność i honor. Stan wojenny w stu odsłonach".
To wydarzenie sprzed 40 lat, w niedzielną mroźną zimę 13 grudnia 1981 roku, którym władze komunistyczne brutalnie zakończyły karnawał Solidarności, kiedy na ulicach pojawiły się czołgi, skoty, ma wiele obliczy. Każdy, kto żył w tamtych czasach, doświadczył stanu wojennego, może opowiedzieć swoją historię. Nierzadko dramatyczną. W stu odsłonach opisali ją trzej historycy z Uniwersytetu Mikołaja Kopernika w Toruniu: prof. Wojciech Polak, prof. Sylwia Galij-Skarbińska i ks. Michał Damazyn. Dlaczego autorzy wybrali takie, a nie inne wydarzenia? Opowiedział o tym historyk prof. Wojciech Polak.
Zobacz także:
<ul>
<li><a href="https://www.polskieradio.pl/7/5098/Artykul/2856350,Jaki-wplyw-na-organizm-maja-zaburzenia-snu" target="_blank">Jaki wpływ na organizm mają zaburzenia snu?</a></li>
<li><a href="https://www.polskieradio.pl/7/5098/Artykul/2851295,Tanczace-serce-wspomaga-kardiologow-Badania-polskich-naukowcow" target="_blank">"Tańczące serce" wspomaga kardiologów. Badania polskich naukowców</a></li>
</ul>
***
Tytuł audycji: <a href="https://www.polskieradio.pl/7,Jedynka/5098,EUREKA" target="_blank">Eureka</a>
Prowadzi: <a href="https://www.polskieradio.pl/Dorota-Truszczak/Tag172801" target="_blank">Dorota Truszczak</a>
Goście: Sławomir Dadas (zastępca kierownika Laboratorium Inteligentnych Systemów Informatycznych w OPI PIB), prof. Wojciech Polak (historyk, UMK w Toruniu)
Data emisji: 30.11.2021 r. 
Godzina emisji: 19.30
mat. prasowe/ans