:: NapiGen – automatyczne generowanie napisów do filmów | Fundacja Technologie dla Ludzi

jakiś czas temu, dzięki uprzejmości Fundacji Technologie dla Ludzi (dalej: FTdL), zostałem ambasadorem projektu automatycznego generowania napisów do filmów. miły gest, aczkolwiek nie o gesty tu idzie, ale o użyteczność i znaczenie owego projektu dla wielu osób, o których tak często zapominamy podczas codziennego grzebania w necie.

NapiGen jest wyjątkową inicjatywą polegającą na stworzeniu serwisu, który będzie automatycznie generował napisy do filmów, czy podcastów, a czynić to będzie przy pomocy oprogramowania bazującego na Sztucznej Inteligencji (LLM). przy codziennym używaniu internetu nie myślimy zwyczajowo o osobach niedosłyszących i niesłyszących, a to właśnie dla nich gigantycznym problemem jest często dotarcie do treści, które bez transkrypcji są dla nich bezużyteczne, bądź użyteczne tylko częściowo. myślę, że spora odpowiedzialność w tej materii leży po stronie tych, którzy w necie udostępniają treści audio/video, nie troszcząc się o osoby z niepełnosprawnościami słuchu (często brak owej troski nie wynika z celowego działa, a raczej z niewiedzy, lenistwa etc.).

nie pajacuję i nie nazywam siebie twórcą, aczkolwiek wypluwam co jakiś czas odcinki mojego podcastu [myśl i mowa], dlatego też od razu zainteresowałem się projektem NapiGen, bo najzwyczajniej w świecie uznałem, że dostępność takiego narzędzia jest nie do przecenienia, zwłaszcza, że jego użycie i dostosowanie udostępnianych przez nas treści audio/video właśnie dla osób niesłyszących/niedosłyszących kosztuje naprawdę niewiele wysiłku i czasu!

FTdL udostępniło mi testową wersję beta NapiGen. od razu postanowiłem ją przetestować, generując napisy do jednego z odcinków [myśli i mowy]. sam proces jest relatywnie szybki (chociaż zależy oczywiście od rozmiaru pliku bazowego, z którego NapiGen tworzy automatycznie napisy). robimy upload interesującego nas pliku mp4/mp3, wybieramy język napisów i... gotowe! czekamy cierpliwie na wygenerowanie napisów, które później ściągamy jako pliki SRT lub TXT. możemy również podać URL do istniejącego już pliku audio/video (np. na youtube, czy peertube), aby NapiGen wygenerowało napisy.

jak w praktyce wygląda wygenerowany plik z napisami? świetnie! FTdL naprawdę włożyła sporo pracy w to, by napisy miały ręce i nogi i nie stanowiły kłębowiska dziwnych wyrazów (z czym tak często można zetknąć się w przypadku rozmaitych opcji transkrypcji online). napisy są zsynchronizowane z tempem wymawianych słów w pliku źródłowym, są precyzyjne i całość prezentuje się naprawdę rewelacyjnie. oczywiście nie ma cudów. zauważyłem, że zdarzają się w napisach literówki i “podmiany” pojedynczych słów, ale w moim konkretnym przypadku wynikały one z tego, że niektóre słowa w odcinku podcastu wymawiałem niewyraźnie. niemniej jednak ewentualne błędy w transkrypcji są rzadkie, wręcz pomijalne, biorąc pod uwagę precyzyjność całej transkrypcji. ewentualne literówki i pojedyncze słowa można bez najmniejszego problemu poprawić w pliku SRT/TXT, więc w efekcie – przy naprawdę znikomym wysiłku (NapiGen robi za nas wszystko tak naprawdę) otrzymujemy świetnej jakości transkrypcję tak pomocną osobom mającym kłopoty ze słuchem!

abyście zorientowali się w efektach działania NapiGen, możecie odpalić sobie jeden z odcinków mojego podcastu z już zaimplementowanym plikiem z napisami. znajdziecie go tutaj. tak wygląda screen odcinka z wspomnianymi napisami:

dlaczego warto wesprzeć ekipę FTdL przy pracach nad NapiGen? odpowiedź jest oczywista. to projekt kompletnie oddolny, poza łapskami jakiejś korporacji, dla której jedynym sensownym horyzontem i celem jest zysk i pieniądz. jest to inicjatywa od ludzi, dla ludzi i jej przyszłość zależy od naszego zaangażowania i wsparcia. bezcenną jest natomiast wymierna pomoc dla niesłyszących i niedosłyszących, którzy otrzymują wysokiej jakości napisy, a zatem dostęp do treści, które często były poza ich zasięgiem. możemy więc spokojnie traktować NapiGen, jako element pomocy wzajemnej, gdzie każdy/-a z nas ma realną możliwość przyczynienia się do czegoś dobrego dla innych.

więcej informacji nt projektu otrzymacie, kontaktując się z FTdL, odwiedzając ich stroną, bądź profil na Mastodonie. zachęcam do zagłębienia się w temat!

FTdL – strona główna FTdL- profil na Mastodonie NapiGen – wesprzyj projekt finansowo

··· obrazek: ftdl.pl

 

|discrust