Korpus Spiski - Elektroniczna Baza Gwary Spiskiej

piatok, júl 12, 2019

Miło nam poinformować, że powstał Korpus Spiski, czyli elektroniczna baza tekstów i nagrań gwarowych ze Spisza.

Projekt opracowany został przez zespół badaczy w Instytucie Języka Polskiego PAN w Krakowie, pod kierunkiem profesor Heleny Grocholi-Szczepanek.

Głównym celem projektu jest dokumentacja mowy mieszkańców Spisza oraz opracowanie tekstów i nagrań w formie elektronicznej bazy, która umożliwia przeszukiwanie zasobów oraz odsłuchiwanie autentycznej gwary spiskiej.

Korpus oparty jest na nagraniach rozmów z mieszkańcami Spisza, które przeprowadzono w latach 2015-2018. Badaniami objęto wszystkie 15 wsi polskiego Spisza. Korpus zawiera 250 godzin nagrań transkrybowanych z 340 informatorami, uwzględniając zarówno starszych, jak i młodszych mieszkańców. Wywiady nagrywane były głównie w domach respondentów. Zarejestrowaliśmy wiele ciekawych opowieści o regionie, tradycyjnej kulturze, losach respondentów oraz ich rodzin. Pragniemy złożyć serdeczne podziękowania wszystkim mieszkańcom Spisza, którzy wzięli udział w badaniach.

Korpus zawiera ok. 2 mln form wyrazowych. Występują w nim wyrazy wspólne z językiem ogólnym, niektóre różnią się wymową, odmianą lub znaczeniem. Najciekawszymi jednostkami są wyrazy charakterystyczne dla gwary typu: cupieć, durkać, odziywacka.

Nazwa korpus oznacza elektroniczną bazę językową, która posiada wyszukiwarkę, pozwalającą przeszukiwać zawartość bazy według rozlicznych kryteriów. Można m.in. wyszukiwać wyrazy, np. baca, polny, wozić, konkretne formy wyrazowe, np. bacy, polnego, woził, a także – gramatyczne, np. czasowniki, przymiotniki, zaimki. Korpus ponadto zawiera szczegółowe metadane o respondentach, np. płeć, wiek, wykształcenie, miejscowość itd. Dzięki temu użytkownik korpusu uzyskuje bardzo szczegółowe informacje o tym, w jakiej miejscowości występuje dany wyraz oraz przez kogo jest używany.  

Elektroniczny korpus gwary spiskiej to opracowanie prekursorskie oraz praktyczne w zastosowaniu. Żaden region w Polsce nie posiada elektronicznego korpusu swojej mowy do tej pory. Gwara spiska jako pierwsza ma opracowanie korpusowe języka mówionego (nie tylko teksty, ale żywa mowa). Elektroniczny korpus ma znaczenie przełomowe w archiwizowaniu gwary. Tradycyjne teksty gwarowe, udostępnione w formie papierowej mają ograniczone możliwości przeszukiwania. Jest ono mało skuteczne i bardzo czasochłonne. Korpus Spiski odnajduje dowolną formę we wszystkich miejscach nagrań praktycznie jednym kliknięciem. Ponadto pozwala użytkownikom na szereg wysublimowanych operacji na wynikach wyszukiwania (np. odsłuchiwanie nagrania, zmiana warstwy standaryzowanej na gwarową, filtrowanie metadanych, tworzenie podkorpusów, zestawień statystycznych itp.). Korpus stanowi nowe i nowoczesne narzędzie badawcze, niezwykle praktyczne dla współczesnego humanisty, umożliwia bowiem badanie zjawisk i cech gwary spiskiej. Baza jest również źródłem wiedzy o kulturze mieszkańców wsi. Mamy nadzieję, że Korpus Spiski będzie przydatny dla specjalistów takich dziedzin, jak kulturoznawstwo, historia, socjologia, antropologia, a także wszystkich pasjonatów ziemi spiskiej.

Zapraszamy do korzystania z Korpus Spiskiego, udostępnionego w Internecie pod adresem: https://www.spisz.ijp.pan.pl

Zapraszamy także do polubienia naszej strony na Facebooku https://www.facebook.com/ijp.krakow.pan :-)

Kategoria: