PBL lab

Polska Bibliografia Literacka – laboratorium wiedzy o współczesnej kulturze polskiej

Projekt realizowany ze środków Narodowego Programu Rozwoju Humanistyki Maj 2015 – May 2018); NR 0061/NPRH3/H11/82/2014

Materiały: PBL lab poster  (zaprezentowany na konferencji „Big Data in a Transdiciplinary Perspective” conference, Hanower, 25-27 marca 2015)

Projekt ma na celu przeniesienie wypróbowanej metodologii PBL w realia nowych technologii: usprawnienie sposobu pozyskiwania, agregowania i eksportowania danych, aktualizację bazy bibliograficznej i jej poszerzenie o nowe rodzaje materiałów oraz budowę interfejsu badawczego wspomagającego pracę z bazą poprzez narzędzia eksploracji i wizualizacji danych, jak również ułatwienia archiwizacji i dzielenia się wynikami pracy. Efektem będzie nowoczesne narzędzie badawcze, które zapewni pogłębiony i kompleksowy dostęp do kompendium kultury polskiej ostatnich niemal 80-lat: kompletnej bazy bibliograficznej obejmującej literaturę i sztuki pokrewne za lata 1939 – 2002, która łączy w unikalny sposób różnorodne typy materiałów: utwory literackie, książki, czasopisma, przedstawienia teatralne, audycje radiowe, filmy, programy telewizyjne, a docelowo także internetowe formy życia literackiego.

Polska Bibliografia Literacka (opracowywana przez Pracownię Bibliografii Bieżącej IBL PAN) jest unikalną bazą bibliograficzną ze względu na zakres czasowy (od 1944, a de facto od 1939), przedmiotowy (zbiera różnorodne typy materiałów dotyczących szeroko pojętej polskiej kultury literackiej) i rozbudowany system indeksów rzeczowych. PBL, jako baza specjalistyczna (literacka) pełni podobne funkcje jak inne narodowe projekty tego typu, np. ABELL (Annual Bibliography of English Language and Literature), BDSL (Bibliographie der deutschen Sprachund Literaturwissenschaft), czy BLE (Bibliografía de la Literatura Española). Jej głównym celem jest zbieranie wiedzy dotyczącej szeroko pojętej kultury literackiej: PBL gromadzi informacje o utworach i recenzjach, lecz także o adaptacjach filmowych, teatralnych czy radiowych, wzmiankach, nagrodach, festiwalach, znajdują się tu także hasła osobowe polskich ludzi pióra, teatru, filmu, itp. Zasięg PBL obejmuje książki wydane w Polsce, poza granicami kraju, czasopisma polskie krajowe (przede wszystkim naukowe poświęcone literaturoznawstwu, ale także z zakresu filozofii, historii, biblistyki, teologii, czasopisma literackie, kulturalne, kulturalno-społeczne, poświęcone zagadnieniom teatru i filmu oraz wybrane dzienniki o zasięgu ogólnopolskim) i niektóre emigracyjne czy naukowe obce, poświęcone problematyce krajów słowiańskich. Łączna liczba czasopism w każdym roczniku to około 500-600 tytułów (liczba ta jest zmienna z przyczyn obiektywnych). PBL odnotowuje prace z zakresu historii i teorii literatury, krytyki literackiej, metodologii badań literackich, historii literatur obcych oraz materiały dotyczące takich zagadnień, jak literatura ludowa, literatura dla dzieci i młodzieży, pamiętnikarstwo, tematy i motywy literackie, czasopiśmiennictwo, dydaktyka literatury, organizacja nauki o literaturze. Baza zawiera także bogatą dokumentację życia literackiego. Wyszczególnione są zjazdy i sesje literackie, konkursy literackie, nagrody i odznaczenia dla ludzi pióra, plebiscyty, materiały o związkach twórczych, informacje o życiu literackim w poszczególnych ośrodkach oraz za granicą. Zapisy powyższych materiałów nie ograniczają się do podania nazwiska autora i tytułu materiału oraz adresu bibliograficznego, ale zawierają też dodatkowe informacje, np. nazwę organizatora konkursu, fundatora nagrody, nazwiska laureatów, a przy materiałach o dotyczących zjazdów i sesji – nazwę miejscowości, datę i nazwę organizatora.

PBL jest bibliografią selektywną: podstawą gromadzenia materiałów bibliograficznych jest tekst literacki i osoba jego twórcy, a także wszystkie opracowania z tym związane, przy jednoczesnym zastosowaniu czytelnych kryteriów selekcji. Od innych bibliografii krajowych, np. Bibliografii Zawartości Czasopism (BZCz), PBL różni się zakresem (kultura literacka), typem źródeł (np. w bibliografii za lata 1996-1999 PBL opracował przeszło 400 czasopism specjalistycznych, nieuwzględnianych przez BZCz), a także metodologią: PBL uwzględnia nie tylko artykuły, lecz wszystkie teksty z krótkimi notkami włącznie, systematyzując rekordy w ramach rozbudowanej klasyfikacji rzeczowej, uzupełniając je o adnotacje. PBL rejestruje także formy istnienia literatury nieobecne w innych bazach (np. wspomniane wyżej adaptacje). PBL stanowi zatem zasób cennej, różnorodnej wiedzy o kulturze polskiej, który w ramach projektu zostanie poszerzony i zaopatrzony w narzędzia badawcze pozwalające na dokonywanie złożonych operacji na zebranym materiale. Warto podkreślić, iż żadna z wymienionych wyżej baz nie oferuje nowoczesnych narzędzi do pracy z danymi (opisanych szerzej w celach szczegółowych poniżej).

Projekt stanowi także modelowy przykład międzyśrodowiskowej współpracy między humanistami (IBL PAN) a informatykami (PCSS) w duchu humanistyki cyfrowej, będącej jednym z najbardziej obiecujących prądów we współczesnej humanistyce. Prace Kuźni przyczynią się do integracji środowiska cyfrowej humanistyki, a także dostarczą cennej wiedzy eksperckiej dzięki seminariom i wykładom specjalistów z instytucji o bogatszych doświadczeniach, oraz pozwolą się dzielić wypracowanymi narzędziami i wynikami pracy z innymi ośrodkami podczas wspólnych seminariów. Tak pomyślany projekt (bibliografia jako narzędzie badawcze i efekt współpracy międzyśrodowiskowej) wpisuje się także w strategię rozwoju infrastruktury badawczej, sformułowaną przez European Science Foundation w raporcie Research Infrastructures in the Digital Humanities (2011). Zarysowane w tym raporcie cele humanistyki cyfrowej zakładają ścisłą współpracę między humanistami i informatykami w kształtowaniu narzędzi badawczych, postulując długofalową współpracę, która pozwoli na równomierny rozwój budowanych narzędzi.

Efektem projektu będzie laboratorium wiedzy o współczesnej kulturze polskiej – narzędzie badawcze wykorzystujące dane bibliograficzne PBL i (prototypowo) opracowań pokrewnych (Drugi Obieg, II wojna światowa) za lata 1939-2002, obejmująca potencjalnie ponad 3 miliony rekordów (w zależności od liczby rekordów, które uda się automatycznie wprowadzić do bazy). Użytkownicy (badacze literatury i kultury współczesnej) będą mogli prowadzić własne badania przy użyciu prototypowych narzędzi do zestawiania danych z bazy i wizualizacji tychże połączeń. Podkreślmy, iż jest to projekt bez precedensu w światowej humanistyce (inne narodowe bibliografie literackie jak przywoływane wcześniej ABELL, BDSL i BLE korzystają z prostych interfejsów bibliotecznych), który pozwoli uplasować polską naukę w awangardzie badań z zakresu humanistyki cyfrowej.

Niniejszy projekt wpisuje się w trojaki sposób w trendy w cyfrowej humanistyce: po pierwsze, udostępni narzędzia do pracy z bazą danych, wykraczające poza standardową digitalizację; po drugie, będzie stanowić źródło danych dla podobnych projektów, poprzez udostępnienie rekordów PBL w modelu Linked Open Data; po trzecie, prace Kuźni będą miały charakter inkubatora projektów z zakresu humanistyki cyfrowej wykorzystujących PBL, w tym narzędzi które staną się podstawą interfejsu badawczego. Bogata i zróżnicowana wiedza o kulturze zawarta w rekordach PBL jest doskonałym materiałem do odkrywania relacji między różnymi przedstawieniami treści kulturowych o podobnych cechach, co pozwoli na szerokie zastosowanie zwłaszcza we wspomaganych komputerowo badaniach ilościowych literatury, sieciowej analizie życia literackiego z wykorzystaniem GIS (Geospacial Information Systems), czy w budowaniu multimedialnych narracji (tzw. digital storytelling).

Należy także podkreślić charakter rozwojowy projektu – wykorzystane narzędzia mogą być ponownie zastosowane na użytek innych materiałów (np. przetwarzanie innych zdigitalizowanych bibliografii), a w obręb samej bazy będzie można włączać także inne zasoby w miarę potrzeb merytorycznych. Długofalowa strategia rozwoju PBL zakłada, iż w kolejnym etapie prac (po zakończeniu tego projektu) luka w opracowaniu materiału zostanie zmniejszona do koniecznego jednego roku, a w obręb bazy zostaną włączone dokumenty internetowego życia literackiego.

Osoby zaangażowane w projekt:

Maciej Maryl (Kierownik)

Łukasz Bukowiecki

Piotr Wciślik

Współpracują:

Beata Koper

Tomasz Umerle

Projekt realizuje CHC i Pracownia Bibliografii Bieżącej w Poznaniu.

Partner informatyczny: Poznańskie Centrum Superkomputerowo-Sieciowe przy IChB PAN

Koordynacja informatyczna: Marcin Werla (PCSS), Michał Kozak (PCSS)