Pierwsza warszawska edycja THATCampu

Pierwsza warszawska edycja THATCampu

6.11.2013

Organizatorzy: Centrum Humanistyki Cyfrowej IBL PAN, MiTo

Patronat medialny: Człowiek i technologie

THATCamp (The Humanities and Technology Camp) to otwarte, bezpłatne i nieformalne spotkania poświęcone szeroko pojętym związkom między technologią a humanistyką. W obrębie zainteresowania znajduje się zarówno wykorzystywanie nowych technologii w badaniach humanistycznych, jak i zagadnienia związane z archiwami, bibliotekami czy praktykami artystycznymi. W Polsce spotkania z cyklu THATCAMP organizowano dotąd w Lublinie i Poznaniu.

Warszawski THATCamp odbył się przy okazji konferencji Teksty kultury uczestnictwa, zorganizowanej przez IBL PAN. Prezentacje na THATCampie dotyczyły zagadnień związanych z literaturą i językiem (literatura cyfrowa, elektroniczne edycje dzieł literackich, komputerowe badania lingwistyczne, biblioteki cyfrowe, analiza dyskursu internetowego, rynek książki, e-booki, narracja w grach, wspólnoty interpretacyjne online etc.).

Program:

Maciej Maryl, Centrum Humanistyki Cyfrowej IBL PAN, Po co literaturoznawcom komputery? O pożytkach z humanistyki cyfrowej

Wprowadzenie w problematykę spotkania. Prezentacja głównych nurtów humanistyki cyfrowej w kontekście badań literackich i lingwistycznych.

Włodzimierz Bolecki, IBL PAN, Nowe metody prezentacji wyników badań naukowych na przykładzie witryny projektu „Sensualność w kulturze polskiej”

Przedstawienie nowoczesnej platformy cyfrowej, pełniącej funkcję tematycznej,  specjalistycznej, encyklopedii multimedialnej, dostępnej w formie serwisu internetowego. „Sensualność w kulturze polskiej” to projekt badawczy skupiony na roli zmysłów w języku, piśmiennictwie i sztuce od średniowiecza do współczesności. Sensualność rozumiana jest tu jako historycznie zmienny zbiór form reprezentacji ludzkich zmysłów.

Jerzy Tyszkiewicz, UW, Zmienne koleje losu programu edytorskiego „Magik”

„Magik” to specyficzny edytor tekstów, którego podstawową funkcją nie jest pisanie i  formatowanie, tylko porównywanie tekstów napisanych w innych edytorach. Program zostałnapisany przez studentów Wydziału Matematyki, Informatyki i Mechaniki UW pod kierunkiem prelegenta, który przedstawił zarówno sam program, jak i jego dalsze losy.

Jan Rybicki i Maciej Eder, UJ, UP Kraków, Stylistyka komputerowa: sukcesy i wyzwania

Na ogół wystarczy obliczyć częstości kilkudziesięciu najczęstszych słów w kilku czy kilkunastu badanych tekstach, np. powieściach, by skutecznie wnioskować o ich autorstwie.

Taka literacka daktyloskopia już od dawna wspomaga atrybucję autorską; ale czy wykrywane metodami statystycznymi podobieństwa między tekstami różnych pisarzy mogą stać się nowym narzędziem analizy, kategoryzacji i periodyzacji literackiej?

Maciej Piasecki, PWr, CLARIN-PL,  Od programów dla wtajemniczonych do przystępnych informatycznych narzędzi badawczych do analizy zapisów języka

CLARIN (Common Language Resources & Technology Infrastructure) to ogólnoeuropejska infrastruktura naukowa, która umożliwi badaczom z dziedziny nauk humanistycznych i społecznych wygodną pracę z bardzo dużymi zbiorami tekstów. Celem CLARIN pokonanie szeregu barier w dostępie do tzw. technologii językowej przez naukowców, którzy nie mają specjalistycznej wiedzy w dziedzinie informatyki lub inżynierii języka naturalnego. CLARIN-PL to polska część wielkiej europejskiej sieci, ściśle zintegrowana, ale szczególne ukierunkowana na język polski, zarówno w piśmie jak i mowie. W trakcie prezentacji zostały przedstawione zarówno plany jak pierwsze dostępne narzędzia.

Maciej Piasecki, PWr, Słowosieć -wielka sieć znaczeń na potrzeby tropienia znaczeń w sieci słów

Słowosieć(ang. plWordNet) to unikalny słownik zapewniający sformalizowany opis znaczeń ogromnej liczby słów języka polskiego. Każde znaczenie jest opisane poprzez jego relacje semantyczne z wieloma innymi znaczeniami innych słów. W trakcie prezentacji przedstawione zostały podstawowe zasady budowy Słowosieci, sposobu posługiwania się nią i możliwości jej wykorzystania w analizie tekstów i mowy.

Piotr Wciślik, Open Society Archives at the Central European University, Zabawy z MARC w archiwum i poza nim

Prelegent opowiedział o powstawaniu cyfrowej kolekcji bibuły w Open Society Archives, a zwłaszcza o eksperymentach z rekordami bibliograficznymi Biblioteki Narodowej. W tym kontekście poruszył również bardziej ogólną kwestię potencjału przetwarzania danych bibliograficznych w badaniach humanistycznych.

Małgorzata Marciniak i Agnieszka Mykowiecka, Instytut Podstaw Informatyki PAN, Korpus tekstów o sztuce

W prezentacji podjęto próbę odpowiedzi na pytanie w jakim celu zajmujemy się gromadzeniem tekstów z dziedziny kultury i sztuki. Dlaczego Narodowy Korpus Języka Polskiego nam nie wystarcza jeśli chcemy na przykład umieć efektywniej korygować artykuły dziedzinowe. Czy wystarcza nam słownik ogólnego języka? Jeśli nie, to jak nauczyć się specyficznego słownictwa i zwrotów? Dlaczego chcemy umieć rozpoznawać w tekstach cytaty w obcym języku i na ile powinniśmy umieć identyfikować nazwy własne, w tym tytuły tak charakterystyczne dla tekstów o sztuce.

Maciej Strybel ICM UW, CEJSH – bibliograficzna baza czasopism humanistycznych i społecznych

CEJSH (The Central European Journal Of Social Sciences And Humanities) jest bazą danych (bibliograficzno-abstraktową i pełnotekstową), powstałą w 2004 r. jako wspólne  przedsięwzięcie akademii nauk krajów Grupy Wyszehradzkiej. CEJSH współpracuje z ok. 600 czasopismami z dziedziny humanistyki i nauk społecznych, ukazującymi się w Europie Środkowej i Wschodniej. Baza współdziała z ICM UW w ramach Wirtualnej Biblioteki Nauki, promując idee Otwartego Dostępu i współtworząc największe w Polsce cyfrowe zasoby wiedzy. Od 2011 roku CEJSH znajduje się na liście baz referencyjnych dla czasopism z zakresu nauk humanistycznych i społecznych uwzględnianych przez MNiSW podczas ewaluacji krajowych czasopism naukowych.

Joanna Raczkowska, ICM UW, „Otwórz książkę”. Dziel się wiedzą, twórz naukę

Wystąpienie miało charakter informacyjny, mający na celu prezentację serwisu ”Otwórz książkę\” (http://otworzksiazke.pl/), prowadzonego przez Centrum Otwartej Nauki ICM UW. To projekt ponadregionalnej, ponadinstytucjonalnej i multidyscyplinarnej kolekcji prac polskich uczonych, złożonej ze zdigitalizowanych publikacji naukowych. Zarys mapy działalności serwisu obejmuje: cele, rodzaje zbiorów i sposoby ich udostępniania (w tym narzędzia technologiczne i prawne), społeczność czytelników i autorów (w tym kryteria doboru autorów i diagnozę potrzeb użytkowników), partycypację serwisu w kształtowaniu polskiej komunikacji naukowej, perspektywy itp.

Łukasz Karpiński, UW, Parametryczny opis tekstu – program Pantext 2.0

Prezentacja dotyczyła wyników raportów generowanych przez program komputerowy Pantext ukierunkowanego na eksperymentalne metody pomiaru i analizy wybranych tekstów nacechowanych różnymi emocjami i przedstawienia ich w formie danych liczbowych lub wykresów. Docelowym efektem prac będzie podanie metody analitycznej oraz gotowych zestawień wartości liczbowych dla poszczególnych rodzajów tekstu. Analiza parametryczna stawia sobie za zadanie przekazanie translatorowi właściwych zmiennych numerycznych o określonych wartościach, co pozwoli algorytmowi translatora efektywnie dobrać odpowiedni (zestaw) ekwiwalent(ów) w innym języku. Opracowywany algorytm może wskazywać również potencjalne formy nietypowe – metafory, a także archaizmy. Prace stanowią również wstęp do budowy modeli cyfrowych definicji.

Jakub Jagiełło, UAM, Symulacje jako narzędzie prezentacji idei humanistycznych

Wykorzystanie narzędzi, jakie oferuje informatyka i interfejsy współczesnych systemów, do prezentacji wiedzy naukowej (w formie symulacji i różnych form hipertekstowych) nie jest niczym nowym, jednak do tej pory najlepiej sprawdzało się na gruncie nauk ścisłych, takich jak matematyka, fizyka i astronomia — w których większość teorii daje się sprowadzić do formy wykresu, formuły matematycznej lub schematu. Dlaczego jednak nie użyć takiego sposobu narracji i w innych dziedzinach? Aby pokazać, że jest to możliwe autor przygotował hipertekstowo-symulacyjne realizacje kilku teorii humanistycznych (jak np. nie zdeterminowania przekładu Quine’a).

Gwido Zlatkes, University of California, Riverside, Dwie przyszłości książki

Wraz z pojawieniem się książki elektronicznej, kindlei i-padów obwieszczano zmierzch książki takiej jak ją znamy, kodeksu czyli papierowego tomu. Już obecnie widać, że proroctwa te były co najmniej grubo przesadzone jeśli nie wręcz fałszywe. Ale czy całkowicie błędne – bo jeśli nie, to w jakim zakresie i pod jakimi względami? W wystąpieniu podjęto próbę nakreslenia jaka przyszłość, czy raczej jakie przyszłości – elektroniczne i papierowe – zdają się czekać książkę, czyli przekaz oparty na zapisanym tekście.

Urszula Pawlicka, Uniwersytet Warmińsko-Mazurski, Antologia polskiej literatury cyfrowej – work in progress

Prezentacja powstającej, pierwszej w Polsce, antologii literatury cyfrowej pod red. Piotra Mareckiego, Urszuli Pawlickiej i Mariusza Pisarskiego. Antologia, zawierająca ok. 40 utworów, ukaże się w Korporacji Ha!art jeszcze tego roku. Podczas wystąpienia przedstawiono cel antologii, budowę, kryteria wyboru projektów oraz problemy i wątpliwości wyłaniające się w trakcie jej przygotowywania.

Aneta Bassa, UW, Krytyka literacka we Francji a internet

Prelegentka w swoich badaniach zajmuje się zmianami zachodzącymi we francuskiej krytyce literackiej pod wpływem nowych technologii. Prezentacja stanowiła  porównanie portali poświęconych książkom, działających według odrębnych modeli. Zaprezentowano kolejno Larepubliquedeslivres.com Assouline’a, który z bloga jednego krytyka przekształcił się w  portal moderowany przez kolektyw. Przykładem pośrednim jest Onlalu.com założony z inicjatywy profesjonalistów sektora wydawniczego, w którym recenzje krytyków przeplatają się z opiniami amatorów. Kończąc przedstawię serwis społecznościowy Babelio.com,  skupiający ponad 50 tys. aktywnych czytelników. Analiza modeli funkcjonowania, profilu autorów i organizacji treści pozwala określić, w jaki sposób krytyka literacka reaguje na zmiany w technologii, a także na coraz silniejszy głos amatorów.

Jarosław Kopeć, Pracownia Badań Czytelnictwa, BN, Cyfrowy humanista bada czytelnictwo

W ramach badań czytelnictwa prowadzonych przez Bibliotekę Narodową prelegent prowadzi projekt badawczy, którego zadaniem jest odpowiadanie na pytania związane z czytelnictwem w związku z nowymi technologiami komunikacyjnymi. Pierwszy etap badań będzie głęboko zakorzeniony w metodach cyfrowej humanistyki, a jego celem będzie wskazanie strategii zdobywania i przetwarzania informacji z wykorzystaniem Internetu. Nadziejami i obawami związanymi z tym projektem podzielił się z uczestnikami THATCampu.

Marcin Wilkowski, Historia i Media Otwarty skrypt akademicki – potencjał i problemy

W wystąpieniu przedstawiono koncepcje udostępniania i rozbudowy otwartego podręcznika do historii cyfrowej (”Wprowadzenie do historii cyfrowej”).

Michał „rysiek” Woźniak, Fundacja Wolnego i Otwartego Oprogramowania, Kultura tylko do odczytu

Kultura zawsze była czymś wspólnym, w kulturze się uczestniczyło, kulturę się współtworzyło. Toksyczny mix nowoczesnych form komunikacji, zapośredniczenia przez środki techniczne, archaicznego prawa autorskiego i dużych pieniędzy stworzył jednak sytuację, w której uczestnictwo staje się „naruszeniem praw na dobrach niematerialnych”, a kultura staje się coraz bardziej tylko do odczytu. Czy dalej możemy stać na ramionach olbrzymów, by widzieć dalej, czy musimy na to wykupić licencję?

 

THAT Camp_3 THAT Camp_2THAT Camp_4 THAT Camp_1

Napisano w Wydarzenia