Jestem na etapie pisania pracy magisterskiej, dziś akurat postanowiłam raz jeszcze, dla odświeżenia przeczytać esej Łukasza Gołębiowskiego „E-książka/Book. Szerokopasmowa kultura”, który trochę już się przeterminował, ale część treści wydała mi się interesująca, również ze względu na możliwość porównania ze stanem obecnym. Jednak nie w tym rzecz. Do torby odruchowo spakowałam swój czytnik i książkę w wersji papierowej wyżej wymienionego autora. To trochę paradoks – będę czytać o tym, jak książka przestaje być bytem materialnym, a staje się plikiem cyfrowym (Gołębiewski pisał o tym w 2009 roku), ale nie na czytniku, który miał kosztować złotówkę (może jeszcze będzie, w każdym razie tak „prorokował” autor), ale w formie tradycyjnej. Dlaczego? No właśnie, dlaczego, po pięciu miesiącach używania czytnika nagle przerzucam się na książkę tradycyjną?

Powodów jest kilka. Jednym z nich jest oczywiście przyzwyczajenie. Tak, jestem przyzwyczajona do bazgrania po książkach (po tej akurat nie bazgrałam, przysięgam, zaznaczałam tylko lekko ołówkiem co bardziej interesujące fragmenty). Wiem, że mogłabym to zrobić na Kindle’u, jednak ołówek wygrał – zrobiłam to szybciej. Ta przewaga książki tradycyjnej  nad elektroniczną pociąga za sobą kolejną zaletę – linearność (wiem, że to bardziej jej cecha, jednak tym razem urosła w moim odczuciu do rangi zalety). Zdecydowanie szybciej znajdę zaznaczone fragmenty kartkując książkę, niż gdybym miała to robić na czytniku. W dowolnym momencie mogę też do nich wrócić, np. poprzez zagięty wcześniej róg (kolejny grzech, który popełniam). Jedno i drugie (możliwość zakreślania i stosunkowo szybkie wyszukiwanie) pozwolą mi na wygodne pisanie pracy.

Gdy jednak czytam dla przyjemności, przewagę ma Kindle – nad tym nie chcę się tym razem rozwodzić. Ale znów do przygotowywania się na zajęcia wolałabym mieć dokumenty w postaci elektronicznej – mowa tu zarówno o tych, które jeszcze obejmuje prawo autorskie, ale również o tych, które obok niego nawet nie stały. Tutaj wymieniać można w nieskończoność, od XIX-wiecznych czasopism, po starodruki, czy nawet rękopisy (choć w ich przypadku, ze względu na bogate zdobienia, e-czytnik nie ma szans, dopóki kolorowy e-ink się nie zadomowi). Ale nieco nowsze i mniej zdobione dzieła? Czemu nie?

Zbiory bibliotek cyfrowych a potrzeby użytkowników czytników ebooków

Właśnie dlatego jestem za tym, aby biblioteki cyfrowe udostępniały jak największą ilość swoich zbiorów w wersji cyfrowej. Wiem, że starają się, jak mogą (miałam okazję odbyć praktyki w Bibliotece Cyfrowej Uniwersytetu Wrocławskiego), ale czasem brakuje im pragmatycznego podejścia do sprawy. Biblioteki nastawione są na czytelnika, który przegląda ich zbiory na ekranie komputera i pod tym kątem przygotowują publikacje. Mam jednak nadzieję, że czytelnicy na coraz większą skalę będą używali czytników ebooków, czy to do beletrystyki, czy do literatury naukowej, również tej cennej z punktu widzenia historycznego. Co wtedy zrobią biblioteki? Już teraz niektóre czytniki ebooków (np. Iriver HD Story) radzą sobie z formatem djvu, który jest przecież „głównym” formatem bibliotek cyfrowych, ale co z innymi? To pewne, że do standaryzacji nie będzie dążył Amazon, bo ten ma już swoje zbiory w odpowiednim formacie, ani też inni producenci. To księgarnie i biblioteki muszą „dopasować się” do urządzenia, które umożliwi przeglądanie ich zasobów. Może więc w przyszłości polskie biblioteki cyfrowe będą oferowały swoje zbiory nie tylko w formacie PDF i djvu, ale też epub, czy mobi? Z pewnością byłoby to duże ułatwienie dla korzystających.

Koniecznie będzie też dopracowanie technologii rozpoznania tekstu (OCR). Razem z Tomaszem Kalotą postanowiliśmy sprawdzić, jak Kindle radzi sobie z prezentacją Schlesische Privilegirte Staats- Kriegs- und Friedens-Zeitung, śląskiego czasopisma pisanego gotykiem. Publikacja została przygotowana tak, że czytelnik ma możliwość przeglądania obrazu ukazującego oryginalny druk gotycki oraz warstwy tekstowej prezentowanej przy pomocy zestawu standardowych czcionek.

Jest to możliwe dzięki zastosowaniu technologii OCR, która umożliwia rozpoznanie tekstu w plikach graficznych. Polecam poradnik przetwarzania i OCR czasopism drukowanych gotykiem  – do poczytania tutaj. Czasopismo doskonale prezentuje się na ekranie komputera, jeśli przeglądamy je w postaci graficznej, a rozpoznany tekst wykorzystujemy jedynie do przeszukiwania treści.  Jednak w przypadku czytnika od Amazonu nie jest już tak dobrze. Po konwersji pliku PDF do mobi, stronę da się powiększyć jednokrotnie – od biedy można by to przeczytać…

…jednak rozpoznawanie tekstu pozostawia wiele do życzenia.

Powodem problemów z prezentacją rozpoznanego tekstu na czytniku jest wykorzystanie opcji automatycznej analizy układu bloków tekstowych na stronie czasopisma. Oprogramowanie błędnie rozpoznaje układ szpalt w czasopiśmie, często scalając sąsiadujące ze sobą kolumny tekstu, czego konsekwencją jest określenie kierunku przepływu tekstu na przemian przez wiersze z jednej i drugiej szpalty, co uniemożliwia korzystanie z rozpoznanego tekstu na czytniku ebooków. Okazuje się, że czasopisma drukowane przeszło dwieście lat temu posiadają wiele defektów, jak np. krzywe szpalty, które uniemożliwiają zastosowanie opcji automatycznej analizy bloków. Problem ten można rozwiązać wykonując ręczna analizę bloków tekstu na stronie, co jednak sprawia, że czas przetworzenia zdigitalizowanych czasopism do postaci tekstowej wydłuża się kilkadziesiąt razy. Pojawia się więc dylemat, czy digitalizować szybko, ale z ograniczeniami czy wolniej, ale bardziej profesjonalnie. Mając na uwadze dynamiczny rozwój technologii urządzeń mobilnych należy bardzo poważnie rozważyć czy jest sens ponosić niższe koszty digitalizacji, której produkty za moment mogą okazać się mało praktyczne w użytkowaniu.

Wnioski już pojawiły się wcześniej. Postaram się jednak zebrać je jeszcze raz. Zadaniem bibliotek cyfrowych powinno być, oprócz oczywiście zadania głównego, stałe nadążanie za czytelnikiem. Wczoraj jeszcze czytał na ekranie komputera, dziś doskonale radzi sobie z czytnikiem ebooków czy też tabletem. Przecież nadrzędnym celem każdej biblioteki, oprócz gromadzenia zbiorów, jest przecież ich udostępnianie jak najszerszemu gronu. Dlatego tempo podążania krokami czytelników nie powinno się zmniejszać, a wręcz przeciwnie. Tak było przecież do tej pory, gdyby nie to, by może dziś nosilibyśmy ze sobą gliniane tabliczki. To biblioteki stają się niejako „wydawcami” zdigitalizowanych treści.

A jak jest w Waszym przypadku? Czy porzuciliście książkę tradycyjną już na dobre i nie zamierzacie do niej wrócić? Czy może przeciwnie – równie często korzystacie z jednej, jak i drugiej jej formy? Jeśli tak, to kiedy?

Czy jesteście użytkownikami  bibliotek cyfrowych? Co byście zmienili, a co poprawili, aby korzystanie z nich było wygodniejsze z perspektywy „nowoczesnego czytelnika”?