Jestem na etapie pisania pracy magisterskiej, dziś akurat postanowiłam raz jeszcze, dla odświeżenia przeczytać esej Łukasza Gołębiowskiego „E-książka/Book. Szerokopasmowa kultura”, który trochę już się przeterminował, ale część treści wydała mi się interesująca, również ze względu na możliwość porównania ze stanem obecnym. Jednak nie w tym rzecz. Do torby odruchowo spakowałam swój czytnik i książkę w wersji papierowej wyżej wymienionego autora. To trochę paradoks – będę czytać o tym, jak książka przestaje być bytem materialnym, a staje się plikiem cyfrowym (Gołębiewski pisał o tym w 2009 roku), ale nie na czytniku, który miał kosztować złotówkę (może jeszcze będzie, w każdym razie tak „prorokował” autor), ale w formie tradycyjnej. Dlaczego? No właśnie, dlaczego, po pięciu miesiącach używania czytnika nagle przerzucam się na książkę tradycyjną?
Powodów jest kilka. Jednym z nich jest oczywiście przyzwyczajenie. Tak, jestem przyzwyczajona do bazgrania po książkach (po tej akurat nie bazgrałam, przysięgam, zaznaczałam tylko lekko ołówkiem co bardziej interesujące fragmenty). Wiem, że mogłabym to zrobić na Kindle’u, jednak ołówek wygrał – zrobiłam to szybciej. Ta przewaga książki tradycyjnej nad elektroniczną pociąga za sobą kolejną zaletę – linearność (wiem, że to bardziej jej cecha, jednak tym razem urosła w moim odczuciu do rangi zalety). Zdecydowanie szybciej znajdę zaznaczone fragmenty kartkując książkę, niż gdybym miała to robić na czytniku. W dowolnym momencie mogę też do nich wrócić, np. poprzez zagięty wcześniej róg (kolejny grzech, który popełniam). Jedno i drugie (możliwość zakreślania i stosunkowo szybkie wyszukiwanie) pozwolą mi na wygodne pisanie pracy.
Gdy jednak czytam dla przyjemności, przewagę ma Kindle – nad tym nie chcę się tym razem rozwodzić. Ale znów do przygotowywania się na zajęcia wolałabym mieć dokumenty w postaci elektronicznej – mowa tu zarówno o tych, które jeszcze obejmuje prawo autorskie, ale również o tych, które obok niego nawet nie stały. Tutaj wymieniać można w nieskończoność, od XIX-wiecznych czasopism, po starodruki, czy nawet rękopisy (choć w ich przypadku, ze względu na bogate zdobienia, e-czytnik nie ma szans, dopóki kolorowy e-ink się nie zadomowi). Ale nieco nowsze i mniej zdobione dzieła? Czemu nie?
Zbiory bibliotek cyfrowych a potrzeby użytkowników czytników ebooków
Właśnie dlatego jestem za tym, aby biblioteki cyfrowe udostępniały jak największą ilość swoich zbiorów w wersji cyfrowej. Wiem, że starają się, jak mogą (miałam okazję odbyć praktyki w Bibliotece Cyfrowej Uniwersytetu Wrocławskiego), ale czasem brakuje im pragmatycznego podejścia do sprawy. Biblioteki nastawione są na czytelnika, który przegląda ich zbiory na ekranie komputera i pod tym kątem przygotowują publikacje. Mam jednak nadzieję, że czytelnicy na coraz większą skalę będą używali czytników ebooków, czy to do beletrystyki, czy do literatury naukowej, również tej cennej z punktu widzenia historycznego. Co wtedy zrobią biblioteki? Już teraz niektóre czytniki ebooków (np. Iriver HD Story) radzą sobie z formatem djvu, który jest przecież „głównym” formatem bibliotek cyfrowych, ale co z innymi? To pewne, że do standaryzacji nie będzie dążył Amazon, bo ten ma już swoje zbiory w odpowiednim formacie, ani też inni producenci. To księgarnie i biblioteki muszą „dopasować się” do urządzenia, które umożliwi przeglądanie ich zasobów. Może więc w przyszłości polskie biblioteki cyfrowe będą oferowały swoje zbiory nie tylko w formacie PDF i djvu, ale też epub, czy mobi? Z pewnością byłoby to duże ułatwienie dla korzystających.
Koniecznie będzie też dopracowanie technologii rozpoznania tekstu (OCR). Razem z Tomaszem Kalotą postanowiliśmy sprawdzić, jak Kindle radzi sobie z prezentacją Schlesische Privilegirte Staats- Kriegs- und Friedens-Zeitung, śląskiego czasopisma pisanego gotykiem. Publikacja została przygotowana tak, że czytelnik ma możliwość przeglądania obrazu ukazującego oryginalny druk gotycki oraz warstwy tekstowej prezentowanej przy pomocy zestawu standardowych czcionek.
Jest to możliwe dzięki zastosowaniu technologii OCR, która umożliwia rozpoznanie tekstu w plikach graficznych. Polecam poradnik przetwarzania i OCR czasopism drukowanych gotykiem – do poczytania tutaj. Czasopismo doskonale prezentuje się na ekranie komputera, jeśli przeglądamy je w postaci graficznej, a rozpoznany tekst wykorzystujemy jedynie do przeszukiwania treści. Jednak w przypadku czytnika od Amazonu nie jest już tak dobrze. Po konwersji pliku PDF do mobi, stronę da się powiększyć jednokrotnie – od biedy można by to przeczytać…
…jednak rozpoznawanie tekstu pozostawia wiele do życzenia.
Powodem problemów z prezentacją rozpoznanego tekstu na czytniku jest wykorzystanie opcji automatycznej analizy układu bloków tekstowych na stronie czasopisma. Oprogramowanie błędnie rozpoznaje układ szpalt w czasopiśmie, często scalając sąsiadujące ze sobą kolumny tekstu, czego konsekwencją jest określenie kierunku przepływu tekstu na przemian przez wiersze z jednej i drugiej szpalty, co uniemożliwia korzystanie z rozpoznanego tekstu na czytniku ebooków. Okazuje się, że czasopisma drukowane przeszło dwieście lat temu posiadają wiele defektów, jak np. krzywe szpalty, które uniemożliwiają zastosowanie opcji automatycznej analizy bloków. Problem ten można rozwiązać wykonując ręczna analizę bloków tekstu na stronie, co jednak sprawia, że czas przetworzenia zdigitalizowanych czasopism do postaci tekstowej wydłuża się kilkadziesiąt razy. Pojawia się więc dylemat, czy digitalizować szybko, ale z ograniczeniami czy wolniej, ale bardziej profesjonalnie. Mając na uwadze dynamiczny rozwój technologii urządzeń mobilnych należy bardzo poważnie rozważyć czy jest sens ponosić niższe koszty digitalizacji, której produkty za moment mogą okazać się mało praktyczne w użytkowaniu.
Wnioski już pojawiły się wcześniej. Postaram się jednak zebrać je jeszcze raz. Zadaniem bibliotek cyfrowych powinno być, oprócz oczywiście zadania głównego, stałe nadążanie za czytelnikiem. Wczoraj jeszcze czytał na ekranie komputera, dziś doskonale radzi sobie z czytnikiem ebooków czy też tabletem. Przecież nadrzędnym celem każdej biblioteki, oprócz gromadzenia zbiorów, jest przecież ich udostępnianie jak najszerszemu gronu. Dlatego tempo podążania krokami czytelników nie powinno się zmniejszać, a wręcz przeciwnie. Tak było przecież do tej pory, gdyby nie to, by może dziś nosilibyśmy ze sobą gliniane tabliczki. To biblioteki stają się niejako „wydawcami” zdigitalizowanych treści.
A jak jest w Waszym przypadku? Czy porzuciliście książkę tradycyjną już na dobre i nie zamierzacie do niej wrócić? Czy może przeciwnie – równie często korzystacie z jednej, jak i drugiej jej formy? Jeśli tak, to kiedy?
Czy jesteście użytkownikami bibliotek cyfrowych? Co byście zmienili, a co poprawili, aby korzystanie z nich było wygodniejsze z perspektywy „nowoczesnego czytelnika”?



Bardzo fajny wpis.
Niestety jeszcze nie jestem posiadaczem żadnego czytnika, ale widzę, że trzeba będzie sobie sprawić prezent w postaci Kindla, bo już nie strzymię tego:)
Jako bibliotekarz polecam czytelnikom biblioteki cyfrowe. Sam również z czystego zainteresowania przeglądam dostępne publikacje. Zdecydowanie chciałbym, aby w bibliotekach cyfrowych udoskonalono wyszukiwanie poprzez treść publikacji. Dla mnie fantastycznie pod tym względem działa Google Books. Zapewne ma to coś wspólnego z oprogramowaniem i tym podobne. Jednak nie znam się na tym zupełnie. Pozdrawiam serdecznie i owocnego pisania!
Dziękuję bardzo! Jeśli będziesz potrzebował czytnika, polecam Kindle’a właśnie, choć może lepiej jeszcze chwilę poczekać, aż Amazon zacznie wysyłać również wersje z dotykowym ekranem? Gdybyś miał problem z wyborem, chętnie pomogę 🙂
A co do przeszukiwania poprzez treść, to również nad tym ubolewam – przecież sam tytuł, czy nawet słowa kluczowe nie oddadzą wszystkiego, co w publikacji zawarte.
Do autorki – „Zdecydowanie szybciej znajdę zaznaczone fragmenty kartkując książkę”. Przecież np. na Kindle możesz wyświetlić wszystkie podkreślone pozycje na raz. Więc chyba jednak szybciej na czytniku.
Oczywiście, że mogę. Ale zaznaczanie fragmentów na Kindle’u zajmuje mi więcej czasu, niż, gdy robię to ołówkiem. Może to kwestia wprawy, ale póki co, przy podkreślaniu wielu fragmentów książka tradycyjna wygrywa.
Poza tym, podałam przykład pozycji naukowej, którą czyta się trochę inaczej, niż beletrystykę. Co mi po tym, że Kindle wyświetli mi wszystko na raz, skoro nie wiem, co było przed, ani co było po, a również jest to dla mnie ważne. W przypadku książki, którą czytam wyłącznie do przyjemności mogę sobie zaznaczyć ciekawy cytat na Kindle’u i nie ma dla mnie znaczenia, że jest zupełnie wyrwany z kontekstu.
Rzeczywiście szybciej się podkreśla ołówkiem. Jeszcze mały komentarz, bo może nie wiesz – jak klikniesz na Kindle na podkreślenie (jak masz wyświetlone wszystkie) to widzisz cały kontekst (i w przód i w tył).
Cała sprawa wynika z ogromnego przyzwyczajenia do materialności książki. Podejrzewam, że większość czytelników czuje się z fizyczną papierową książką bezpieczniej, ponieważ jeżeli coś zostało utrwalone w sposób od wieków znany i użyteczny, to jest po prostu wygodne. Zamierzam tu przedstawić pogląd z trochę innej strony — dla mnie książka papierowa jest użyteczna do tego, aby mieć ją na półce, przenosić z miejsca na miejsce, wykorzystywać jako fizyczny obiekt o określonej masie do dociśniecia czegoś — nie jest jednak zbyt użyteczna do czytania z powodu jej wielu ograniczeń w stosunku do postaci cyfrowej. Pomijając nawet wszystkie udogodnienia w postaci odwołań oraz wyszukiwania pełnotekstowego, bardzo ważny jest dla mnie aspekt wizualny i jego konfigurowalność (w przypadku fizycznej postaci książki — żadna). Wielokrotnie zdarzyło mi się odrzucać niektóre książki z powodu nieładnego układu typograficznego lub ponieważ po prostu nie mogłem zdzierżyć czcionki, którą dzieło było wydrukowane. Na dodatek, z powodu mojej preferencji dla tekstu jaśniejszego od tła, właściwie wszystkie papierowe książki są dla mnie mało wygodne. Cyfrowa postać książki (rozumiana tu jako całkowite oderwanie treści od formy) przynosi dla mnie konkretne rozwiązania. W tym momencie wszystko sprowadza się do tego, jak postrzegamy dzieło — czy zastanawiamy się czym ono właściwie jest i do czego nam może służyć. Jeżeli w ten sposób będziemy postrzegać dzieła, to mająca na celu doprowadzenie ich do takiej postaci digitalizacja, będzie skutkować powstawaniem zupełnie nowych wydań. Pierwsze projekty digitalizacyjne właśnie tak działały — dzieła przepisywano. Przeglądając jakieś stare zalecenia digitalizacyjne, napotkałem na ewaluację kosztów poszczególnych metod, i wtedy (jeżeli wziąć pod uwagę mniejszą dostępność skanerów, niską skuteczność rozpoznania tekstu, limity pamięci dyskowych i łączy) przeklepanie książki było uważane za metodę znacznie tańszą. Rozwój technologoczny zmienił realia, aczkolwiek wciąż nie jesteśmy w stanie zmusić komputerów do stuprocentowego rozpoznania tekstu — i jestem szczerze przekonany o tym, że nie będziemy w stanie dokonać tego, dopóki nie powstanie prawdziwie inteligentna sztuczna inteligencja, która będzie w stanie rozumieć kontekst zdań i poprawnie uzupełniać brakujące znaki. Tańsze dyski, wydajniejsze maszyny i szybsze łącza spowodowały, że po prostu przy masowej digitalizacji wybiera się rozwiązania łatwiejsze w realizacji. Po prostu robimy zdjęcia książkom. Warstwa tekstowa zdigitalizowanych dokumentów służy jedynie do wyszukiwania — i tak czytamy ze zdjęcia książki. W takim modelu skuteczność OCR jedynie limituje jakość wyszukiwania (w związku z tym, że i tak nie da się przeszukiwać w ten sposób dokumentów papierowych, nawet możliwość mało skutecznego wyszukiwania jest wielką zaletą). To sprowadza nas do tezy, iż zdigitalizowanie fizycznej postaci książki jest niemożliwe. Pewnych aspektów przenieść się po prostu nie da. Tak więc zdigitalizowana książka jest jedynie surogatem — i właściwie ma to więcej zalet niż wad. Jeżeli chodzi o czytniki, to uważam, że zastępują one właśnie te aspekty, których nie da się zdigitalizować — kształt, masę, generalne podobieństwo w odczuciu podczas trzymania w dłoni, przenośność. To jest właśnie zaletą czytników — dlatego właśnie ich zawartość, czyli treść dzieł, może (a nawet powinna) nie mieć zbytnich formalnych ograniczeń i być w 100% poprawna — co nas sprowadza do tego, że publikacje takie raczej ciężko jest przygotowywać automatycznie na masową skalę. Czytniki sprawdzają się nieźle w przypadku publikacji nowych, składanych od początku cyfrowo — i to jest właściwie ich przeznaczenie. Jeżeli chcemy mieć możliwość wygodnego korzystania z dzieł zdigitalizowanych — muszą one spełniać dokładnie te same kryteria, co dzieła składane cyfrowo. Kosztuje to znacznie więcej — w wielu wypadkach się nie opłaca, ale w niektórych tak. Dlatego podejrzewam, że znane nam ze standardowego przemysłu wydawniczego tworzenie nowych edycji wydanych wcześniej dzieł nie zniknie — po prostu produkowane dzieła zmienią tylko formę, a biblioteki faktycznie staną się wydawcami treści.
PS: Nie wiem dlaczego silnik strony ukrywa Justyno Twoje odpowiedzi na komentarze zanim strona kończy się ładować.