Po zakupie Kindle (z opinią o nim na razie się wstrzymuję – muszę go trochę poużywać) postanowiłem wgrać na niego różne tłumaczenia Biblii. Ponieważ dostępność tłumaczeń Biblii w wersji dla Kindle jest “różna”, postanowiłem skorzystać z jakiegoś spójnego zbioru, który można przekonwertować. Najprostszy do obróbki wydał mi się format zapisu programu TheWord, gdzie każda linijka to kolejny wers Biblii.
Napisałem więc prosty skrypt w Ruby, który konwertuje pliki ont, ot, nt na pliki html, które później programem Calibre można w prosty sposób przekonwertować do formatu .mobi. Skrypt nie robi oczywiście z plików pełnowymiarowej wersji znanej z programu theWord, a raczej płaski plik zawierający jedynie sam tekst Biblii. Aktualny skrypt można pobrać przy pomocy tego linka. Pliki z tłumaczeniami Biblii można pobrać ze strony projektu theWord jeśli czegoś nie znajdziecie – zawsze można jeszcze pogooglać.
Aby uruchomić skrypt należy zainstalować interpreter języka ruby. (instalka dla Windows znajduje się tutaj). Skrypt uruchamiamy podając w linii poleceń ścieżkę do pliku, który ma zostać przekonwertowany:
ruby bibleConv.rb c:\plikzBiblia.ont
Dla użytkowników windowsa przekonwertowałem skrypt do programu .exe, żeby nie potrzeba było instalować ruby’ego. Plik do pobrania tutaj. Uruchamiamy go podobnie:
bibleConv.exe c:\plikzBiblia.ont
Skrypt tworzy plik o tej samej nazwie i rozszerzeniu .html w katalogu, w którym znajduje się plik .ont. Dla ułatwienia ścieżka do pliku wyświetlana jest również na konsoli. Następnie wystarczy dodać plik html do Calibre, przekonwertować do formatu .mobi, wysłać na kindle i czytać.
Skrypt może nie zadziałać zbyt dobrze dla biblii zawierających w pliku dużo nadmiarowych informacji (jak np. przypisy). W razie potrzeby proszę o sygnał – będę rozszerzał możliwości skryptu.



nietaki
20.09.2011 at 2:07
informacyjnie: jako, że chwilowo siedzę na windowsie i szukałem szybkiego rozwiązania – próbowałem skorzystać z wersji .exe i pełnej biblii gdańskiej z bazy The Word. Skończyło się to następująco: http://www.nopaste.pl/14t5
pozdrawiam
PeTe
20.09.2011 at 17:25
Możesz mi podać nazwę pliku z The Worda?