Pytanie Konwertuj pliki .odt .doc .ods do plików .txt


Chcę przekonwertować wszystkie .odt .doc. .xls .pdf do plików .txt Chcę przekonwertować te pliki do plików tekstowych za pomocą skryptu powłoki lub skryptu perl


13
2017-10-14 03:53


pochodzenie




Odpowiedzi:


Jest program do plików odt i alikes:

odt2txt - dostępne w repozytoriach.


20
2018-04-29 10:24



Jest to dość lekki program i działa całkiem nieźle. Dzięki! - tuxdna


$ unoconv --format=txt document1.odt

Powinny wytwarzać document1.txt.


10
2017-07-20 19:45





OpenOffice ma wbudowany konwerter dokumentów, który obsługuje kilka formatów - spójrz na unoconv: http://dag.wieers.com/home-made/unoconv/

Biorąc to pod uwagę, miałem pewne problemy z uzyskaniem tego do pracy w przeszłości. Jeśli masz problemy, spójrz na podobne programy dla AbiWorda (innego edytora tekstu z otwartym kodem źródłowym).


2
2017-10-14 04:10





W przypadku dokumentów tekstowych możesz spróbować antiword, przynajmniej na Linuksie. Jest to narzędzie wiersza poleceń, które pobiera dokument tekstowy jako argument i wypisuje tekst z tego dokumentu (najlepiej jak to możliwe) do standardowego wyjścia. Może możesz również podać plik ouput. Nie pamiętam szczegółów, jak to działa. Nie używałem go od jakiegoś czasu. Nie jestem pewien, czy potrafi obsłużyć dokumenty OO.


1
2017-10-14 04:31





Z pewnością jest to możliwe, chociaż jest coś dziwnego i nieprzeniknionego w projekcie OO i jego dokumentacji, które utrudniają badania i podążanie za nimi. Jednak OO ma możliwość konwersji wszystkich tych typów, nie tylko tych oryginalnych OO, i może to zrobić za pomocą dwóch różnych form automatycznej kontroli.

Są to dwa podejścia ogólne.

  1. Możesz uruchomić OO i nakazać wykonanie makra wykonującego to zadanie dla danego pliku. Następnie wystarczy napisać makro i skrypt, aby zapętlić swoje pliki. Składnia jest czymś w rodzaju

    $ oowriter -headless nazwa pliku makro: //dir/Standard.Module1.sMySub

  2. Inną rzeczą, którą OO ma, jest sieciowe API. Opiera się to na czymś, co nazywa się UNO.

    $ oowriter -accept = accept-string

    Notifies  the  OpenOffice.org software that upon the creation of
    "UNO Acceptor Threads", a "UNO Accept String" will be used.
    

Będziesz potrzebował jakiejś biblioteki klienta. Sądzę, że mają jeden dla Pythona. Dzięki tej technologii program Python lub inny język skryptowy z biblioteką klienta OO może napędzać program i konwertować wszystkie pliki. Ponieważ OO czyta MSO, powinno być w stanie wykonać je wszystkie.


1
2017-10-14 04:18



cześć, nie mogłem cię złapać. Czy byłbyś bardziej konkretny? Proszę, pomóż mi, ponieważ muszę jak najszybciej przekonwertować pliki odt do plików txtx - Akhtar
OK, zaktualizowałem swoją odpowiedź, aby było jaśniejsze. Dodam jeszcze trochę rzeczy tutaj później, wróć za 6 lub 12 godzin ... - DigitalRoss


W przypadku formatów Microsoft zapoznaj się z Narzędzia wvWare.


0
2017-10-14 04:38





Otwórz plik .ods normalnie w libre office

Zaznacz tekst, który chcesz przekonwertować

Otwórz terminal

Uruchom vi

Naciśnij "i", aby uzyskać tryb wstawiania

Naciśnij ctrl-shift-v

Gotowe!

Potrzebujesz trochę formatowania?

Zapisz plik jako

Wyjdź z vi

Biegać:

$ cat | kolumna> nazwa pliku2

To działało w opensuse z KDE

Zastąp "kwrite" dla "vi", jeśli chcesz


0
2018-04-21 01:21