
Jei jums reikia komandų eilutės įrankių, kurie ištraukia tekstą iš „Word“ failų, „Antiword“ (.doc failai) ir docx2txt (.docx) yra naudingos programos, kuriomis turėtumėte naudotis.
Šioje instrukcijoje apžvelgsime šias keturias programas ir kaip jas naudoti. Mes atliksime jų diegimą keliuose populiariausiuose Linux platinimuose, įskaitant Debian, Ubuntu, Fedora, OpenSUSE, CentOS ir Arch Linux. Mes taip pat padėsime įdiegti pagrindinius „Microsoft TrueType“ šriftus jūsų „Linux“ sistemoje.
„LibreOffice“ yra nemokamas, atviro kodo, aktyviai prižiūrimas ir dažnai atnaujinamas biuro našumo rinkinys, suderinamas su „Microsoft Office“ programomis, įskaitant „Microsoft Word“. „LibreOffice Writer“ dokumentus galite išsaugoti .doc arba .docx formatu, o po to atidarote „Microsoft Word“.

„LibreOffice“ diegimas
„LibreOffice“ galima įdiegti naudojant paketų tvarkyklę. Norėdami ją įdiegti, atidarykite terminalą ir naudokite šią operacinei sistemai tinkamą komandą:
Debian 8, Ubuntu 15
sudo apt-get update & & sudo apt-get install libreoffice
Fedora 23
sudo dnf update && sudo dnf įdiegti libreoffice
OpenSUSE 10
sudo zypper refresh && sudo zypper įdiegti libreoffice
CentOS 7
sudo yum update && sudo yum įdiegti „libreoffice“
Arch Linux 2016
sudo pacman -Jūsų šviežias
Įdiegus „LibreOffice“, jis turėtų būti rodomas GUI programos meniu. Taip pat galite paleisti jį iš terminalo su komanda:
libreoffice
AbiWord
„AbiWord“ yra dar vienas laisvas ir atviro kodo tekstų apdorojimo įrenginys. Ji turi švarią, paprasta sąsaja ir jau vystosi beveik dvidešimt metų. Kaip ir „LibreOffice“, ji gali atidaryti, redaguoti ir išsaugoti „Microsoft Word“ .doc ir .docx failus. Skirtingai nei „LibreOffice“, „Abiword“ nėra pilnas biuro paketas, todėl jis turi mažesnį pėdsaką ir sunaudoja mažiau sistemos išteklių.

„AbiWord“ diegimas
Debian 8, Ubuntu 15
sudo apt-get upgrade & & sudo apt-get install abiword
Fedora 23
sudo dnf update && sudo dnf įdiegti abiword
OpenSUSE 10
sudo zypper refresh && sudo zypper įdiegti abiword
CentOS 7
sudo yum update && sudo yum įdiegti abuword
Arch Linux 2016
pacmanas -Jei abiword
„Antiword“
„Antiword“ yra komandinės eilutės įrankis, kuris gali konvertuoti .doc failo turinį į paprastą tekstą.
Pastaba: „Antiword“ konvertuoja tik .doc failus. Jei norite konvertuoti .docx failą, žr. Docx2txt kitame skyriuje.
Naudojant „Antiword“
„ Antivirus“ su „.doc“ failo pavadinimu bus rodomas paprastas failo tekstas į standartinę išvestį.

„Antiword“ atlieka puikų darbą formuojant lenteles. Ji taip pat turi galimybių įtraukti vaizdus į „PostScript“ objektus ir išsiųsti į PDF.
Galite nukreipti išėjimą į tekstinį failą:
antiword file.doc> file.txt
arba, jei norite ją atidaryti tiesiogiai teksto redaktoriuje, galite perkelti tekstą į vim:
antiword file.doc | vim -
arba Pico:
antiword file.doc | pico -
Antivirusinės programos įdiegimas
Debian 8, Ubuntu 15
sudo apt-get update & & sudo apt-get install antiword
Fedora 23
sudo dnf update && sudo dnf įdiegti „antiword“
OpenSUSE 10
sudo zypper refresh && sudo zypper įdiegti „antiword“
CentOS 7
sudo yum update && sudo yum įdiegti „antiword“
„Docx2txt“
sudo pacman -Jei antimonas
Docx2txt yra komandinės eilutės įrankis, kuris .docx failus paverčia paprastu tekstu. (Jis nekonvertuoja .doc failų.)
Norėdami spausdinti .docx failo turinį į terminalo ekraną arba peradresuoti išvestį į failą, skambinkite docx2txt ir nurodykite brūkšnelį kaip išvesties failo pavadinimą. Šiame pavyzdyje pastebėkite brūkšnelį komandos pabaigoje:

Norėdami konvertuoti .docx failą ir išvestį į tekstinį failą, naudokite komandų formą:
docx2txt file.docx file.txt
arba:
docx2txt file.docx -> file.txt
Jei norite atidaryti .docx tekstą vim, naudokite komandų formą:
docx2txt file.docx - | vim -
Norėdami jį atidaryti nano:
docx2txt file.docx - | nano -
Jei norite įdiegti „doc2txt“, vadovaukitės toliau pateikiamos „Linux“ versijos instrukcijomis:
Debian 8
sudo apt-get update & & sudo apt-get install docx2txt
Ubuntu 15
sudo apt-get update & & sudo apt-get install docx2txt
Fedora 23
„Fedora“ saugyklos nepateikia „docx2txt“ paketo, tačiau galite jį įdiegti rankiniu būdu:
Atsisiųskite šaltinį iš SourceForge adresu //sourceforge.net/projects/docx2txt/. Ištraukite archyvą:
tar xzvf docx2txt-1.4.tgz
Turite įsitikinti, kad jūsų sistemoje yra įdiegti perl, unzip ir padaryti, todėl dabar įdiekite arba atnaujinkite šiuos paketus:
sudo dnf update && sudo dnf įdiegti perl unzip make
Tada paleiskite kaip „root“ naudotoją, kurį norite įdiegti:
sudo make
„Docx2txt“ dabar įdiegta kaip docx2txt.sh . Pavyzdžiui, norėdami konvertuoti failą word-document.docx į tekstinį failą, galite paleisti:
docx2txt.sh word-document.docx
Konvertuotas tekstinis failas bus automatiškai išsaugomas kaip word-document.txt .
OpenSUSE 10
„SUSE“ saugyklos nepateikia „docx2txt“ paketo, tačiau jį galite atsisiųsti iš SourceForge adresu //sourceforge.net/projects/docx2txt/. Ištraukite archyvą:
tar xzvf docx2txt-1.4.tgz
Turite įsitikinti, kad jūsų sistemoje yra įdiegti perl, unzip ir padaryti, todėl dabar įdiekite arba atnaujinkite šiuos paketus:
sudo zypper update & & sudo zypper įdiegti perl unzip make
Tada paleiskite „make as root“, kad įdiegtumėte:
sudo make
„Docx2txt“ dabar įdiegta kaip docx2txt.sh . Pavyzdžiui, norėdami konvertuoti failą word-document.docx į tekstinį failą, galite paleisti:
docx2txt.sh word-document.docx
Konvertuotas tekstinis failas bus automatiškai išsaugomas kaip word-document.txt .
CentOS 7
„CentOS“ saugyklose nėra „docx2txt“ paketo, tačiau jį galite atsisiųsti iš SourceForge adresu //sourceforge.net/projects/docx2txt/. Ištraukite archyvą:
tar xzvf docx2txt-1.4.tgz
Turite įsitikinti, kad jūsų sistemoje yra įdiegti perl, unzip ir padaryti, todėl dabar įdiekite arba atnaujinkite šiuos paketus:
sudo yum update & & sudo yum įdiegti perl unzip make
Tada paleiskite „make as root“, kad įdiegtumėte:
sudo make
„Docx2txt“ dabar įdiegta kaip docx2txt.sh . Pavyzdžiui, norėdami konvertuoti failą word-document.docx į tekstinį failą, galite paleisti:
docx2txt.sh word-document.docx
Konvertuotas tekstinis failas bus automatiškai išsaugomas kaip word-document.txt .
Arch Linux 2016
sudo pacman -Su docx2txt
„Microsoft“ suderinamų šriftų diegimas
Pagrindiniai „Microsoft“ šriftai yra prieinami „Linux“, o jūs turėtumėte juos įdiegti, jei ketinate dirbti su „Microsoft Word“ failais - ypač jei jie buvo sukurti „Windows“ sistemoje. Pagrindiniai šriftai yra:
- Andale Mono
- Arial
- Arial Black
- Calabri
- Cambria
- Komiksai
- Kurjeris
- Poveikis
- Laikai
- Trebuchet
- Verdana
- Webdings
Jei norite juos įdiegti, atlikite šiuos veiksmus:
Debian 8, Ubuntu 15
sudo apt-get update & & sudo apt-get install ttf-mscorefonts-installer
Fedora 23
Atsisiųskite „msttcore“ diegimo RPM paketą iš „SourceForge“.
Įdiegti paketus, reikalingus diegimui:
sudo dnf update && sudo dnf įdiegti curl cabextract xorg-x11-font-utils fontconfig
Tada įdiekite vietinį RPM paketą:
sudo dnf įdiegti msttcore-fonts-installer-2.6-1.noarch.rpm
OpenSUSE 10
Atsisiųskite „msttcore“ diegimo RPM paketą iš „SourceForge“.
Įdiegti paketus, reikalingus diegimui:
sudo zypper atnaujinti & & sudo zypper įdiegti curl cabextract xorg-x11-font-utils fontconfig
Tada įdiekite vietinį RPM paketą:
sudo zypper įdiegti msttcore-fonts-installer-2.6-1.noarch.rpm
CentOS 7
Atsisiųskite „msttcore“ diegimo RPM paketą iš „SourceForge“.
Įdiegti paketus, reikalingus diegimui:
sudo yum update & & sudo yum įdiegti garbanos kabextract xorg-x11-font-utils fontconfig
Tada įdiekite vietinį RPM paketą:
sudo yum įdiegti msttcore-fonts-installer-2.6-1.noarch.rpm
Arch Linux 2016
Atsisiųskite „msttcore“ diegimo RPM paketą iš „SourceForge“.
Įdiegti paketus, reikalingus diegimui:
pacman -Spy rpmextract x11-font-utils fontconfig
Ištraukite vietinio RPM paketo turinį:
rpmextract.sh msttcore-fonts-installer-2.6-1.noarch.rpm
Ši komanda išskleidžia neapdorotą RPM failo turinį ir sukuria du katalogus ir tt ir usr, kurie atitinka jūsų / etc ir / usr katalogus. Patys šriftų failai yra „ usr / share / fonts / msttcore“ .