Hvordan lese en DOC-fil ved hjelp av PHP

PHP-programmerere søker ofte måter å utvide funksjonaliteten til dette språket utenfor komfortsonen. PHP brukes mest på Linux-operativsystemer, men besøkende på PHP-nettsteder jobber vanligvis med Windows- eller Macintosh-systemer. Et nettsted designet for å laste opp en Microsoft Word-fil fra disse brukerne kan trenge å trekke ut innholdet i denne filen og sende e-post eller behandle teksten ved hjelp av PHP-algoritmer. Men Microsoft Word-filer, som ender i DOC-utvidelsen, er ikke hjemmehørende i Linux eller PHP. Å bygge bro mellom disse to datamiljøene er mulig med litt forberedelse.

Trinn 1

Bekreft med vertsleverandøren at PHP-tilgang er tilgjengelig for nettstedet ditt. De fleste servere støtter PHP, men noen ganger krever denne tjenesten en kontooppgradering. Du kan ikke lese en DOC-fil ved hjelp av PHP uten tilgang til kompilatoren.

Steg 2

Last ned Antiword MS Word dokumentleserverktøy (se Referanser). Dette open source-programmet inneholder programmeringsmateriell som utvider PHP for DOC-konvertering.

Trinn 3

Pakk ut Antiword-arkivet for å trekke ut innholdet.

Trinn 4

Last opp hele Antiword-filbiblioteket til webserveren. Plasser filene i "bin" -katalogen til vertskontoen. Denne katalogen er et vanlig lager for verktøy og andre binære operasjoner som brukere av webservere ofte må utnytte.

Trinn 5

Ring Antiword-programmet i et hvilket som helst PHP-skript designet for å lese et DOC Microsoft Word-dokument. Kommandoen implementeres ved hjelp av en enkelt funksjon. Skriv inn "$ content = shell_exec ('/ usr / local / bin / antiword'. $ Filnavn);" hvor "$ filnavn" tilsvarer hele filnavnet til DOC-dokumentet. Innholdet i DOC-filen vil bli lest inn i variabelen "$ content". Disse variabelnavnene, som begynner med "$" -symbolet, kan tilpasses.

Behandle variabelen "$ content" som ønsket for å manipulere innholdet i DOC-filen. Når DOC er lest av PHP, er hele teksten i filen tilgjengelig for enhver form for videre aktivitet. Innholdet kan for eksempel e-postes eller lagres i en database.