Come leggere un file DOC usando PHP

I programmatori PHP sono spesso alla ricerca di modi per estendere le funzionalità di questo linguaggio al di fuori della sua zona di comfort. PHP è utilizzato principalmente su sistemi operativi Linux, ma i visitatori dei siti Web PHP di solito lavorano su sistemi Windows o Macintosh. Un sito Web progettato per caricare un file Microsoft Word da questi utenti potrebbe dover estrarre il contenuto di questo file e inviarlo tramite e-mail o elaborarne il testo utilizzando algoritmi PHP. Ma i file di Microsoft Word, che terminano con l'estensione DOC, non sono nativi di Linux o PHP. Con un po' di preparazione è possibile collegare questi due ambienti informatici.

Passo 1

Verifica con il tuo provider host che l'accesso PHP sia disponibile per il tuo sito web. La maggior parte dei server supporta PHP, ma a volte questo servizio richiede un aggiornamento dell'account. Non puoi leggere un file DOC usando PHP senza accedere al compilatore.

Passo 2

Scarica l'utilità di lettura dei documenti di Antiword MS Word (vedi Riferimenti). Questo programma open source contiene materiali di programmazione che estendono PHP per la conversione DOC.

Passaggio 3

Decomprimi l'archivio di Antiword per estrarne il contenuto.

Passaggio 4

Carica l'intera libreria di file Antiword sul server web. Posiziona i file nella directory "bin" dell'account host. Questa directory è un repository comune per utilità e altre operazioni binarie che gli utenti del server Web devono sfruttare frequentemente.

Passaggio 5

Chiama il programma Antiword in qualsiasi script PHP progettato per leggere un documento DOC Microsoft Word. Il comando viene implementato utilizzando una singola funzione. Digita "$content = shell_exec('/usr/local/bin/antiword '.$filename);" dove "$filename" è uguale al nome completo del file del documento DOC. Il contenuto del file DOC verrà letto nella variabile "$content". Questi nomi di variabili, che iniziano con il simbolo "$", sono personalizzabili.

Elaborare la variabile "$content" come desiderato per manipolare il contenuto del file DOC. Una volta letto il DOC da PHP, il testo completo del file è disponibile per qualsiasi forma di ulteriore attività. I contenuti possono essere inviati per e-mail o archiviati in un database, ad esempio.