Tuesday, February 12, 2013

Analisi di frequenza della parola come mezzo per migliorare la qualità di scrittura

Nei vecchi tempi di Windows 1.0 torna nel 1980 c'era uno strumento chiamato frequenza di parola che è venuto con il pacchetto di distribuzione di MS Word. Come qualcuno che utilizza l'inglese come seconda lingua ho usato pesantemente, perché mi ha aiutato a migliorare il mio vocabolario e correggere errori ortografici oltre la capacità dell'ortografici disponibili.


Che componente aggiuntivo di MS Word creato un elenco di tutte le parole in un documento, ordinati per frequenza. Ha reso facile rilevare l'uso eccessivo o abuso di una certa parola o espressione. Le parole poco usate erano anche di aiuto, perché a volte ho scritto Thomson invece di Thompson, auto invece di carrello, o errori simili che il correttore ortografico non rilevare.


Analisi di frequenza utilizzabile anche come un mezzo per stabilire la "firma" di un certo autore, il livello culturale dello scrittore, il suo utilizzo di slang o di gergo tecnico e altre caratteristiche di scrittura. È possibile estrapolare il numero delle parole usate in un determinato testo al vocabolario totale di una persona. Analisi delle frequenze possono accusare alcuni scrittori per avere il vocabolario di un 10-year-old. O la ricchezza di parola di un cinese-nato 2 ° anno lo studente inglese.


Analisi della frequenza combinata con un dizionario sinonimo, come condizione in "synonymizer" attualmente disponibile software, può aiutare a scrittori per arricchire il suo lessico ed evitare l'abuso di certe espressioni.


È anche un mezzo per evitare di produrre testo identico per chi ne ha bisogno per rendere il testo diverso da una fonte. Ad esempio, un produttore di contenuti web che deve riempire molti simili ma non identiche pagine e gli studenti che vogliono evitare il rilevamento di plagio e accusa. Torto o a ragione.


Rilevamento di plagio si avvale anche di analisi delle frequenze, perché il confronto di un determinato testo con l'intero contenuto del Web è un compito importante, e il sistema di rilevamento non so dove cercare e dove cominciare. Così, analizzando la frequenza delle parole può dare qualche indizio sullo stile di scrittura e la paternità di un determinato testo, senza indicizzazione il tutto.


Ricerca motori uso parola frequenza per stabilire il soggetto delle pagine web. Hanno sviluppato complessa analisi linguistica al fine di classificare le pagine dal soggetto senza intervento umano. A sua volta, webmaster fanno lo stesso, per cercare di ingannare i motori di ricerca a assegnando rilevanza alta parola chiave per le pagine che creano. Per esempio, usando una parola con una frequenza di 3% dà una pertinenza buon testo su quella parola (o parola chiave, in un contesto di motore di ricerca). Una frequenza del 10% è ancora OK, ma è vicino "keyword stuffing", una tecnica usata dai webmaster che cercano di forzare i siti Web ai primi posti dei motori di ricerca. Keyword stuffing è penalizzato dai motori di ricerca e deve essere evitato da un uso intelligente dei sinonimi. Con il software synonymizer o buone abilità di scrittura.


In questo articolo, per esempio, ha le seguenti frequenze di parola:


parola: 9, frequenza: 7, usato: 6, non: 6, ricerca: 6, testo: 6, motori: 6, analisi: 5, può: 5, usare: 5....


Potrei modifica il testo dopo l'analisi, per evitare un uso intensivo della "parola" e "frequenza" per scopi linguistici. Tuttavia, è OK per scopi di Search Engine Optimization (tentativo di rendere questo articolo più trovabili da Google e Yahoo).


Ci sono eventuali gravi scrittori che ancora evitano l'uso di un computer via cavo? Probabilmente non molti possono evitare utilizzando il Web e i motori di ricerca per trovare la parola corretta, l'espressione più usata, per eseguire ortografia o grammatica verifica. Controllo utilizzo della parola in Google è più veloce e più efficiente rispetto all'utilizzo di un dizionario, in carta, disco o il Web. I motori di ricerca elencati ogni parola mai scritta, non solo le parole ben scritte come dizionari.


Essere pronti ad avere i vostri testi analizzati per la frequenza delle parole, livello educativo, plagio, tecnicità, utilizzo di gergo e altri parametri, oltre all'antica ortografia.


Secondo queste tendenze, l'ultima sfida per un candidato di lavoro sarebbe di scrivere un saggio con carta e penna. La maggior parte di noi non sono disposti a passare un test di questo tipo.


Mi aspetto di non vedere synonymized versioni di questo articolo...

No comments:

Post a Comment