Saturday, January 19, 2013

Rubare questo Ebook

La Bibbia di hippie "ruba questo libro" è stato un manifesto anti-capitalismo, ampiamente ricordato a causa del suo titolo creativa e aggressivo plus il messaggio subvertive.


Libri cartacei come quell ' non erano facili da rubare, perché le guardie in librerie e lo sforzo costoso di ridigitare, mastering, stampa, rilegatura e distribuzione. Nell'era digitale è possibile ottenere un ebook, crack o OCR se protetto e copia-incolla si.


Il principale cliente per rubare ebook strumenti sono webmaster, in particolare quelli con un interesse per la ricerca decente engine ranking. Per compiacere i motori di ricerca e acquisire profonda l'indicizzazione, alta rilevanza e top ranking, un sacco di contenuti pertinenti dovrà essere scritto (o copiato).


Quando ero in scienza c'era una frase "pubblica o perire", che ha espresso più o meno lo stesso. Quantità anziché la qualità. Credo che la maggior parte di noi vorrebbe avere tempo per scrivere articoli brevi e succosi invece di Mumbo-Jumbo Goog-friendly.


Macchina-scrittura è un'attività relativamente nuova. E non sto parlando di semplice copia-incolla, ma una più sofisticata razza testo-generazione di software specializzato. Alcuni programmi semplice prendono un certo numero di parole e mescolano appena, come Ktumbler. Gli altri possono generare random frasi inglese-come, come il "Web Economy Bullshit Generator", o ragionevole buon frasi inglesi migliaia, come generatore di frasi in Synonymizer.


Ma le frasi non sono un sostituto per il testo più lungo, e molti webmaster pigri o avidi sono tentati di copia-incolla dal web, che è più facile e più veloce di pensiero. A molto criticato il marchio del sito web ranking sistemi, Cloaking, copia di grandi quantità di rilevanti, ben allineato testo dal web e mostra agli Spider dei motori di ricerca. In questo modo, fanno finta di avere contenuti di più e meglio di qualsiasi altro sito. E il migliore di esso, quando il visitatore è un essere umano, nascondere la refurtiva e mostrare alcune parole innocenti. Cloaking si riferisce a quell'abilità, e si è raggiunto da IP detection e confronto con i dati noti spider.


Infine, gli strumenti synonymizing e miscelazione di testo modificare i testi originali irriconoscibile. Come chirurgia facciale dopo aver commesso un reato.


Tuttavia, temo che ci sia un piccolo problema copyright... Il problema è che nessuno sa esattamente quali sono i limiti per la chirurgia di testo automatizzato.


Per synonymize o altrimenti mascherare una fonte testo è moralmente sbagliato, la maggior parte di noi sarebbe d'accordo. Ma ha limiti. Se dico "Il mio regno per un equino", o "dopo di me, la grande pioggia", o "Let's ci essere illuminazione", si capisce che non può essere forbiden sinonimi. Ci sono anche molte situazioni in cui legislazione iperprotettiva blocca la creatività e l'innovazione.


Sono tentato di emulare Abbie Hoffman e discutere la moralità del diritto d'autore e l'intera questione della proprietà intellettuale. Tuttavia, quelli sono acque profonde.


Il mio punto è che non non c'è nessun parametro stabilito per definire plagio nei testi. Cosa succede se sostituire "2" per "due" e Goog per Google, come fare per evitare di essere notato da loro? E Yah per Yahoo, da non dimenticare il pioniere?. O se cambio solo una parola in una frase? Cosa succede se mescolo solo le frasi di un testo? GOOG sarà probabilmente ancora considerare che la densità di parola chiave è corretta per la classifica top, meno una correzione per tenere conto il fatto che l'inizio di un file è più importante che alla fine.


Molti servizi di rilevamento di plagio possono confrontare ogni testo presentato con una grande biblioteca (per lo più, il WWW) e decidere se c'è sufficiente somiglianza con una certa fonte. Di solito non rivelare il loro algoritmo, ma assicuro "comprende la tecnologia proprietaria" e "rileva la firma digitale degli autori". Un leader in questo campo dice "Copyscape cerca pagine contenenti porzioni consistenti di testo identico". Nessuno sa come che si traduce in numeri.


Goog e altri motori di ricerca sono contro "duplicato contenuto", ma essi non si definisce.


La disponibilità di «strumenti de-authoring testo» rende la questione della proprietà intellettuale molto sfocata a qualsiasi avvocato disposto a valutare l'esistenza di un reato. E come effetto collaterale, il testo modificato non sarà rilevato dagli strumenti anti-plagio, che ricerca principalmente per coincidenze testo esatto.


Ho iniziato a esaminare alcuni siti di rilevamento di plagio, e ho notato che quelli meglio richiedono una sorta di una tassa. Naturalmente, non è facile confrontare una tesina studente con l'intera biblioteca del Congresso e l'intero Web, più vecchi archivi Web di Wayback Machine. Altri come furetto sono gratuiti e consentono di confrontare il vostro file con un altro, ma è necessario fornire entrambi i file.


Così, senza nascondere la mia condizione di SEO stampista, dichiaro la necessità di un algoritmo pubblica che stabilirà se un testo è il derivato di un-etico o immorale o illegale di una fonte web. È necessario per inchiodare il plagio o aiuto scrittori e webmaster per definire i limiti per i dispositivi nei pressi di plagio e nei pressi di plagio.

No comments:

Post a Comment