| Agent
: Un browser, o qualsiasi altro tipo di applicazione che può
collegarsi ad un server web e cercare/visualizzarne i contenuti.
Ad esempio: Microsoft Internet Explorer, Netscape, e i robot dei
motori di ricerca
Algorithm : (algoritmo) Il modo in cui un motore di ricerca è
settato e programmato. Un algoritmo è ad esempio responsabile
del modo in cui un motore di ricerca classificherà e archivierà
un sito internet o una pagina web.
Automatic Update : (aggiornamento automatico) Quando lo spider
di un motore di ricerca torna su un sito ad intervalli periodici
per controllare ed indicizzare eventuali cambiamenti.
Boolean Search : (Ricerca Booleana) Una ricerca che permette
l'inclusione o l'esclusione di alcuni termini tramite gli
operatori AND (e), NOT (non) e OR (oppure).
Cloaking : Un metodo per presentare contenuti differenti a
seconda dell'agent che ne fa richiesta. Tecnica che di per sè
non sarebbe da considerare spam, visto che forme minori di
cloaking vengono messe in atto ad esempio per far visualizzare
versioni diverse dello stesso sito a seconda del browser
dell'utente, o della risoluzione del monitor. E' diventata col
tempo una tecnica utilizzata per presentare ai motori di ricerca
una versione ottimizzata di un sito che, quando visionato
dall'utente, appare completamente diverso. I motori di ricerca
hanno tolleranza zero con gli sviluppatori scoperti ad
utilizzare la tecnica del cloaking.
Clustering : (trad. Raggruppare) Presentare una sola pagina di
un sito all'interno dei risultati di ricerca. Questo fa sì che
le prime posizioni di una pagina di risultati non siano occupate
dalle pagine di un solo sito internet e i risultati siano quindi
più vari e utili per l'utente. Google effettua il clustering,
raggruppando non più di due pagine di un sito all'interno dei
risultati.
Crawler : (trad. 'che striscia, lentamente') Anche detto Spider.
Un crawler visita un sito e ne esamina le pagine.
Successivamente prende le pagine e le archivia in un database
che il motore di ricerca utilizzerà per le ricerche..
CSS: (acronimo si Cascading Style Sheet).
CSS validator
Doorway (page): (pagina di entrata) anche conosciuta come
Gateway page (pagina ponte). E' una singola pagina web
ottimizzata in maniera specifica per una parola chiave il cui
scopo è ottenere un'alta classificazione nelle pagine dei
risultati dei motori di ricerca e portare traffico al sito
principale.
Dynamic Content : (contenuto dinamico) Informazione reperibile
tramite una pagina web, che è contenuta in un archivio remoto. A
volte è possibile individuare immediatamente un contenuto
dinamico, ad esempio se l'url della pagina ha estensione .asp, .cfm,
.cgi o .shtml. Attualmente i motori di ricerca (anche Goolgle)
indicizzano le pagine dinamiche in maniera pressochè analoga
alle pagine statiche, con alcune limitazioni.
Font and Background Spoofs : (trad. inganno su carattere e
sfondo). Insieme di varie tecniche per porre testo invisibile
all'interno di una pagina per migliorare il posizionamento nei
motori di ricerca senza influire sull'estetica della pagina.
Principalmente queste tecniche sono basate sul settaggio del
colore del font e dello sfondo sullo stesso valore rgb. La
maggior parte dei motori di ricerca sono in grado di rilevare
queste tecniche.
Frames : Una tecnica per combinare diversi documenti Html
all'interno della stessa videata. Un sito internet basato su una
struttura a frame potrebbe avere problemi con i motori di
ricerca, e potrebbe non essere correttamente indicizzato, anche
se molto motori di ricerca ora supportano la tecnica dei frame.
FTP: File Transfer Protocol. Un protocollo specificatamente
utilizzato per lo scambio di documenti tra computer.
Gateway (page): guarda "Doorway page"
Googleplex: Così denominati sono gli uffici dello staff di
Google situati a Mountain View, in California (è un gioco sulla
parola 'googolplex')
Googlerank: (1) termine non ufficiale (Google non lo usa MAI)
usato da molte persone per descrivere la posizione dei loro siti
all'interno delle pagine dei risultati di ricerca
Googlerank: (2) uno stupendo sito internet, attivo dal giugno
2002, dedicato al posizionamento su Google, che offre guide,
strumenti, informazione e software appositi. www.googlerank.com
HTTP : HyperText Transfer Protocol - il principale protocollol
utilizzato per la comunicazione tra server e browsers.
Inbound Links : (link dall'esterno) Un collegamento ipertestuale
ad una pagina, proveniente da qualche altra parte. Gli Inbound
links sono esaminati al fine di valutare la popolarità dei link.
Indexing : (indicizzazione) Quando un motore di ricerca prende
alcune pagine dall'archivio creato dagli spider, e le piazza in
un ordine basato sui suoi algoritmi. Tutti i motori di ricerca
hanno diversi processi di indicizzazione, a causa dei diversi
algoritmi applicati.
IP delivery : tecnica per presentare contenuti differenti a
seconda dell'IP dell'utente (guarda anche: cloaking)
Javascript : Un semplice linguaggio di scripting usato per scopi
minori all'interno di pagine html. Gli script sono generalmente
interpretati direttamente dal browser.
Keyword Stuffing : La ripetizione e la ridondanza di determinate
parole chiave all'interno del testo, del codice, e dei tag
<meta> di una pagina web. Tale tecnica è considerata spam (e
pure un po' antipatica... N.d.A).
Mirror Domain: (trad. Dominio specchio) Esatta copia di un sito,
che si distingue da quest'ultimo per il diverso nome di dominio.
E' una tecnica di posizionamento -facilmente rilevabile da
Google, quindi sconsigliata- che sfrutta la rilevanza che viene
generalmente assegnata alla descrittività di un dominio (es:
www.scarpe-economiche-sportive.net). Il webmaster crea un sito,
e ai fini di spingere nei motori di ricerca i suoi contenuti, lo
duplica e pubblica i contenuti sotto un altro dominio, dal nome
'descrittivo'. Tale tecnica è considerata dai maggiori motri di
ricerca spam.
Outbound Link : (link verso l'esterno) Un collegamento
ipertestuale da una particolare pagine verso un'altra parte.
(esempio dal tuo sito ad un altro).
Page swapping : (scambio di pagina) una bizzarra quanto obsoleta
tecnica considerata spamming. E' l'atto di far indicizzare una
pagina ottimizzata e ottenere un buon ranking per essa. Sapendo
che la Google Dance accade una volta al mese (vedi aggiornamento
di Google), quando quelle pagine sono state indicizzate i
webmaster sostituisce quella pagina con un'altra. Quindi gli
utenti trovano quella pagina facendo ricerche, ma quando
cliccano sull'url si ritrovano in una pagina completamente
diversa da quella contenuta nella cache di Google. Quando la
Google Dance sta per iniziare nuovamente il webmaster mette
nuovamente online la vecchia pagina, per rimetterla al termine
dell'aggiornamento.
(nota): dal momento che l'aggiornamento dell'indice di Google
viene ora fatto in maniera continua, tale tecnica è diventata
obsoleta e rischiosa (e inutile).
Proximity Search : (ricerca per prossimità) Una ricerca in cui
l'utente specifica che le parole della sua query DEVONO essere
vicine tra loro --- Google supporta questa funzione, con la
sintassi "parola-chiave" (tra virgolette).
Recall : relativamente alla precisione, è la precentuale di
documenti compatibili con una ricerca che un motore di ricerca
riesce a trovare. Ad esempio, potrebbero esserci 100 documenti
compatibili con una ricerca; se il motore di ricerca ne trova
solo 80 significa che ha un recall dell'80%.
Robots : Software simili ai browser, che seguono i collegamenti
ipertestuali e accedono alle pagine web, ma non sono controllati
direttamente da un essere umano. Esempio più tipico sono gli
spiders dei motori di ricerca, e i programmi che cercano email
nei siti internet.
Sandbox (Google's): relativamente nuovo (e teorico) filtro che
sembra essere stato inserito nell'algoritmo di Google nel Marzo
del 2004. Questo filtro piazza i nuovi siti internet in una
sorta di quarantena. Dopo un certo periodo vengono inseriti
nell'archivio normale, insieme ai siti già esistenti e vengono
propriamente classificati (leggi Google Sandbox theory)
Search Query : (query, chiave di ricerca) Una stringa,
contenente una o più parole, che viene inviata dall'utente ad un
motore di ricerca.
Shadow Domain: (trad. Dominio Ombra) dominio internet registrato
allo scopo di sfruttare l'alta rilevanza che Google assegna al
testo incluso nei nomi di dominio. Lo shadow domain ha lo scopo
di ridirigere automaticamente il traffico dai motori di ricerca
-in particolare Google- versoun altro sito. Talvolta uno shadow
domain può essere l'esatta copia di un altro sito (vedi MIRROR
DOMAIN)
Spamming (Search Engines') : Qualsiasi azione posta in essere al
fine di falsare, danneggiare, modificare gli scopi primari di un
motore di ricerca (fornire risultati di qualità all'utente).
Questo include -ma non è limitato a- keyword stuffing, ip/agent
cloaking , testo nascosto, redirezioni ad un'altra pagina, Page
swapping ecc...
Spider: vedi "Crawler"
Stemming : La capacità di un motore di ricerca di includere lo "stem"
delle parole. Ad esempio lo stemming permette all'utente di
cercare la parola "swimming" e ottenere risultati anche per lo
stem "swim." La tecnologia Stemming è utilizzata, con alcune
limitazioni, anche da Google.
Stop Words : Congiunzioni, preposizioni e articoli che compaiono
sovente in frasi, ma che non incidono sul significato di una
ricerca. Vengono infatti ignorate da Google.fonte:http://www.gxware.org/ |