La ricerca Google consiste in una serie di siti web localizzati. Il più grande di questi, il sito google.com, è il sito web più visitato al mondo. Alcune delle sue caratteristiche includono un link di definizione per la maggior parte delle ricerche, tra cui le parole del dizionario, il numero di risultati ottenuti nella ricerca, link ad altre ricerche (ad esempio, per le parole che Google ritiene essere scritte in modo errato, fornisce un link ai risultati della ricerca utilizzando l'ortografia proposta), e molti altri ancora.
Sintassi di ricerca
Il motore di ricerca di Google normalmente accetta le query come un semplice testo, e scompone il testo dell'utente in una sequenza di termini di ricerca, che di solito sono parole che devono essere presenti nei risultati, ma si possono anche utilizzare operatori booleani, come: virgolette (") per una frase, un prefisso come "+", "-" per i termini qualificati, o uno dei diversi operatori avanzati, come "sito:". Le pagine web di "Google Search Basics" descrivono ciascuna di queste ulteriori domande e opzioni (vedi sotto: Opzioni di ricerca).
Il modulo web di ricerca avanzata di Google offre diversi campi aggiuntivi che possono essere utilizzati per qualificare le ricerche in base a tali criteri come data di primo recupero. Tutte le ricerche avanzate si trasformano in ricerche regolari, di solito con termini qualificati aggiuntivi.
Espansione della query
Google applica l'espansione della query alla query di ricerca inviata, trasformandola nella query che verrà effettivamente utilizzata per recuperare i risultati. Come per il page ranking, i dettagli esatti dell'algoritmo utilizzato da Google sono volutamente oscuri, ma certamente le seguenti trasformazioni sono tra quelle che si verificano:
- Termine riordino: nel recupero delle informazioni è una tecnica standard per ridurre il lavoro necessario per il recupero dei risultati. Questa trasformazione è invisibile per l'utente, poiché l'ordinamento dei risultati utilizza l'ordine di interrogazione originale per determinare la rilevanza.
- Lo stemming serve ad aumentare la qualità della ricerca mantenendo piccole varianti sintattiche dei termini di ricerca.
- C'è una possibilità limitata di correggere eventuali errori di ortografia nelle interrogazioni.
"Mi sento fortunato"
La homepage di Google include un pulsante con l'etichetta "Mi sento fortunato". Quando un utente clicca sul pulsante l'utente verrà portato direttamente al primo risultato della ricerca, bypassando la pagina dei risultati del motore di ricerca. Il pensiero è che se un utente si "sente fortunato", il motore di ricerca restituirà la corrispondenza perfetta la prima volta senza dover sfogliare i risultati della ricerca. Secondo uno studio di Tom Chavez di "Rapt", questa funzione costa a Google 110 milioni di dollari all'anno, dato che l'1% di tutte le ricerche utilizza questa funzione e bypassa tutta la pubblicità.
Il 30 ottobre 2009, per alcuni utenti, il pulsante "Mi sento fortunato" è stato rimosso dalla pagina principale di Google, insieme al normale pulsante di ricerca. Entrambi i pulsanti sono stati sostituiti con un campo che recita: "Questo spazio è stato lasciato intenzionalmente vuoto". Questo testo si è sbiadito quando il mouse è stato spostato sulla pagina, e la normale funzionalità di ricerca si ottiene compilando il campo di ricerca con i termini desiderati e premendo invio. Un portavoce di Google spiega: "Questo è solo un test, e un modo per noi di valutare se i nostri utenti apprezzeranno un'interfaccia di ricerca ancora più semplice". Le homepage personalizzate di Google hanno mantenuto entrambi i pulsanti e le loro normali funzioni.
Il 21 maggio 2010, il trentesimo anniversario di Pac-Man, il pulsante "Mi sento fortunato" è stato sostituito da un pulsante con la scritta "Inserisci la moneta". Dopo aver premuto il pulsante, l'utente iniziava un gioco a tema Google di Pac-Man nella zona dove normalmente si trova il logo di Google. Premendo il pulsante una seconda volta, l'utente avrebbe iniziato una versione per due giocatori dello stesso gioco che include Ms. Pacman per il giocatore 2. Questa versione è accessibile all'indirizzo http://www.google.com/pacman come link permanente alla pagina.
Ricchi frammenti
Il 12 maggio 2009, Google ha annunciato che avrebbe analizzato i microformati hCard, hReview e hProduct e li avrebbe utilizzati per popolare le pagine dei risultati della ricerca con quelli che hanno chiamato "Rich Snippets".
Caratteristiche speciali
Oltre alla funzione principale del motore di ricerca per la ricerca di testo, Google Search ha più di 22 "funzioni speciali" (attivabili inserendo una qualsiasi delle decine di parole chiave) durante la ricerca:
- tempo - Le condizioni meteo, la temperatura, il vento, l'umidità e le previsioni, per molte città, possono essere visualizzate digitando "meteo" insieme a una città per le città più grandi o città e stato, codice postale degli Stati Uniti, o città e paese per le città più piccole (come: meteo Lawrence, Kansas; meteo Parigi; meteo Brema, Germania).
- Quotazioni azionarie - I dati di mercato di una specifica società o fondo possono essere visualizzati, digitando il simbolo del ticker (o includere "stock"), come ad esempio: CSCO; MSFT; azioni IBM; azioni F (liste Ford Motor Co. ); o AIVSX (fondo). I risultati mostrano i cambiamenti tra un giorno e l'altro, o il grafico a 5 anni, ecc. Questo non funziona per i nomi delle azioni che sono lunghi una lettera, come Citigroup (C) o Macy's (M) (Ford è un'eccezione), o sono parole comuni, come Diamond Offshore (DO) o Majesco (COOL).
- tempo - L'ora attuale in molte città (in tutto il mondo), può essere visualizzata digitando "tempo" e il nome della città (come: ora Cairo; ora Pratt, KS).
- Punteggi sportivi - I punteggi e gli orari, per le squadre sportive, possono essere visualizzati digitando il nome della squadra o del campionato nella casella di ricerca.
- conversione di unità di misura - Le misure possono essere convertite, inserendo ogni frase, ad esempio: 10,5 cm in pollici; o 90 km in miglia
- conversione di valuta - È possibile selezionare un convertitore di denaro o di valuta, digitando i nomi o i codici di valuta (elencati dalla norma ISO 4217): 6789 Euro in USD; 150 GBP in USD; 5000 Yen in USD; 5000 Yuan in lire (il dollaro USA può essere USD o "US$" o "$", mentre il canadese è CAD, ecc.)
- calcolatrice - I risultati del calcolo possono essere determinati, come calcolati dal vivo, inserendo una formula in numeri o parole, ad esempio: 6*77 +pi +pi +sqrt(e^3)/888 più 0,45. All'utente viene data la possibilità di cercare la formula, dopo il calcolo. La calcolatrice utilizza anche le funzioni di conversione di unità di misura e di valuta per consentire il calcolo delle unità di misura. Ad esempio, "(3 EUR/litro) / (40 miglia/gallone) in USD / miglio" calcola il costo in dollari per miglio per un'auto da 40 mpg con gas che costa 3 euro al litro. Il caret "^" alza un numero ad una potenza esponenziale, e le percentuali sono consentite ("40% di 300").
- Intervalli numerici - Un insieme di numeri può essere abbinato utilizzando un doppio punto tra i numeri dell'intervallo (70..73 o 90..100) per abbinare qualsiasi numero positivo nell'intervallo, compreso. I numeri negativi sono trattati come se si utilizzasse il trattino di esclusione per non far corrispondere il numero.
- ricerca nel dizionario - Si può trovare una definizione per una parola o una frase, inserendo "definire" seguito da un punto e virgola e la parola o le parole da cercare (come, ad esempio, "definire:filosofia")
- mappe - Alcune mappe correlate possono essere visualizzate, digitando il nome o il CAP degli Stati Uniti di una località e la parola "mappa" (ad esempio: mappa di New York; mappa del Kansas; o mappa di Parigi).
- movie showtimes - Le recensioni o gli orari dei film possono essere elencati per tutti i film in programmazione nelle vicinanze, digitando "film" o il nome di qualsiasi film corrente nella casella di ricerca. Se una località specifica è stata salvata in una ricerca precedente, il risultato della ricerca in alto mostrerà gli orari di proiezione per le sale cinematografiche vicine per quel film. Questi elenchi, tuttavia, a volte sono completamente errati e non c'è modo di chiedere a Google di correggerli; ad esempio, il 25 luglio, per il Teatro El Capitan, google showtimes elenca Up, ma secondo il sito web di El Capitan, l'unico film che viene proiettato quel giorno è G-Force. []
- dati pubblici - Le tendenze per la popolazione (o i tassi di disoccupazione) possono essere trovate per gli stati e le contee degli Stati Uniti, digitando "popolazione" o "tasso di disoccupazione" seguito dal nome di uno stato o di una contea.
- immobili e abitazioni - Gli annunci di case in una determinata zona possono essere visualizzati, utilizzando le parole chiave "abitazione", "casa" o "immobile" seguite dal nome di una città o dal codice postale americano.
- dati di viaggio/aeroporti - Lo stato del volo per i voli in arrivo o in partenza dagli Stati Uniti può essere visualizzato, digitando il nome della compagnia aerea e il numero del volo nella casella di ricerca (ad esempio: American airlines 18). È possibile visualizzare anche i ritardi in un determinato aeroporto (digitando il nome della città o il codice dell'aeroporto di tre lettere più la parola "aeroporto").
- Tracciamento dei pacchetti - La posta in pacchi può essere tracciata digitando il numero di tracking di un pacchetto Royal Mail, UPS, Fedex o USPS direttamente nella casella di ricerca. I risultati includeranno collegamenti rapidi per tracciare lo stato di ogni spedizione.
- numeri di brevetto - i brevetti statunitensi possono essere ricercati inserendo la parola "brevetto" seguita dal numero di brevetto nella casella di ricerca (ad esempio: Brevetto 5123123).
- Prefisso telefonico - La posizione geografica (per qualsiasi prefisso telefonico statunitense) può essere visualizzata digitando un prefisso a 3 cifre (ad esempio: 650).
- ricerca dei sinonimi - Una ricerca può corrispondere a parole simili a quelle specificate, ponendo il segno tilde (~) immediatamente davanti a un termine di ricerca, come ad esempio: ~cibo veloce.
- Ricerca del governo degli Stati Uniti - La ricerca di siti web del governo degli Stati Uniti può essere effettuata dalla pagina web: www.google.com/unclesam.
Opzioni di ricerca
Le pagine web gestite dal Google Help Center hanno un testo che descrive più di 15 diverse opzioni di ricerca. Gli operatori di Google:
- OR - Cerca uno dei due, come "prezzo alto O basso" cerca "prezzo" con "alto" o "basso".
- "-" - Cerca escludendo una parola, come ad esempio "melo -albero" cerca dove la parola "albero" non è usata.
- "+" - Forzare l'inclusione di una parola, come "Nome +di +del +gioco" per richiedere che le parole "di" & "il" appaiano su una pagina corrispondente.
- "*" - Operatore jolly per abbinare qualsiasi parola tra altre parole specifiche.
Alcune delle opzioni di interrogazione sono le seguenti:
- definire: - Il prefisso della query "definire:" fornirà una definizione delle parole elencate dopo di esso.
- azioni: - Dopo "azioni:" i termini della query vengono trattati come simboli di ricerca per la ricerca.
- sito: - Limitare i risultati a quei siti web nel dominio dato, come, ad esempio, sito:www.acmeacme.com. L'opzione "site:com" cercherà tutti gli URL dei domini denominati con ".com". (nessuno spazio dopo "sito:").
- allintitle: - Vengono cercati solo i titoli delle pagine (non il testo rimanente su ogni pagina web).
- intitle: - Il prefisso per la ricerca nel titolo di una pagina web, come "intitle:google search" elencherà le pagine con la parola "google" nel titolo, e la parola "search" ovunque (nessuno spazio dopo "intitle:").
- allinurl: - Vengono ricercate solo le righe dell'indirizzo URL della pagina (non il testo all'interno di ogni pagina web).
- inurl: - Prefisso per ogni parola che si trova nell'URL; altre parole corrispondono ovunque, come "inurl:acme search" corrisponde a "acme" in un URL, ma corrisponde a "search" ovunque (nessuno spazio dopo "inurl:").
Le opzioni di visualizzazione della pagina (o i tipi di interrogazione) sono:
- cache: - Evidenzia le parole di ricerca all'interno del documento in cache, come "cache:www.google.com xxx" mostra il contenuto in cache con la parola "xxx" evidenziata.
- collegamento: - Il prefisso "link:" elenca le pagine web che hanno link alla pagina web specificata, come "link:www.google.com" elenca le pagine web che collegano alla homepage di Google.
- correlate: - Il prefisso "related:" elencherà le pagine web che sono "simili" a una pagina web specificata.
- info: - Il prefisso "info:" mostrerà alcune informazioni di sfondo su una determinata pagina web, come, ad esempio, info:www.google.com. In genere, l'info è il primo testo (160 byte, circa 23 parole) contenuto nella pagina, visualizzato nello stile di una voce dei risultati (per la sola 1 pagina come corrispondente alla ricerca).
- filetype: - i risultati mostreranno solo i file del tipo desiderato (ex filetype:pdf restituirà i file pdf)
Si noti che Google cerca la codifica HTML all'interno di una pagina web, non l'aspetto dello schermo: le parole visualizzate su uno schermo potrebbero non essere elencate nello stesso ordine nella codifica HTML.
Messaggi di errore
Alcune ricerche daranno un errore 403 Forbidden con il testo
"Ci dispiace...
... ma la vostra richiesta è simile alle richieste automatizzate di un virus informatico o di un'applicazione spyware. Per proteggere i nostri utenti, non possiamo elaborare la vostra richiesta in questo momento.
Ripristineremo il vostro accesso il più rapidamente possibile, quindi riprovate presto. Nel frattempo, se sospettate che il vostro computer o la vostra rete siano stati infettati, potreste voler eseguire un antivirus o uno spyware remover per assicurarvi che i vostri sistemi siano privi di virus e altri software spuri.
Ci scusiamo per l'inconveniente e speriamo di rivedervi da tutto il team di Google".
a volte seguito da un prompt CAPTCHA.
Lo schermo è stato segnalato per la prima volta nel 2005, ed è stata una risposta all'uso massiccio di Google da parte delle società di ottimizzazione dei motori di ricerca per controllare i ranghi dei siti che stavano ottimizzando. Il messaggio è scatenato da un elevato volume di richieste da un singolo indirizzo IP. A quanto pare Google utilizza il cookie di Google come parte della sua determinazione di rifiutare il servizio.
Nel giugno 2009, dopo la morte della superstar del pop Michael Jackson, questo messaggio è apparso a molti utenti di internet che cercavano su Google notizie relative al cantante, ed è stato assunto da Google come un attacco DDoS, anche se molte richieste sono state presentate da cercatori legittimi.
Gennaio 2009 bug malware
Google segnala i risultati della ricerca con il messaggio "Questo sito può danneggiare il vostro computer" se il sito è noto per l'installazione di software dannoso in background o comunque di nascosto. Google fa questo per proteggere gli utenti dalla visita di siti che potrebbero danneggiare il loro computer. Il 31 gennaio 2009, per circa 40 minuti, tutti i risultati della ricerca sono stati erroneamente classificati come malware e quindi non potevano essere cliccati; è stato invece visualizzato un messaggio di avvertimento e l'utente ha dovuto inserire manualmente l'URL richiesto. Il bug è stato causato da un errore umano. L'URL di "/" (che si estende a tutti gli URL) è stato erroneamente aggiunto al file dei modelli di malware.
Scarabocchio per Google
In alcune occasioni, il logo sulla pagina web di Google cambierà in una versione speciale, nota come "Google Doodle". Cliccando sul Doodle si accede a una serie di risultati di ricerca di Google sull'argomento. Il primo è stato un riferimento al BurningMan Festival del 1998, mentre altri sono stati prodotti per i compleanni di personaggi illustri come Albert Einstein, eventi storici come il cinquantesimo anniversario del blocco Lego e festeggiamenti come San Valentino.
Google Caffeina
Nell'agosto 2009, Google ha annunciato il lancio di una nuova architettura di ricerca, il cui nome in codice è "Caffeina". La nuova architettura è stata progettata per restituire più velocemente i risultati e per gestire meglio le informazioni rapidamente aggiornate provenienti da servizi come Facebook e Twitter. Gli sviluppatori di Google hanno notato che la maggior parte degli utenti avrebbe notato pochi cambiamenti immediati, ma hanno invitato gli sviluppatori a testare la nuova ricerca nella sua sandbox. Le differenze rilevate per il loro impatto sull'ottimizzazione dei motori di ricerca comprendono una maggiore ponderazione delle parole chiave e l'importanza dell'età del dominio. La mossa è stata interpretata in alcuni ambienti come una risposta al recente rilascio da parte di Microsoft di una versione aggiornata del proprio servizio di ricerca, ribattezzata Bing. Google ha annunciato il completamento di Caffeine l'8 giugno 2010, dichiarando risultati più freschi del 50% grazie al continuo aggiornamento del suo indice. Con Caffeine, Google ha spostato il suo sistema di indicizzazione back-end da MapReduce a BigTable, la piattaforma di database distribuito dell'azienda. Caffeine si basa anche su Colossus, o GFS2, una revisione del file system distribuito GFS.
Ricerca criptata
Nel maggio 2010 Google ha lanciato la ricerca web criptata SSL. La ricerca criptata è accessibile all'indirizzo: https://encrypted.google.com
Ricerca istantanea
Google Instant, un miglioramento che visualizza i risultati suggeriti mentre i tipi di utente, è stato introdotto negli Stati Uniti a partire dall'8 settembre 2010. Una preoccupazione è che le persone potrebbero selezionare uno dei risultati suggeriti invece di completare la loro richiesta, e che una tale pratica potrebbe causare distorsioni verso aziende familiari o altri termini di ricerca. I termini di ricerca pornografici o comunque offensivi sono esclusi dai risultati suggeriti. La funzione istantanea appare solo sul sito base di Google e non sulle pagine specializzate di iGoogle. Google si aspetta che Google Instant faccia risparmiare agli utenti dai 2 ai 5 secondi in ogni ricerca, che secondo loro saranno complessivamente 11 milioni di secondi all'ora. Gli esperti di marketing dei motori di ricerca hanno ipotizzato che Google Instant avrebbe un grande impatto sulla ricerca locale e a pagamento.
In concomitanza con il lancio di Google Instant, Google ha disabilitato la possibilità per gli utenti di scegliere di vedere più di 10 risultati di ricerca per pagina. La ricerca istantanea può essere disattivata tramite il menu "preferenze" di Google, ma i suggerimenti di ricerca in stile autocompletamento non possono più essere disattivati. Un rappresentante di Google ha dichiarato: "È in linea con la nostra visione di un'esperienza di ricerca unificata di Google rendere le funzioni popolari e utili parte dell'esperienza predefinita, piuttosto che mantenere diverse versioni di Google. Poiché la qualità dell'Autocompletamento è migliorata, abbiamo ritenuto opportuno che fosse sempre attiva per tutti i nostri utenti".