Blog

Esperto

Web scraping e mappe in R

Salve a tutti, di recente mi sono trovato ad affrontare i due problemi che seguono:

  1. Scaricare dati da diverse pagine web(con indirizzi simili) nel più breve tempo possibile.
  2. Realizzare una mappa in R.

Ho deciso di condividere le mie soluzioni a questi problemi con chiunque ne possa avere bisogno.

Allego una specie di tutorial. I dati che utilizzo provengono dal sito www.acqueinbottiglia.fondazioneamga.org/

Questo sito raccoglie il nome di circa 500 acque in bottiglia prodotte in Italia e le relative etichette. Ad ogni aqua è dedicata una pagina specifica.

Il codice contenuto nel file allegato serve a scaricare i dati dal sito e a realizzare una mappa per localizzare la  regione di provenienza delle acque. Per quanto riguarda i dati necessari a disegnare i confini della mappa sono liberamente disoinibili e scaricabili dalla sezione cartografia del sito dell'Istat.

Il risultato che si ottiene è mostrato nell'immagine all'inizio del post.

tutorial.R

Buon lavoro a tutti!

Inviami un'e-mail quando le persone lasciano commenti –

Per aggiungere dei commenti, devi essere membro di StatisticaNing!

Join StatisticaNing

Commenti

  • Esperto

    Che rapidità! Vedo e provo un po' la nuova libreria mapIT e proseguiamo su github :)

  • Esperto

    Bene, grazie Nicola!

  • Esperto

    EDIT: Allora intanto inizio a fare qualcosa, poi lo metto su Github, così da lavorarci insieme.

  • Esperto

    Allora intanto inizio a fare qualcosa Github, così da lavorarci insieme.

  • Esperto

    Più che d'accordo... se necessario posso dare una mano anche io nel mio piccolo.

  • Esperto

    Nicola, hai tutto il mio appoggio! Per la verità ci avevo pensato, infatti in fase iniziale avevo già inziato a strutturare il package "mapIT", con region.map come unica funzione, pensando poi di aggiungerne altre in futuro. Se te ne vuoi occupare, puoi ristrutturare la funzione come più ti piace (nomi compresi) e se ti serve posso darti una mano.

  • Esperto

    Davide e Lorenzo: cosa ne pensate di creare un package a partire dalla funzione creata da Davide? Se siete d'accordo posso farlo io..

  • Esperto

    Grande Davide! Adesso basta avere due variabili e la mappa si fa praticamente da sola... di sicuro mi tornerà utile.

  • Esperto

    Lorenzo, a partire dal tuo utilissimo tutorial, ho creato una funzione R che ho chiamato region.map che consente in pochi passaggi di creare una mappa come quella proposta da te. Qui il codice sorgente:

    https://github.com/DavideMassidda/mapIT

    Bisogna scaricare il contenuto del repository (pulsante "Download ZIP" in basso a destra) e decompattare l'archivio. Per utilizzare la funzione, oltre allo script "region.map.R", bisgna anche caricare il dataset "regionsIT.rda" e accertarsi che la libreria ggplot2 sia installata.

    Per creare la mappa, si può seguire la documentazione descritta nel readme.

    Grazie per il tuo preziosissimo lavoro!

    DavideMassidda/mapIT
    Easy plot Italian maps with R and ggplot package. Contribute to DavideMassidda/mapIT development by creating an account on GitHub.
This reply was deleted.