Gephi

Da EigenWiki.
Versione del 21 feb 2017 alle 20:07 di Rakk (discussione | contributi) (convenzioni salvataggi)
Vai alla navigazione Vai alla ricerca

Gephi è un programma Open source per visualizzare grafi, molto utile per l'analisi delle reti sociali.

Installazione

Puoi scaricare liberamente Gephi dal sito ufficiale, ma se usi Linux è estremamente più comodo installarlo dai repository. Su Debian, Ubuntu e distribuzioni derivate puoi farlo col comando sudo apt-get install gephi. Su ArchLinux devi abilitare l'AUR e lanciare yaourt -S gephi.

Gephi è quel genere di programma che ti fa apprezzare la massima "salva spesso".

Analisi sulla rete Twitter

 
Un grafo elaborato con Gephi può offrire all'analisi diverse informazioni sulle interazioni fra i nodi di una rete sociale.

La prima volta che lanci Gephi ti conviene installare diversi plugin che ti consentono di fare molte cose che il programma "così com'è" non permette: vai nel menu Strumenti → Plugin e scegli i plugin da installare. Ecco alcuni di quelli che usiamo di solito, sia direttamente in Gephi che attraverso Tuipi:

  • TwitterStreamingImporter
  • Graph Streaming
  • SemanticWebImport
  • EventGraphLayout
  • MultiGravity ForceAtlas 2
  • Map Of Countries
  • Graphviz Layout (in questo caso assicurati di aver installato il pacchetto graphviz sul tuo sistema)
  • Give Colors To Nodes
  • Give Colors To Edges

Il plugin TwitterStreamingImporter si connette a Twitter autenticandosi con le credenziali che gli fornisci cliccando sul bottone "Credentials".[1] Le credenziali consistono in quattro stringhe alfanumeriche che puoi generare seguendo questa guida: nel registrare una app per le analisi con Gephi ti conviene settare i permessi a sola lettura.

La finestra di TwitterStreamingImporter mostra due schede "Words to follow" e "Users to follow": nella prima inserisci gli hashtag da seguire (senza cancelletto, non importa minuscolo/maiuscolo) e nella seconda i profili da seguire (senza chiocciola, fa differenza minuscolo/maiuscolo). Gli hashtag sono quelli seguiti, mentre se inserisci dei profili verranno importati nel grafo solo i tweet che provengono da quei profili. Coi tasti "Load query file" e "Save query file" puoi salvare e caricare le tue query in un file .json, il che torna utile ad esempio quando vuoi seguire molti hashtags durante più sessioni senza doverli reinserire a mano ogni volta. Ci sono tre possibili strategie:

  • Full Twitter network : vengono importati nel grafo i tweet, gli hashtag, i media, i link e i profili che interagiscono.
  • Hashtag network : ?
  • User network : vengono importati nel grafo solo gli utenti che twittano, ritwittano, citano, rispondono o menzionano usando gli hashtag specificati.

Una volta preparata la lista di hashtag/profili da seguire clicca su "Connect" per collegarti[2].

Il plugin si connette alla pagina di ricerca di Twitter e inizia a popolare il grafo via via che che la ricerca produce nuovi risultati. In linea teorica, stai registrando quello che accade sulla rete Twitter nella finestra temporale che va da quando premi "Connect" a quando premi "Disconnect", e i nuovi risultati dovrebbero giungerti quasi in tempo reale (con un ritardo di pochi minuti al massimo).

Puoi fare questo lavoro di raccolta dati anche con un computer veramente scarso che non riesce a visualizzare un grafo con più di un migliaio di nodi senza ingolfarsi: basta chiudere la finestra "Graph" di Gephi.

Salvare e condividere i dati raccolti

Salvando il progetto otterrai un file con estensione .gephi, che pui riaprire in seguito per analizzare i dati registrati in quella determinata finestra temporale oppure condividere con altre persone per un progetto collettivo. Un progetto/grafo salvato con questa estensione conserva sia l'informazione dei singoli nodi e archi del grafo (il contenuto e la data dei tweet, gli ID e gli screen name degli utenti, i link, etc.), che le informazioni sulla visualizzazione del grafo stesso (il colore, la posizione, le dimensioni dei nodi, degli archi e delle etichette, etc.). SUGGERIMENTO: Un modo semplice per non fare confusione con i dati raccolti consiste nel nominare i file salvati con una numerazione progressiva, ad esempio 26N-corteo-1.gephi, 26N-corteo-2.gephi, 26N-corteo-3.gephi, ... Se si vuole anche salvare la lista degli hashtag tracciati, dalla finestra di TwitterStreamingImporter scegliere Save Query File. Adottare una convenzione del genere diventa praticamente necessario se si lavora in gruppo ad un progetto.

In certi casi può essere utile anche esportare i dati del grafo (trascurando a volte l'informazione sulla geometria) in altri formati, da elaborare magari con altri programmi. Ad esempio Tuipi possiede alcune strategie di analisi più furbe di quelle del plugin di Gephi, ma può comunque sfruttare i dati raccolti con Gephi per alimentare la sua base di conoscenza e le sue batterie: per esportare i dati nel formato utilizzabile da Tuipi vai sul menu File → Export → Graph file e poi dalle opzioni scegli "List".

Puoi anche esportare l'immagine del grafo in formato .png, .pdf oppure .svg; quest'ultimo ha il vantaggio di permettere la ricerca di testo all'interno dell'immagine, utile per localizzare un hashtag o un utente in una immagine di una rete twitter. Per esportare le immagini del grafo devi andare nello spazio di lavoro "Preview" di Gephi, settare le opzioni di output e infine cliccare su "Export".

Analisi di una rete sociale

Quando il plugin TwitterStreamingImporter è connesso, i dati provenienti da Twitter vanno a costituire il grafo attraverso due tipi di elementi:

  • nodi : sono gli "atomini" del grafo che rappresentano la natura del singolo dato. Un nodo può essere un tweet (detto anche stato), un profilo, un hashtag, una foto, un video, un link.
  • archi: ogni arco collega due nodi e rappresenta una relazione fra loro. Per esempio se il nodo A è il profilo di @beppe e B è il profilo di @anna, un arco del tipo A → B può rappresentare il fatto che @beppe segue @anna (è un suo follower). Nota che a differenza dell'ecosistema Facebook, dove le amicizie possono solo essere o reciproche o non sussistere, in questo caso gli archi hanno un verso[3].

Usando i tre grossi tasti in alto si può cambiare tra le tre modalità di lavoro principali di Gephi: Overview (per lavorare "graficamente" sui nodi, modificandone la disposizione, il colore etc.), Data laboratory per lavorare sui dati (indipendentemente da come sono rappresentati graficamente), e Preview (per raffinare le impostazioni estetiche ed esportare un'immagine).

  • Overview per lavorare graficamente sui nodi e gli archi del grafo:
    • filtraggio
    • metriche
    • community detection
    • layout & appearance
  • Data laboratory per lavorare sul grafo dal lato non grafico: quello dei dati. Ti mostra una doppia tabella con i nodi (Nodes) e gli archi (Edges) sulle righe: puoi modificarne gli attributi e i valori, e fare un sacco di altre cose ganze.
  • Preview per raffinare i dettagli grafici e renderizzare un'immagine; da qui puoi anche esportarla in vari formati.

Overview

 
Vista dello spazio di lavoro Overview di Gephi. Nella colonna sinistra sono mostrate (dall'alto in basso) la finestra Appearance per l'aspetto di nodi e archi e Layout per la loro disposizione. In basso lo strumento Timeline per vedere l'evoluzione del grafo nel tempo. Nella colonna destra (dall'alto in basso) la finestra Contesto conta i nodi e gli archi nel grafo e la percentuale di elementi mostrati rispetto al totale, quando sono attivi dei Filtri (in basso, sotto le Statistiche).

Qui si può dare sfogo alla propria fantasia e immaginazione manipolando e riorganizzando i dati raccolti tramite gli algoritmi e i filtri interni al programma, oppure manualmente con la tavolozza da lavoro a sinistra del grafico. In una prima fase conviene esplorare il grafo alla ricerca di dettagli significativi che poi si sceglie di evidenziare graficamente in un modo o in un altro.

Puoi cambiare i colori, le dimensioni e la disposizione di nodi e archi, sia manualmente che attraverso i layout automatici, che calcolano le posizioni dei nodi in base a criteri non sono sempre validi per ogni grafo che vuoi visualizzare: a volte un layout che è molto informativo in certi contesti può risultare non informativo o addirittura sviante. Puoi anche calcolare diverse statistiche e invarianti topologici, e fare in modo che queste grandezze siano rappresentate graficamente nella dimensione o nel colore dei nodi, o nel peso degli archi. All'inizio i nodi e gli archi saranno raggruppati e accavallati, disposti casualmente in un quadrato; questo ovviamente non ci fornisce nessuna indicazione sui dati raccolti. Per capirci qualcosa possiamo cambiare la disposizione dei nodi (strumenti di Layout) e modificare le caratteristiche grafiche come forma, colore, dimensione di nodi, archi e loro etichette (strumenti Appearance).

Layout

OpenOrd, ForceAtlas2, ...

Appearance

da scrivere...

Data Laboratory

 
Una vista della tabella dei nodi (nodes) di una rete Twitter; dal pulsante in alto si può scegliere di visualizzare gli archi (edges).

Qui viene visualizzata una tabella che contiene tutte le informazioni dei nodi e gli archi che formano il tuo grafo.

  • Per quanto riguarda i nodi le colonne più significative sono:
    • Id : è la colonna identificativa del nodo
    • label: è l'etichetta del nodo
    • twitter type : indica la tipologia del nodo, ovvero se è un user, tweet, hashtag...
  • Per gli archi invece abbiamo:
    • source: che indica il nodo da dove l'arco parte
    • target: indica il nodo di arrivo dell'arco
    • type : se l'arco è diretto (ha un verso) oppure no
    • kind : ti dice che tipo di interazione c'è stato tra i due nodi (menzione, citazione, retweet...)
↑arco→ Tweet User Hashtag Link Media
Tweet il tweet contiene l'hashtag il tweet contiene il link il tweet contiene l'elemento multimediale
User l'utente ha twittato o ritwittato il tweet, oppure vi è menzionato l'utente di partenza ha ritwittato o menzionato l'utente di arrivo

Preview

da scruvere.

Note

  1. se Gephi non sta mostrando una finestra che t'interessa, aprila dal menu Finestra.
  2. se il bottone è disabilitato è perché non hai aperto un progetto di analisi in cui scaricare i dati; fallo dal menu File → New Project.
  3. Un grafo in cui gli archi sono orientati si dice diretto, altrimenti si dice non diretto; viva l'originalità.